Giter Club home page Giter Club logo

level2_dataannotation_cv-level2-cv-05's Introduction

데이터 제작 프로젝트

학습 데이터 추가 및 수정을 통한 이미지 속 글자 검출 성능 개선 대회

dataan


프로젝트 개요

  • 주제
    • OCR task는 글자 검출 (text detection), 글자 인식 (text recognition), 정렬기 (Serializer) 등의 모듈로 구성되지만, 본 대회에서는 '글자 검출' task 만을 해결
    • 본 대회는 데이터를 구성하고 활용하는 방법에 집중하는 것을 장려하는 취지에서, 제공되는 베이스 코드 중 모델(EAST)과 관련한 부분을 변경하는 것이 금지
  • 데이터
    • 제공된 학습 데이터: 1510장
    • 평가 데이터 : 크롤링된 이미지 300장

팀 구성

  • 김도윤, 김형석, 박근태, 양윤석, 정선규 (총 5인)

프로젝트 상세 내용

dataan

  • 데이터 셋 제작 → 학습 데이터의 양이 적었기에, ICDAR 17 5k, ICDAR19 5K 추가
  • Synthetic data set인 UnrealText로 pretrain 후, target data로 fine tuning
  • Multi-scale-crop training → 512~1024 사이로 random crop 후 512로 resize
  • 다양한 글씨체, 글씨 변형에 대한 robustness 부여 위해 Elastic transform 사용

모델 개요

  • Model : EAST
  • Optimizer : Adam
  • Scheduler : MultiStepLr
  • Pretrained on Unrealtext

결과

F1 score 순위
Public Leaderbord 0.6839 7/19
Private Leaderbord 0.6720 8/19

level2_dataannotation_cv-level2-cv-05's People

Contributors

sonkt98 avatar ssunq avatar justist7 avatar

Stargazers

 avatar  avatar  avatar flash_ult avatar  avatar

level2_dataannotation_cv-level2-cv-05's Issues

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.