OCR(Optical character recognition, 광학 문자 인식)은 이미지(사진) 속 글자 위치를 찾고 어떤 글자인지 자동으로 알아내는 기술로서 OCR 서비스는 네이버의 AI 기술을 활용하여 주요 비즈니스 활용에 최적화된 고성능 OCR 인식 모델을 적용하였습니다. 네이버 클라우드 플랫폼의 OCR서비스에 대해 좀 더 상세히 소개해드리도록 하겠습니다.
3. OCR
OCR(Optical Character Recognition)은 광학문자인식 기술
인쇄물 상의 글자와 이미지를 디지털 데이터로 변환해 주는 자동 인식 솔루션에 활용
일반적인 활용 사례
- 문서 파일/인쇄물 판독
- 우편번호 추출을 통한 우편물 관리
- 문자 자동 번역
- 명함 관리
- 차량번호 자동 인식
핀테크 / 커머스 적용 사례
- T 커머스 및 신용카드 결제 등록
- 인터넷은행 비대면 처리
- 송금 이체 계좌 등록
- 상품 최저가 검색 및 비슷한 상품 추천
4. OCR
전반적인 산업 분야에서 OCR 활용이 확대 중이며, 특히
Banking, Finance, Insurance (BFSI) 분야 에서의 사용 확대가 두드러짐
5. OCR
레이아웃 툴을 통해 템플릿을 만들어 문서 별로 추출 영역을 세밀하게 지정할 수 있음
(구조화 되지 않은 데이터를 구조화 하고, 자동으로 분석하여 문서 인식 업무의 효율화 추구)
6. 다국어 지원
한국어, 일본어, 영어 특성에 맞는 맞춤형 모델 개발을 통한 월등한 OCR 인식률
(국제 OCR 챌린지(ICDAR )에서’18년 6개 분야,19년 4개 분야에서1위 석권)
한글 범용 OCR 성능 비교 영어 인식 성능 비교
[비교방법] 다양한Scene 사진 4만장 테스트 [비교방법] ICDAR 15, 테스트데이터 1,811장
7. OCR Builder
•
템플릿 레이아웃 제작
템플릿 분류
Confidence Level
외부 검증 서버 연동
Text OCR API
용어 사전
통계 지표
정형화된 문서에서 원하는 영역에 대한 어노테이션 필드 설정 후 키-벨류 관계 추출