애플리케이션영업소

광학 문자 인식을위한 실험 앱 (OCR)

광학 문자 인식을위한 실험 앱 (OCR)

이 앱은 몇 년 전에 개발 한 실험용 앱으로 Tesseract OCR 엔진을 사용하여 장치 카메라에서 캡처 한 이미지에서 텍스트를 인식합니다.

이 앱은 이미지를 서버에 업로드하지 않고 장치에서 OCR을 실행하며 개별 단어 나 짧은 텍스트 문구를 인식하는 데 적합하지만이 앱은 일반 청중이 아닌 OCR에 관심이있는 애호가 및 소프트웨어 개발자를위한 것입니다.

Google의 Mobile Vision API와 달리이 앱은 오프라인에서 라틴 기반 글꼴로 인쇄 된 텍스트를 인식 할 수 있습니다. 이를 달성하기 위해이 앱에는 여러 언어에 대한 비정상적으로 많은 양의 교육 데이터가 통합되어 있습니다. 이 교육 데이터는 휴대 전화에 저장 되며이 앱은 일반 앱보다 훨씬 더 많은 공간을 차지합니다.

캡처 된 이미지 프레임을 TesserAct로 나눠주기 전에이 앱에서 이미지 사전 처리가 수행되지 않으므로 앱은 특정 사용 사례에 대해 조정되지 않으므로 인식 정확도와 속도는 원근과 같은 상황 요소에 크게 의존합니다. 조명 및 글꼴 유형.

이 앱의 소스 코드는 GitHub에서 사용할 수 있습니다 (GitHub 파일 크기 제한을 수용하기 위해 약간 변경됨). 이 앱의 코드는 Zxing 바코드 스캐너 프로젝트의 오픈 소스 카메라 관련 코드와 Tesseract OCR 프로젝트의 오픈 소스 광학 문자 인식 코드의 조합입니다.

텍스트 캡처

기본 싱글 샷 캡처는 일반 사진처럼 셔터 버튼을 클릭 할 때 캡처 된 스냅 샷 이미지에서 OCR을 실행합니다.

"연속 미리보기"확인란이 확인되면 앱은 카메라 뷰 파인더 옆에있는 장치가 인식하는 내용을 동적으로 실시간으로 표시합니다. 연속 미리보기 모드는 빠른 장치에서 가장 잘 작동합니다.

이 앱을 사용합니다

• 장치를 작은 텍스트 영역에 가리키고 화면 셔터 버튼을 터치하여 OCR을 시작하십시오.

• 개별 중국어/일본/한국 캐릭터를 인식하기 위해 페이지 분할 모드를 "단일 문자"로 설정하십시오.

인식 정확도

• 다양한 요소로 인해 OCR이 실패 할 수 있습니다. 불균일 한 조명, 양식화 된 텍스트 또는 텍스트는 배경과 충분히 대비되지 않습니다. 조명이 좋으려고 노력하십시오.

• 장치를 꾸준히 고정하고 그림이 초점을 맞추고 있는지 확인하십시오.

• 큰 텍스트 블록이나 전체 문서를 스캔 해야하는 경우 Text Fairy와 같은 문서 스캐닝 앱을 대신 사용해보십시오.

언어

•이 앱은 Google Translate에서 인식하지 않은 여러 언어/스크립트를 지원합니다.

• OCR을위한 지원되는 언어 :

아프리카 어

알바니아

암하라

아라비아 말

아사 메스

아제르바이잔

아제르바이잔 (Cyrillic)

바스크 사람

벨로루시

벵골 사람

보스니아 인

불가리아 사람

버마 사람

카탈로니아 사람

세부 노

체로키

중국어 (단순화)

중국어 (전통)

크로아티아

체코 사람

덴마크 말

네덜란드 사람

dzongkha

영어

영어, 중간 (1100-1500)

에스페란토 말

에스토니아 사람

핀란드

프랑스어

프랑스 국민

프랑스어, 중간 (약 1400-1600)

갈리시아어

그루지야 사람

조지아 - 옛

독일 사람

그리스어, 고대 (-1453)

그리스어, 현대 (1453-)

구자라트

아이티 섬 사람

헤브라이 사람

힌디 어

헝가리 인

아이슬란드

인도네시아 인

inuktitut

아일랜드

이탈리아 사람

이탈리아 - 오래된

일본어

자바어

칸나다어

카자흐

크메르

한국인

쿠르드족

키르기즈

라오

라틴어

라트비아 사람

리투아니아 사람

마케도니아 어

말레이 사람

말라 얄 람어

몰티즈

마라 티

네팔

노르웨이 인

오리 야

파슈토

페르시아 인

광택

포르투갈 인

펀 자브

루마니아 사람

러시아인

산스크리트

세르비아 사람

세르비아어 (라틴어)

신 할라

슬로바키아 사람

슬로베니아

스페인 사람

스페인어 - 오래된

스와 할리

스웨덴어

시리아

타갈로그

태조

타밀 사람

텔루구 어

태국

티베트어

티 그린

터키

우크라이나 말

우르두어

uyghur

우즈벡

우즈벡 (Cyrillic)

베트남 사람

웨일스 말

이디시어

삼성 장치 노트

• Samsung Galaxy 장치에서는 기본 설정을 설정하려면 메뉴 버튼을 긴 압박해야 할 수도 있습니다.

• "표준 포커스 모드"를 선택 해제하면 더 나은 결과를 얻을 수 있습니다.

최신 버전 0.6.0의 새로운 기능

2017 년 8 월 24 일에 마지막으로 업데이트 된 버전 0.6.0 (2017 년 8 월 13 일) :
• 실행 시간에 개별적으로 다운로드하는 대신 모든 교육 데이터를 확장 파일로 포장했습니다.
• 47 개의 새로운 스크립트에 대한 OCR 지원이 추가되었습니다.
• Tesseract v3.05를 사용하도록 업그레이드되었습니다.
• Google 번역에 연결되는 버튼으로 인앱 번역을 교체했습니다.
• 인식 된 텍스트를 장기 압축하기위한 대안으로 복사 버튼을 추가했습니다.
• 이제 Google Play 서비스가 필요합니다.
• 이제 Android 2.3+가 필요합니다.

더 읽어보세요

사용자들이 함께 본 항목

모두 보기

추천 콘텐츠

모두 보기

유사한 게임 더보기

모두 보기

더 많은 레벨 게임

모두 보기