Экспериментальное приложение для распознавания оптического характера (OCR)
Экспериментальное приложение для распознавания оптического характера (OCR)
Это приложение является экспериментальным приложением, которое я разработал несколько лет назад, которое демонстрирует использование двигателя Tesseract OCR для распознавания текста на изображениях, снятых камерой устройства.
Это приложение запускает OCR на вашем устройстве - без загрузки ваших изображений на сервер - и подходит для распознавания отдельных слов или коротких фраз текста, но это приложение предназначено для любителей и разработчиков программного обеспечения, заинтересованных в OCR, а не для общей аудитории.
В отличие от API Google Mobile Vision API, это приложение может распознавать текст, напечатанный в нелатиновых шрифтах во время автономного режима. Чтобы достичь этого, это приложение включает в себя необычайно большое количество учебных данных для нескольких языков. Эти учебные данные хранятся на вашем телефоне, и это приложение занимает гораздо больше места, чем обычные приложения.
Предварительная обработка изображения не выполняется в этом приложении, прежде чем передавать захваченные кадры изображений на Tesseract, поэтому приложение не настроено на какой-либо конкретный случай использования, и в результате его точность распознавания и скорость сильно зависят от ситуационных факторов, таких как перспектива, освещение и тип шрифта.
Исходный код для этого приложения доступен на GitHub (с небольшими изменениями для размещения ограничений размера файла GitHub). Код для этого приложения представляет собой комбинацию кода, связанного с камерой с открытым исходным кодом, из проекта Scanner Scanner ZXING и кода распознавания символов с открытым исходным кодом из проекта TesserAct OCR.
Текст захват
По умолчанию одноразовый захват запускает OCR на изображении снимка, которое снимается при нажатии кнопки затвора, как обычная фотография.
Когда флажок «Непрерывный предварительный просмотр» проверяется, в приложении показано динамическое отображение в реальном времени того, что устройство распознает прямо рядом с видоискателем камеры. Режим непрерывного предварительного просмотра работает лучше всего на быстрое устройство.
Используя это приложение
• Укажите устройство на небольшую область текста и коснитесь кнопки затвора на экране, чтобы запустить OCR.
• Для распознавания отдельных китайских/японских/корейских символов установите режим сегментации страницы на «один символ».
Точность распознавания
• Различные факторы могут привести к выходу из строя OCR: неравномерное освещение, стилизованный текст или текст без достаточного контраста с фона. Постарайтесь иметь хорошее освещение.
• Удерживайте устройство устойчивым, и убедитесь, что изображение находится в фокусе.
• Если вам нужно сканировать большой блок текста или весь документ, попробуйте вместо этого приложение для сканирования документа, такое как Text Fairy.
Языки
• Это приложение поддерживает несколько языков/сценариев, не распознаваемых Google Translate.
• Поддерживаемые языки для OCR:
африкаанс
албанский
Амхарский
арабский
Ассамский
Азербайджани
Азербайджани (Кириллик)
Баск
Белорус
Бенгальский
Боснийский
болгарский
Бирманский
Каталонский
Себуано
Чероки
Китайский (упрощен)
Китайский (традиционный)
хорватский
чешский
Датский
Голландский
Дзонгха
Английский
Английский, середина (1100-1500)
эсперанто
эстонский
Финский
Франкаш
Французский
Французский, середина (ок. 1400-1600)
Галиц
Грузинец
Грузинский - старый
немецкий
Греческий, древний (-1453)
Греческий, современный (1453-)
Гуджарати
Гаитянский
иврит
хинди
венгерский
исландский
индонезийский
Inuktitut
Ирландский
Итальянский
Итальянский - старый
Японский
Яванский
Каннада
Казах
Кхмер
корейский
Курдский
Кыргиз
Лаос
латинский
Латвиан
литовский
македонский
малайский
Малаялам
Мальтийский
Маратхи
Непальский
норвежский
Ария
Пушту
Персидский
Лак
португальский
Пенджаби
румынский
Русский
санскрит
сербский
Сербский (латынь)
Сингальский
словацкий
словенский
испанский
Испанский - Старый
суахили
Шведский
Сирийский
Тагаль
Таджик
Тамильский
телугу
Тайский
тибетский
Тигринья
турецкий
Украинский
Урду
Уйгур
Узбек
Узбек (Кириллик)
вьетнамский
валлийский
идиш
Samsung Device Notes
• На устройствах Samsung Galaxy вам может потребоваться дальность кнопки меню, чтобы установить предпочтения.
• Вы можете получить лучшие результаты, если вы не проверьте «стандартный режим фокусировки».
Читать далее