Aplicación experimental para el reconocimiento de caracteres ópticos (OCR)
Aplicación experimental para el reconocimiento de caracteres ópticos (OCR)
Esta aplicación es una aplicación experimental que desarrollé hace varios años que demuestra el uso del motor Tesseract OCR para reconocer el texto en las imágenes capturadas por la cámara del dispositivo.
Esta aplicación ejecuta OCR en su dispositivo, sin cargar sus imágenes a un servidor, y es adecuado para reconocer palabras individuales o frases cortas de texto, pero esta aplicación está destinada a aficionados y desarrolladores de software interesados en OCR y no para audiencias generales.
A diferencia de la API de visión móvil de Google, esta aplicación puede reconocer el texto impreso en fuentes no basadas en latinas mientras está fuera de línea. Para lograr esto, esta aplicación incorpora una cantidad inusualmente grande de datos de capacitación para varios idiomas. Estos datos de capacitación se almacenan en su teléfono, y esta aplicación ocupa mucho más espacio que las aplicaciones ordinarias.
Esta aplicación no realiza el preprocesamiento de la imagen antes de entregar marcos de imagen capturados a Tesseract, por lo que la aplicación no está sintonizada para ningún caso de uso específico y, como resultado, su precisión y velocidad de reconocimiento dependen en gran medida de factores situacionales como la perspectiva, iluminación y tipo de fuente.
El código fuente para esta aplicación está disponible en GitHub (con cambios menores para acomodar restricciones de tamaño de archivo GitHub). El código para esta aplicación es una combinación de código relacionado con la cámara de código abierto del proyecto del escáner del código de barras Zxing y el código de reconocimiento de caracteres ópticos de código abierto del proyecto Tesseract OCR.
Captura de texto
La captura de disparo único predeterminado ejecuta OCR en una imagen de instantánea que se captura cuando hace clic en el botón del obturador, como una foto normal.
Cuando se marca la casilla de verificación "Vista previa continua", la aplicación muestra una pantalla dinámica y en tiempo real de lo que el dispositivo reconoce justo al lado del visor de la cámara. El modo de vista previa continua funciona mejor en un dispositivo rápido.
Usando esta aplicación
• Apunte el dispositivo en una pequeña región de texto y toque el botón de obturador en la pantalla para iniciar OCR.
• Para reconocer personajes individuales chinos/japoneses/coreanos, configure el modo de segmentación de la página en "un solo carácter".
Precisión de reconocimiento
• Varios factores pueden hacer que el OCR falle: iluminación desigual, texto estilizado o texto sin suficiente contraste desde el fondo. Intenta tener buena iluminación.
• Mantenga el dispositivo estable y asegúrese de que la imagen esté enfocada.
• Si necesita escanear un gran bloque de texto o un documento completo, pruebe una aplicación de escaneo de documentos como Text Fairy.
Lenguas
• Esta aplicación admite varios idiomas/scripts no reconocidos por Google Translate.
• Idiomas compatibles para OCR:
africaans
albanés
Amárico
árabe
Assamese
Azerbaiyano
Azerbaiyani (cirílico)
vasco
Bielorruso
bengalí
bosnio
búlgaro
birmano
catalán
Cebuano
Cherokee
Chino (simplificado)
Chino (tradicional)
croata
checo
danés
Holandés
Dzongkha
Inglés
Inglés, medio (1100-1500)
esperanto
Estonio
finlandés
Franco
Francés
French, Middle (ca. 1400-1600)
gallego
georgiano
Georgiano - Viejo
Alemán
Griego, antiguo (-1453)
Griego, moderno (1453-)
Gujarati
haitiano
hebreo
hindi
húngaro
islandés
indonesio
Inuktitut
irlandés
italiano
Italiano - Viejo
japonés
javanés
Kannada
Kazáceo
Jemer
coreano
kurdo
Kirguistán
Lao
latín
letón
lituano
macedónio
malayo
Malayalam
maltés
Marathi
Nepalí
noruego
Oriya
Pashto
persa
Polaco
portugués
punjabi
rumano
ruso
Sanskrit
serbio
Serbio (latín)
Sinhala
eslovaco
esloveno
Español
Español - Viejo
swahili
sueco
Siríaco
Tagalo
Tayiko
Tamil
Telugu
tailandés
Tibetano
Tigrinya
turco
ucranio
Urdu
Uigur
Uzbek
Uzbek (cirílico)
vietnamita
galés
yídish
Notas del dispositivo Samsung
• En los dispositivos Samsung Galaxy, es posible que deba presionar por mucho tiempo el botón de menú para establecer las preferencias.
• Puede obtener mejores resultados si no verifica el "modo de enfoque estándar".
Leer más