Iniciosolicitudoficina de negocios
  • OCR Test

    OCR Test

    8.9 0.6.0 2025-01-29
    oficina de negocios
    Descargar

Aplicación experimental para el reconocimiento de caracteres ópticos (OCR)

Aplicación experimental para el reconocimiento de caracteres ópticos (OCR)

Esta aplicación es una aplicación experimental que desarrollé hace varios años que demuestra el uso del motor Tesseract OCR para reconocer el texto en las imágenes capturadas por la cámara del dispositivo.

Esta aplicación ejecuta OCR en su dispositivo, sin cargar sus imágenes a un servidor, y es adecuado para reconocer palabras individuales o frases cortas de texto, pero esta aplicación está destinada a aficionados y desarrolladores de software interesados ​​en OCR y no para audiencias generales.

A diferencia de la API de visión móvil de Google, esta aplicación puede reconocer el texto impreso en fuentes no basadas en latinas mientras está fuera de línea. Para lograr esto, esta aplicación incorpora una cantidad inusualmente grande de datos de capacitación para varios idiomas. Estos datos de capacitación se almacenan en su teléfono, y esta aplicación ocupa mucho más espacio que las aplicaciones ordinarias.

Esta aplicación no realiza el preprocesamiento de la imagen antes de entregar marcos de imagen capturados a Tesseract, por lo que la aplicación no está sintonizada para ningún caso de uso específico y, como resultado, su precisión y velocidad de reconocimiento dependen en gran medida de factores situacionales como la perspectiva, iluminación y tipo de fuente.

El código fuente para esta aplicación está disponible en GitHub (con cambios menores para acomodar restricciones de tamaño de archivo GitHub). El código para esta aplicación es una combinación de código relacionado con la cámara de código abierto del proyecto del escáner del código de barras Zxing y el código de reconocimiento de caracteres ópticos de código abierto del proyecto Tesseract OCR.

Captura de texto

La captura de disparo único predeterminado ejecuta OCR en una imagen de instantánea que se captura cuando hace clic en el botón del obturador, como una foto normal.

Cuando se marca la casilla de verificación "Vista previa continua", la aplicación muestra una pantalla dinámica y en tiempo real de lo que el dispositivo reconoce justo al lado del visor de la cámara. El modo de vista previa continua funciona mejor en un dispositivo rápido.

Usando esta aplicación

• Apunte el dispositivo en una pequeña región de texto y toque el botón de obturador en la pantalla para iniciar OCR.

• Para reconocer personajes individuales chinos/japoneses/coreanos, configure el modo de segmentación de la página en "un solo carácter".

Precisión de reconocimiento

• Varios factores pueden hacer que el OCR falle: iluminación desigual, texto estilizado o texto sin suficiente contraste desde el fondo. Intenta tener buena iluminación.

• Mantenga el dispositivo estable y asegúrese de que la imagen esté enfocada.

• Si necesita escanear un gran bloque de texto o un documento completo, pruebe una aplicación de escaneo de documentos como Text Fairy.

Lenguas

• Esta aplicación admite varios idiomas/scripts no reconocidos por Google Translate.

• Idiomas compatibles para OCR:

africaans

albanés

Amárico

árabe

Assamese

Azerbaiyano

Azerbaiyani (cirílico)

vasco

Bielorruso

bengalí

bosnio

búlgaro

birmano

catalán

Cebuano

Cherokee

Chino (simplificado)

Chino (tradicional)

croata

checo

danés

Holandés

Dzongkha

Inglés

Inglés, medio (1100-1500)

esperanto

Estonio

finlandés

Franco

Francés

French, Middle (ca. 1400-1600)

gallego

georgiano

Georgiano - Viejo

Alemán

Griego, antiguo (-1453)

Griego, moderno (1453-)

Gujarati

haitiano

hebreo

hindi

húngaro

islandés

indonesio

Inuktitut

irlandés

italiano

Italiano - Viejo

japonés

javanés

Kannada

Kazáceo

Jemer

coreano

kurdo

Kirguistán

Lao

latín

letón

lituano

macedónio

malayo

Malayalam

maltés

Marathi

Nepalí

noruego

Oriya

Pashto

persa

Polaco

portugués

punjabi

rumano

ruso

Sanskrit

serbio

Serbio (latín)

Sinhala

eslovaco

esloveno

Español

Español - Viejo

swahili

sueco

Siríaco

Tagalo

Tayiko

Tamil

Telugu

tailandés

Tibetano

Tigrinya

turco

ucranio

Urdu

Uigur

Uzbek

Uzbek (cirílico)

vietnamita

galés

yídish

Notas del dispositivo Samsung

• En los dispositivos Samsung Galaxy, es posible que deba presionar por mucho tiempo el botón de menú para establecer las preferencias.

• Puede obtener mejores resultados si no verifica el "modo de enfoque estándar".

¿Qué hay de nuevo en la última versión 0.6.0?

Última actualización el 24 de agosto de 2017 Nuevo en la versión 0.6.0 (13 de agosto de 2017):
• Empaquetó todos los datos de capacitación en un archivo de expansión en lugar de descargar individualmente en el tiempo de ejecución.
• Se agregó soporte de OCR para 47 nuevos scripts.
• Actualizado para usar Tesseract V3.05.
• Reemplazó la traducción en la aplicación con un botón que vincula a Google Translate.
• Se agregó un botón de copia como alternativa a la presentación de larga data del texto reconocido.
• Ahora se requiere servicios de Google Play.
• Ahora se requiere Android 2.3+.

Leer más

Avance

Los usuarios también vieron

Ver todo

Te puede interesar

Ver todo

Más juegos similares

Ver todo

Más juegos de niveles

Ver todo