Accueilapplicationbureau d'affaires

Application expérimentale pour la reconnaissance des caractères optiques (OCR)

Application expérimentale pour la reconnaissance des caractères optiques (OCR)

Cette application est une application expérimentale que j'ai développée il y a plusieurs années qui démontre l'utilisation du moteur Tesseract OCR pour reconnaître le texte dans les images capturées par la caméra de l'appareil.

Cette application exécute l'OCR sur votre appareil - sans télécharger vos images sur un serveur - et convient pour reconnaître les mots individuels ou les phrases courtes de texte, mais cette application est destinée aux amateurs et aux développeurs de logiciels intéressés par l'OCR et non pour le public général.

Contrairement à l'API Vision Mobile Vision de Google, cette application est en mesure de reconnaître le texte imprimé dans des polices non basées sur la latin pendant la ligne hors ligne. Pour y parvenir, cette application intègre une quantité inhabituellement importante de données de formation pour plusieurs langues. Ces données de formation sont stockées sur votre téléphone, et cette application occupe beaucoup plus d'espace que les applications ordinaires.

Aucun prétraitement d'image n'est effectué par cette application avant de remettre des cadres d'image capturés à Tesseract, de sorte que l'application n'est pas réglée pour un cas d'utilisation spécifique et, par conséquent, sa précision de reconnaissance et sa vitesse dépend fortement de facteurs situationnels comme la perspective, Éclairage et type de police.

Le code source de cette application est disponible sur GitHub (avec des modifications mineures pour s'adapter aux restrictions de taille des fichiers GitHub). Le code de cette application est une combinaison de code lié à la caméra open source à partir du projet de scanner de code à barres ZXing et du code de reconnaissance de caractères optiques open source du projet Tesseract OCR.

Capture de texte

La capture à un seul coup par défaut exécute l'OCR sur une image instantanée qui est capturée lorsque vous cliquez sur le bouton d'obturation, comme une photo régulière.

Lorsque la case à cocher "Aperçu continu" est cochée, l'application affiche un affichage dynamique en temps réel de ce que l'appareil reconnaît juste à côté du viseur de la caméra. Le mode d'aperçu continu fonctionne mieux sur un appareil rapide.

En utilisant cette application

• Pointez l'appareil dans une petite région de texte et appuyez sur le bouton d'obturation à l'écran pour démarrer l'OCR.

• Pour reconnaître les caractères chinois / japonais / coréens individuels, définissez le mode de segmentation des pages sur «caractère unique».

Précision de reconnaissance

• Divers facteurs peuvent entraîner l'échec de l'OCR: illumination inégale, texte stylisé ou texte sans suffisamment de contraste à partir de l'arrière-plan. Essayez d'avoir un bon éclairage.

• Tenez l'appareil stable et assurez-vous que l'image est au point.

• Si vous devez scanner un grand bloc de texte ou un document entier, essayez plutôt une application de numérisation de document telle que Text Fairy.

Langues

• Cette application prend en charge plusieurs langages / scripts non reconnus par Google Translate.

• Langues prises en charge pour l'OCR:

afrikaans

albanais

Amharique

arabe

Assamais

azerbaïdjanais

Azerbaïdjanais (cyrillique)

Basque

Biéloruste

bengali

Bosnie

bulgare

birman

catalan

Cebuano

Cherokee

Chinois (simplifié)

Chinois (traditionnel)

croate

tchèque

danois

Néerlandais

Dzongkha

Anglais

Anglais, milieu (1100-1500)

espéranto

estonien

finlandais

Franc

Français

Français, milieu (vers 1400-1600)

Galicien

géorgien

Géorgien - vieux

Allemand

Grec, ancien (-1453)

Grec, moderne (1453-)

Gujarati

haïtien

hébreu

hindi

hongrois

islandais

indonésien

Inuktitut

irlandais

italien

Italien - vieux

japonais

javanais

Kannada

Kazakh

Khmer

coréen

kurde

Kirghiz

Lao

latin

letton

lituanien

Macédonien

malais

Malayalam

maltais

Marathi

Népalais

norvégien

Oriya

Pachto

persan

polonais

portugais

Punjabi

roumain

russe

Sanskrit

serbe

Serbe (latin)

Cinghalais

slovaque

slovène

Espagnol

Espagnol - vieux

Swahili

suédois

Syriaque

Tagalog

Tadjik

Tamoul

Telugu

thaïlandais

Tibétain

Tigrinya

turc

ukrainien

Ourdou

Ouïghour

Ouzbek

Ouzbek (cyrillique)

vietnamien

gallois

yiddish

Remarques de l'appareil Samsung

• Sur les appareils Samsung Galaxy, vous devrez peut-être appuyer long sur le bouton de menu pour définir les préférences.

• Vous pouvez obtenir de meilleurs résultats si vous ne vérifiez pas le "mode de mise au point standard".

Quoi de neuf dans la dernière version 0.6.0

Dernière mise à jour le 24 août 2017 Nouveau dans la version 0.6.0 (13 août 2017):
• Emballé toutes les données de formation dans un fichier d'extension au lieu de télécharger individuellement au moment de l'exécution.
• Ajout du support OCR pour 47 nouveaux scripts.
• Mise à niveau pour utiliser Tesseract v3.05.
• Remplacement de la traduction dans l'application par un bouton qui relie à Google Translate.
• Ajout d'un bouton de copie comme alternative à la pression longue du texte reconnu.
• Google Play Services est maintenant requis.
• Android 2.3+ est maintenant requis.

En savoir plus

Les utilisateurs ont également consulté

Voir tout

Cela pourrait vous intéresser

Voir tout

Plus de jeux similaires

Voir tout

Plus de jeux de niveau

Voir tout