Application expérimentale pour la reconnaissance des caractères optiques (OCR)
Application expérimentale pour la reconnaissance des caractères optiques (OCR)
Cette application est une application expérimentale que j'ai développée il y a plusieurs années qui démontre l'utilisation du moteur Tesseract OCR pour reconnaître le texte dans les images capturées par la caméra de l'appareil.
Cette application exécute l'OCR sur votre appareil - sans télécharger vos images sur un serveur - et convient pour reconnaître les mots individuels ou les phrases courtes de texte, mais cette application est destinée aux amateurs et aux développeurs de logiciels intéressés par l'OCR et non pour le public général.
Contrairement à l'API Vision Mobile Vision de Google, cette application est en mesure de reconnaître le texte imprimé dans des polices non basées sur la latin pendant la ligne hors ligne. Pour y parvenir, cette application intègre une quantité inhabituellement importante de données de formation pour plusieurs langues. Ces données de formation sont stockées sur votre téléphone, et cette application occupe beaucoup plus d'espace que les applications ordinaires.
Aucun prétraitement d'image n'est effectué par cette application avant de remettre des cadres d'image capturés à Tesseract, de sorte que l'application n'est pas réglée pour un cas d'utilisation spécifique et, par conséquent, sa précision de reconnaissance et sa vitesse dépend fortement de facteurs situationnels comme la perspective, Éclairage et type de police.
Le code source de cette application est disponible sur GitHub (avec des modifications mineures pour s'adapter aux restrictions de taille des fichiers GitHub). Le code de cette application est une combinaison de code lié à la caméra open source à partir du projet de scanner de code à barres ZXing et du code de reconnaissance de caractères optiques open source du projet Tesseract OCR.
Capture de texte
La capture à un seul coup par défaut exécute l'OCR sur une image instantanée qui est capturée lorsque vous cliquez sur le bouton d'obturation, comme une photo régulière.
Lorsque la case à cocher "Aperçu continu" est cochée, l'application affiche un affichage dynamique en temps réel de ce que l'appareil reconnaît juste à côté du viseur de la caméra. Le mode d'aperçu continu fonctionne mieux sur un appareil rapide.
En utilisant cette application
• Pointez l'appareil dans une petite région de texte et appuyez sur le bouton d'obturation à l'écran pour démarrer l'OCR.
• Pour reconnaître les caractères chinois / japonais / coréens individuels, définissez le mode de segmentation des pages sur «caractère unique».
Précision de reconnaissance
• Divers facteurs peuvent entraîner l'échec de l'OCR: illumination inégale, texte stylisé ou texte sans suffisamment de contraste à partir de l'arrière-plan. Essayez d'avoir un bon éclairage.
• Tenez l'appareil stable et assurez-vous que l'image est au point.
• Si vous devez scanner un grand bloc de texte ou un document entier, essayez plutôt une application de numérisation de document telle que Text Fairy.
Langues
• Cette application prend en charge plusieurs langages / scripts non reconnus par Google Translate.
• Langues prises en charge pour l'OCR:
afrikaans
albanais
Amharique
arabe
Assamais
azerbaïdjanais
Azerbaïdjanais (cyrillique)
Basque
Biéloruste
bengali
Bosnie
bulgare
birman
catalan
Cebuano
Cherokee
Chinois (simplifié)
Chinois (traditionnel)
croate
tchèque
danois
Néerlandais
Dzongkha
Anglais
Anglais, milieu (1100-1500)
espéranto
estonien
finlandais
Franc
Français
Français, milieu (vers 1400-1600)
Galicien
géorgien
Géorgien - vieux
Allemand
Grec, ancien (-1453)
Grec, moderne (1453-)
Gujarati
haïtien
hébreu
hindi
hongrois
islandais
indonésien
Inuktitut
irlandais
italien
Italien - vieux
japonais
javanais
Kannada
Kazakh
Khmer
coréen
kurde
Kirghiz
Lao
latin
letton
lituanien
Macédonien
malais
Malayalam
maltais
Marathi
Népalais
norvégien
Oriya
Pachto
persan
polonais
portugais
Punjabi
roumain
russe
Sanskrit
serbe
Serbe (latin)
Cinghalais
slovaque
slovène
Espagnol
Espagnol - vieux
Swahili
suédois
Syriaque
Tagalog
Tadjik
Tamoul
Telugu
thaïlandais
Tibétain
Tigrinya
turc
ukrainien
Ourdou
Ouïghour
Ouzbek
Ouzbek (cyrillique)
vietnamien
gallois
yiddish
Remarques de l'appareil Samsung
• Sur les appareils Samsung Galaxy, vous devrez peut-être appuyer long sur le bouton de menu pour définir les préférences.
• Vous pouvez obtenir de meilleurs résultats si vous ne vérifiez pas le "mode de mise au point standard".
En savoir plus