Experimentelle App für die optische Charaktererkennung (OCR)
Experimentelle App für die optische Charaktererkennung (OCR)
Diese App ist eine experimentelle App, die ich vor einigen Jahren entwickelt habe und die die Verwendung der Tesseract -OCR -Engine demonstriert, um Text in Bildern zu erkennen, die von der Gerätekamera aufgenommen wurden.
Diese App führt OCR auf Ihrem Gerät aus - ohne Ihre Bilder auf einen Server hochzuladen - und eignet sich zum Erkennen einzelner Wörter oder kurzen Textphrasen. Diese App ist jedoch für Hobbyisten und Softwareentwickler bestimmt, die an OCR und nicht für allgemeine Zielgruppen interessiert sind.
Im Gegensatz zur Mobile Vision API von Google kann diese App in nicht latinbasierten Schriftarten während offline in nicht latinbasierten Schriftarten gedruckt werden. Um dies zu erreichen, enthält diese App eine ungewöhnlich große Anzahl von Trainingsdaten für mehrere Sprachen. Diese Trainingsdaten werden auf Ihrem Telefon gespeichert, und diese App nimmt viel mehr Platz ein als normale Apps.
Diese App wird vor dem Abgeben erfasster Bildrahmen an Tesseract keine Bildvorbearbeitung durchgeführt. Daher ist die App nicht auf einen bestimmten Anwendungsfall abgestimmt, und infolgedessen ist ihre Erkennungsgenauigkeit und Geschwindigkeit stark von situativen Faktoren wie Perspektive abhängig. Beleuchtung und Schriftart.
Der Quellcode für diese App ist in GitHub verfügbar (mit geringfügigen Änderungen, um Einschränkungen der Github -Dateigröße zu erfüllen). Der Code für diese App ist eine Kombination aus Open-Source-Kamera-bezogenen Code aus dem ZXing-Bar-Code-Scannerprojekt und Open-Source-Erkennungscode aus dem Tesseract OCR-Projekt.
Textaufnahme
Die Standard-Single-Shot-Aufnahme wird OCR auf einem Snapshot-Bild ausgeführt, das bei Klicken auf die Schaltfläche Shutter wie ein reguläres Foto erfasst wird.
Wenn das Kontrollkästchen "Continuous Preview" überprüft wird, zeigt die App eine dynamische Echtzeitanzeige dessen an, was das Gerät direkt neben dem Kamera-Sucher erkennt. Der kontinuierliche Vorschau -Modus funktioniert am besten auf einem schnellen Gerät.
Verwenden dieser App
• Zeigen Sie das Gerät auf einen kleinen Textbereich und berühren Sie die Schaltfläche "Auf dem Bildschirm", um die OCR zu starten.
• Setzen Sie den Seitensegmentierungsmodus auf "einzelne Zeichen".
Erkennungsgenauigkeit
• Verschiedene Faktoren können dazu führen, dass die OCR fehlschlägt: Unebene Beleuchtung, stilisierter Text oder Text ohne ausreichend Kontrast vom Hintergrund. Versuchen Sie, eine gute Beleuchtung zu haben.
• Halten Sie das Gerät ruhig und stellen Sie sicher, dass das Bild im Fokus steht.
• Wenn Sie einen großen Textblock oder ein ganzes Dokument scannen müssen, versuchen Sie stattdessen eine Dokument -Scan -App wie die Textfee.
Sprachen
• Diese App unterstützt mehrere Sprachen/Skripte, die von Google Translate nicht erkannt wurden.
• Unterstützte Sprachen für OCR:
Afrikaans
albanisch
Amharisch
Arabisch
Assamesen
Aserbaidschani
Aserbaidschani (kyrillisch)
baskisch
Weißrussland
Bengali
bosnisch
bulgarisch
birmanisch
katalanisch
Cebuano
Cherokee
Chinesisch (vereinfacht)
Chinesisch (traditionell)
kroatisch
tschechisch
dänisch
Niederländisch
Dzongkha
Englisch
Englisch, Mitte (1100-1500)
Esperanto
estnisch
finnisch
fränkisch
Französisch
Französisch, Mitte (ca. 1400-1600)
galizisch
georgisch
Georgisch - alt
Deutsch
Griechisch, alt (-1453)
Griechisch, modern (1453-)
Gujarati
haitianisch
hebräisch
Hindi
ungarisch
isländisch
Indonesisch
Inuktitut
irisch
Italienisch
Italienisch - alt
japanisch
Javaner
Kannada
Kasachisch
Khmer
Koreanisch
kurdisch
Kirgisische
Lao
lateinisch
lettisch
litauisch
mazedonisch
malaiisch
Malayalam
maltesisch
Marathi
Nepali
norwegisch
Oriya
PaShto
persisch
Polieren
Portugiesisch
Punjabi
rumänisch
Russisch
Sanskrit
serbisch
Serbisch (lateinisch)
Sinhala
slowakisch
Slowenisch
Spanisch
Spanisch - alt
Swahili
Schwedisch
Syrisch
Tagalog
Tajik
Tamil
Telugu
Thai
Tibetaner
Tigrinya
Türkisch
ukrainisch
Urdu
Uyghur
Usbekisch
Usbek (kyrillisch)
Vietnamesisch
Walisisch
Jiddisch
Samsung -Gerätenoten
• Auf Samsung Galaxy-Geräten müssen Sie möglicherweise die Menü-Taste lang in den Menü einstellen, um Einstellungen festzulegen.
• Sie können bessere Ergebnisse erzielen, wenn Sie den "Standard-Fokus-Modus" nicht überprüfen.
Mehr lesen