StartseiteAnwendungGeschäftsbüro

Experimentelle App für die optische Charaktererkennung (OCR)

Experimentelle App für die optische Charaktererkennung (OCR)

Diese App ist eine experimentelle App, die ich vor einigen Jahren entwickelt habe und die die Verwendung der Tesseract -OCR -Engine demonstriert, um Text in Bildern zu erkennen, die von der Gerätekamera aufgenommen wurden.

Diese App führt OCR auf Ihrem Gerät aus - ohne Ihre Bilder auf einen Server hochzuladen - und eignet sich zum Erkennen einzelner Wörter oder kurzen Textphrasen. Diese App ist jedoch für Hobbyisten und Softwareentwickler bestimmt, die an OCR und nicht für allgemeine Zielgruppen interessiert sind.

Im Gegensatz zur Mobile Vision API von Google kann diese App in nicht latinbasierten Schriftarten während offline in nicht latinbasierten Schriftarten gedruckt werden. Um dies zu erreichen, enthält diese App eine ungewöhnlich große Anzahl von Trainingsdaten für mehrere Sprachen. Diese Trainingsdaten werden auf Ihrem Telefon gespeichert, und diese App nimmt viel mehr Platz ein als normale Apps.

Diese App wird vor dem Abgeben erfasster Bildrahmen an Tesseract keine Bildvorbearbeitung durchgeführt. Daher ist die App nicht auf einen bestimmten Anwendungsfall abgestimmt, und infolgedessen ist ihre Erkennungsgenauigkeit und Geschwindigkeit stark von situativen Faktoren wie Perspektive abhängig. Beleuchtung und Schriftart.

Der Quellcode für diese App ist in GitHub verfügbar (mit geringfügigen Änderungen, um Einschränkungen der Github -Dateigröße zu erfüllen). Der Code für diese App ist eine Kombination aus Open-Source-Kamera-bezogenen Code aus dem ZXing-Bar-Code-Scannerprojekt und Open-Source-Erkennungscode aus dem Tesseract OCR-Projekt.

Textaufnahme

Die Standard-Single-Shot-Aufnahme wird OCR auf einem Snapshot-Bild ausgeführt, das bei Klicken auf die Schaltfläche Shutter wie ein reguläres Foto erfasst wird.

Wenn das Kontrollkästchen "Continuous Preview" überprüft wird, zeigt die App eine dynamische Echtzeitanzeige dessen an, was das Gerät direkt neben dem Kamera-Sucher erkennt. Der kontinuierliche Vorschau -Modus funktioniert am besten auf einem schnellen Gerät.

Verwenden dieser App

• Zeigen Sie das Gerät auf einen kleinen Textbereich und berühren Sie die Schaltfläche "Auf dem Bildschirm", um die OCR zu starten.

• Setzen Sie den Seitensegmentierungsmodus auf "einzelne Zeichen".

Erkennungsgenauigkeit

• Verschiedene Faktoren können dazu führen, dass die OCR fehlschlägt: Unebene Beleuchtung, stilisierter Text oder Text ohne ausreichend Kontrast vom Hintergrund. Versuchen Sie, eine gute Beleuchtung zu haben.

• Halten Sie das Gerät ruhig und stellen Sie sicher, dass das Bild im Fokus steht.

• Wenn Sie einen großen Textblock oder ein ganzes Dokument scannen müssen, versuchen Sie stattdessen eine Dokument -Scan -App wie die Textfee.

Sprachen

• Diese App unterstützt mehrere Sprachen/Skripte, die von Google Translate nicht erkannt wurden.

• Unterstützte Sprachen für OCR:

Afrikaans

albanisch

Amharisch

Arabisch

Assamesen

Aserbaidschani

Aserbaidschani (kyrillisch)

baskisch

Weißrussland

Bengali

bosnisch

bulgarisch

birmanisch

katalanisch

Cebuano

Cherokee

Chinesisch (vereinfacht)

Chinesisch (traditionell)

kroatisch

tschechisch

dänisch

Niederländisch

Dzongkha

Englisch

Englisch, Mitte (1100-1500)

Esperanto

estnisch

finnisch

fränkisch

Französisch

Französisch, Mitte (ca. 1400-1600)

galizisch

georgisch

Georgisch - alt

Deutsch

Griechisch, alt (-1453)

Griechisch, modern (1453-)

Gujarati

haitianisch

hebräisch

Hindi

ungarisch

isländisch

Indonesisch

Inuktitut

irisch

Italienisch

Italienisch - alt

japanisch

Javaner

Kannada

Kasachisch

Khmer

Koreanisch

kurdisch

Kirgisische

Lao

lateinisch

lettisch

litauisch

mazedonisch

malaiisch

Malayalam

maltesisch

Marathi

Nepali

norwegisch

Oriya

PaShto

persisch

Polieren

Portugiesisch

Punjabi

rumänisch

Russisch

Sanskrit

serbisch

Serbisch (lateinisch)

Sinhala

slowakisch

Slowenisch

Spanisch

Spanisch - alt

Swahili

Schwedisch

Syrisch

Tagalog

Tajik

Tamil

Telugu

Thai

Tibetaner

Tigrinya

Türkisch

ukrainisch

Urdu

Uyghur

Usbekisch

Usbek (kyrillisch)

Vietnamesisch

Walisisch

Jiddisch

Samsung -Gerätenoten

• Auf Samsung Galaxy-Geräten müssen Sie möglicherweise die Menü-Taste lang in den Menü einstellen, um Einstellungen festzulegen.

• Sie können bessere Ergebnisse erzielen, wenn Sie den "Standard-Fokus-Modus" nicht überprüfen.

Was ist neu in der neuesten Version 0.6.0

Zuletzt aktualisiert am 24. August 2017 Neu in Version 0.6.0 (13. August 2017):
• Alle Trainingsdaten in einer Erweiterungsdatei verpackt, anstatt zur Laufzeit einzeln herunterzuladen.
• Die OCR -Unterstützung für 47 neue Skripte hinzugefügt.
• Upgrade für die Verwendung von Tesseract v3.05.
• Die In-App-Übersetzung durch eine Schaltfläche ersetzt, die mit Google Translate verlinkt.
• Eine Kopier-Taste als Alternative zum langpressiven Langstücken des anerkannten Textes hinzugefügt.
• Google Play Services ist jetzt erforderlich.
• Android 2.3+ ist jetzt erforderlich.

Mehr lesen

Benutzer sahen auch

Alle ansehen

Das könnte Ihnen gefallen

Alle ansehen

Weitere ähnliche Spiele

Alle ansehen

Weitere Level-Spiele

Alle ansehen