Aplikasi Eksperimental untuk Pengenalan Karakter Optik (OCR)
Aplikasi Eksperimental untuk Pengenalan Karakter Optik (OCR)
Aplikasi ini adalah aplikasi eksperimental yang saya kembangkan beberapa tahun yang lalu yang menunjukkan penggunaan mesin Tesseract OCR untuk mengenali teks dalam gambar yang ditangkap oleh kamera perangkat.
Aplikasi ini menjalankan OCR di perangkat Anda - tanpa mengunggah gambar Anda ke server - dan cocok untuk mengenali kata -kata individual atau frasa teks pendek, tetapi aplikasi ini ditujukan untuk penghobi dan pengembang perangkat lunak yang tertarik pada OCR dan bukan untuk audiens umum.
Berbeda dengan API Visi Seluler Google, aplikasi ini dapat mengenali teks yang dicetak dalam font non-Latin saat offline. Untuk mencapai hal ini, aplikasi ini menggabungkan sejumlah besar data pelatihan untuk beberapa bahasa. Data pelatihan ini disimpan di ponsel Anda, dan aplikasi ini membutuhkan lebih banyak ruang daripada aplikasi biasa.
Tidak ada pemrosesan gambar yang dilakukan oleh aplikasi ini sebelum menyerahkan bingkai gambar yang ditangkap ke Tesseract, sehingga aplikasi tidak disesuaikan untuk kasus penggunaan spesifik dan, sebagai hasilnya, akurasi dan kecepatan pengakuannya sangat tergantung pada faktor-faktor situasional seperti perspektif, Jenis pencahayaan, dan font.
Kode sumber untuk aplikasi ini tersedia di GitHub (dengan perubahan kecil untuk mengakomodasi pembatasan ukuran file GitHub). Kode untuk aplikasi ini adalah kombinasi kode terkait kamera open source dari proyek pemindai kode batang zxing dan kode pengenalan karakter optik optik sumber terbuka dari proyek Tesseract OCR.
Penangkapan teks
Pengambilan tembakan tunggal default menjalankan OCR pada gambar snapshot yang ditangkap saat Anda mengklik tombol rana, seperti foto biasa.
Ketika kotak centang "Pratinjau Berkelanjutan" dicentang, aplikasi menunjukkan tampilan yang dinamis dan real-time dari apa yang dikenali perangkat tepat di samping jendela bidik kamera. Mode pratinjau kontinu bekerja paling baik pada perangkat cepat.
Menggunakan aplikasi ini
• Arahkan perangkat di daerah kecil teks dan sentuh tombol rana di layar untuk memulai OCR.
• Untuk mengenali karakter individu Cina/Jepang/Korea, atur mode segmentasi halaman menjadi "karakter tunggal."
Akurasi pengakuan
• Berbagai faktor dapat menyebabkan OCR gagal: iluminasi yang tidak rata, teks bergaya, atau teks tanpa kontras yang cukup dari latar belakang. Cobalah untuk memiliki pencahayaan yang bagus.
• Pegang perangkat dengan stabil, dan pastikan gambarnya fokus.
• Jika Anda perlu memindai blok teks besar atau seluruh dokumen, cobalah aplikasi pemindaian dokumen seperti Peri Teks sebagai gantinya.
Bahasa
• Aplikasi ini mendukung beberapa bahasa/skrip yang tidak dikenali oleh Google Translate.
• Bahasa yang didukung untuk OCR:
Afrikanas
bahasa Albania
Amharik
Arab
Orang Assam
Azerbaijani
Azerbaijani (Cyrillic)
Basque
Belarusia
Benggala
Bosnia
Bulgaria
Birma
Catalan
Cebuano
Cherokee
Cina (disederhanakan)
Cina (tradisional)
Kroasia
Ceko
Denmark
Belanda
Dzongkha
Bahasa inggris
Bahasa Inggris, Tengah (1100-1500)
Esperanto
Estonia
Finlandia
Frankish
Perancis
Prancis, tengah (ca. 1400-1600)
Galicia
Georgia
Georgia - Tua
Jerman
Yunani, kuno (-1453)
Yunani, Modern (1453-)
Gujarati
Haiti
Ibrani
Hindi
Hongaria
Islandia
Indonesia
Inuktitut
Irlandia
Italia
Italia - tua
Jepang
Jawa
Kannada
Kazakh
Khmer
Korea
Kurdi
Kyrgyz
Lao
Latin
Latvia
Lithuania
Makedonia
Melayu
Malayalam
Malta
Marathi
Nepal
Norwegia
Oriya
Pashto
Persia
Polandia
Portugis
Punjabi
Rumania
Rusia
Sansekerta
Serbia
Serbia (Latin)
Sinhala
Slovakia
Slovenia
Spanyol
Spanyol - Tua
Swahili
Swedia
Syria
Tagalog
Tajik
Tamil
Telugu
Thai
Tibet
Tigrinya
Turki
Ukraina
Urdu
Uyghur
Uzbek
Uzbek (Cyrillic)
Vietnam
Welsh
Yiddi
Catatan perangkat Samsung
• Pada perangkat Samsung Galaxy, Anda mungkin perlu menekan tombol menu untuk mengatur preferensi.
• Anda mungkin mendapatkan hasil yang lebih baik jika Anda melepaskan "mode fokus standar".
Baca selengkapnya