halaman depanaplikasikantor bisnis

Aplikasi Eksperimental untuk Pengenalan Karakter Optik (OCR)

Aplikasi Eksperimental untuk Pengenalan Karakter Optik (OCR)

Aplikasi ini adalah aplikasi eksperimental yang saya kembangkan beberapa tahun yang lalu yang menunjukkan penggunaan mesin Tesseract OCR untuk mengenali teks dalam gambar yang ditangkap oleh kamera perangkat.

Aplikasi ini menjalankan OCR di perangkat Anda - tanpa mengunggah gambar Anda ke server - dan cocok untuk mengenali kata -kata individual atau frasa teks pendek, tetapi aplikasi ini ditujukan untuk penghobi dan pengembang perangkat lunak yang tertarik pada OCR dan bukan untuk audiens umum.

Berbeda dengan API Visi Seluler Google, aplikasi ini dapat mengenali teks yang dicetak dalam font non-Latin saat offline. Untuk mencapai hal ini, aplikasi ini menggabungkan sejumlah besar data pelatihan untuk beberapa bahasa. Data pelatihan ini disimpan di ponsel Anda, dan aplikasi ini membutuhkan lebih banyak ruang daripada aplikasi biasa.

Tidak ada pemrosesan gambar yang dilakukan oleh aplikasi ini sebelum menyerahkan bingkai gambar yang ditangkap ke Tesseract, sehingga aplikasi tidak disesuaikan untuk kasus penggunaan spesifik dan, sebagai hasilnya, akurasi dan kecepatan pengakuannya sangat tergantung pada faktor-faktor situasional seperti perspektif, Jenis pencahayaan, dan font.

Kode sumber untuk aplikasi ini tersedia di GitHub (dengan perubahan kecil untuk mengakomodasi pembatasan ukuran file GitHub). Kode untuk aplikasi ini adalah kombinasi kode terkait kamera open source dari proyek pemindai kode batang zxing dan kode pengenalan karakter optik optik sumber terbuka dari proyek Tesseract OCR.

Penangkapan teks

Pengambilan tembakan tunggal default menjalankan OCR pada gambar snapshot yang ditangkap saat Anda mengklik tombol rana, seperti foto biasa.

Ketika kotak centang "Pratinjau Berkelanjutan" dicentang, aplikasi menunjukkan tampilan yang dinamis dan real-time dari apa yang dikenali perangkat tepat di samping jendela bidik kamera. Mode pratinjau kontinu bekerja paling baik pada perangkat cepat.

Menggunakan aplikasi ini

• Arahkan perangkat di daerah kecil teks dan sentuh tombol rana di layar untuk memulai OCR.

• Untuk mengenali karakter individu Cina/Jepang/Korea, atur mode segmentasi halaman menjadi "karakter tunggal."

Akurasi pengakuan

• Berbagai faktor dapat menyebabkan OCR gagal: iluminasi yang tidak rata, teks bergaya, atau teks tanpa kontras yang cukup dari latar belakang. Cobalah untuk memiliki pencahayaan yang bagus.

• Pegang perangkat dengan stabil, dan pastikan gambarnya fokus.

• Jika Anda perlu memindai blok teks besar atau seluruh dokumen, cobalah aplikasi pemindaian dokumen seperti Peri Teks sebagai gantinya.

Bahasa

• Aplikasi ini mendukung beberapa bahasa/skrip yang tidak dikenali oleh Google Translate.

• Bahasa yang didukung untuk OCR:

Afrikanas

bahasa Albania

Amharik

Arab

Orang Assam

Azerbaijani

Azerbaijani (Cyrillic)

Basque

Belarusia

Benggala

Bosnia

Bulgaria

Birma

Catalan

Cebuano

Cherokee

Cina (disederhanakan)

Cina (tradisional)

Kroasia

Ceko

Denmark

Belanda

Dzongkha

Bahasa inggris

Bahasa Inggris, Tengah (1100-1500)

Esperanto

Estonia

Finlandia

Frankish

Perancis

Prancis, tengah (ca. 1400-1600)

Galicia

Georgia

Georgia - Tua

Jerman

Yunani, kuno (-1453)

Yunani, Modern (1453-)

Gujarati

Haiti

Ibrani

Hindi

Hongaria

Islandia

Indonesia

Inuktitut

Irlandia

Italia

Italia - tua

Jepang

Jawa

Kannada

Kazakh

Khmer

Korea

Kurdi

Kyrgyz

Lao

Latin

Latvia

Lithuania

Makedonia

Melayu

Malayalam

Malta

Marathi

Nepal

Norwegia

Oriya

Pashto

Persia

Polandia

Portugis

Punjabi

Rumania

Rusia

Sansekerta

Serbia

Serbia (Latin)

Sinhala

Slovakia

Slovenia

Spanyol

Spanyol - Tua

Swahili

Swedia

Syria

Tagalog

Tajik

Tamil

Telugu

Thai

Tibet

Tigrinya

Turki

Ukraina

Urdu

Uyghur

Uzbek

Uzbek (Cyrillic)

Vietnam

Welsh

Yiddi

Catatan perangkat Samsung

• Pada perangkat Samsung Galaxy, Anda mungkin perlu menekan tombol menu untuk mengatur preferensi.

• Anda mungkin mendapatkan hasil yang lebih baik jika Anda melepaskan "mode fokus standar".

Apa yang baru di versi terbaru 0.6.0

Terakhir diperbarui pada 24 Agustus 2017 baru dalam versi 0.6.0 (13 Agustus 2017):
• Mengemas semua data pelatihan dalam file ekspansi alih -alih mengunduh secara individual pada waktu berjalan.
• Menambahkan dukungan OCR untuk 47 skrip baru.
• ditingkatkan untuk menggunakan Tesseract v3.05.
• Terjemahan dalam aplikasi yang diganti dengan tombol yang menautkan ke Google Translate.
• Menambahkan tombol salin sebagai alternatif untuk menekan teks yang dikenali.
• Layanan Google Play sekarang diperlukan.
• Android 2.3+ sekarang diperlukan.

Baca selengkapnya

Pengguna juga melihat

Lihat semuanya

Anda mungkin tertarik

Lihat semuanya

Game serupa lainnya

Lihat semuanya

Lebih banyak permainan Level

Lihat semuanya