光學特徵識別的實驗應用(OCR)
光學特徵識別的實驗應用(OCR)
該應用程序是我幾年前開發的實驗應用程序,它證明了使用Tesseract OCR引擎來識別設備攝像頭捕獲的圖像中的文本。
該應用程序在您的設備上運行OCR - 無需將圖像上傳到服務器- 適合識別單個單詞或短語文本,但此應用程序旨在為對OCR感興趣的業餘愛好者和軟件開發人員而不是對一般觀眾感興趣。
與Google的移動視覺API相反,該應用程序可以在離線時識別以非基於非拉丁字體打印的文本。為了實現這一目標,該應用程序包含了多種語言的異常大量培訓數據。此培訓數據存儲在您的手機上,並且該應用程序比普通應用程序佔用更多的空間。
在將捕獲的圖像幀移交給Tesseract之前,該應用程序沒有執行圖像預處理,因此該應用不會針對任何特定的用例調整,因此,其識別準確性和速度在很大程度上取決於諸如Perspective,例如諸如Perspective的情況,照明和字體類型。
該應用程序的源代碼可在GITHUB上獲得(可容納GitHub文件尺寸限制的較小更改)。該應用程序的代碼是來自Zxing條形碼掃描儀項目的開源攝像頭相關代碼和Tesseract OCR項目中的開源光學字符識別代碼的組合。
文字捕獲
默認的單發捕獲量在單擊快門按鈕(如常規照片)時捕獲的快照圖像上運行OCR。
當檢查“連續預覽”複選框時,該應用顯示了設備在相機取景器旁邊識別的東西的動態實時顯示。連續預覽模式在快速設備上最有效。
使用此應用
•將設備指向文本的小區域,然後觸摸屏幕快門按鈕以啟動OCR。
•要識別中文/日語/韓國字符,請將頁面細分模式設置為“單個字符”。
識別準確性
•各種因素可能導致OCR失敗:不均勻的照明,風格化的文本或文本,而背景沒有足夠的對比度。嘗試具有良好的照明。
•保持設備穩定,並確保圖片焦點。
•如果您需要掃描大量文本或整個文檔,請嘗試使用文檔掃描應用程序,例如文本童話。
語言
•該應用支持Google Translate未識別的幾種語言/腳本。
•OCR支持的語言:
南非荷蘭語
阿爾巴尼亞人
阿姆哈拉語
阿拉伯
阿薩姆人
亞塞拜然
阿塞拜疆(西里爾)
巴斯克
白俄羅斯人
孟加拉
波斯尼亞
保加利亞語
緬甸
加泰羅尼亞
宿務
切諾基
中文(簡化)
中國(傳統)
克羅地亞人
捷克
丹麥語
荷蘭
Dzongkha
英語
英語,中間(1100-1500)
世界語
愛沙尼亞人
芬蘭
法蘭克人
法語
法語,中間(約1400-1600)
加利西亞人
格魯吉亞人
格魯吉亞 - 老
德語
希臘語,古代(-1453)
希臘人,現代(1453-)
古吉拉特語
海地
希伯來語
印地語
匈牙利
冰島
印度尼西亞
Inuktitut
愛爾蘭人
意大利人
意大利人 - 老
日本人
爪哇人
卡納達語
哈薩克
高棉
韓國人
庫爾德
吉爾吉斯
寮國
拉丁
拉脫維亞
立陶宛語
馬其頓
馬來語
馬拉雅拉姆語
馬爾他
馬拉地語
尼泊爾
挪威
Oriya
Pashto
波斯語
拋光
葡萄牙語
旁遮普
羅馬尼亞人
俄語
梵文
塞爾維亞
塞爾維亞(拉丁)
僧伽羅
斯洛伐克
斯洛文尼亞人
西班牙語
西班牙語 - 老
斯瓦希里語
瑞典
敘利亞
他加祿語
塔吉克
泰米爾人
泰盧固語
泰國
藏
tigrinya
土耳其
烏克蘭
烏爾都語
Uyghur
烏茲別克
烏茲別克(西里爾)
越南人
威爾士語
意第緒
三星設備註意
•在三星Galaxy設備上,您可能需要長時間按下菜單按鈕以設置首選項。
•如果您取消檢查“標準焦點模式”,則可能會獲得更好的結果。
閱讀更多信息