http://q.115.com/115/56350?p=all#
【王牌和革命性效果】本地或云端等自動(dòng)OCR后閱讀的設想
http://115.com/folder/fbgdrnxu#(ocr相關(guān))老馬提取的微軟MODI獨立安裝包和21種語(yǔ)言包等(接口開(kāi)放)
含:
http://115.com/file/dpa475os#
unicornviewer+0.22+綠色免注冊版.rar
http://115.com/file/e7c0qd2q#
MODI中的OCR模塊.pdf
http://115.com/file/e7c0qrm4#
用MODI OCR 21種語(yǔ)言.pdf
http://115.com/file/dpa4qrt2#
MODI-OCR-CHN.rar
http://115.com/file/e7c0qtz2#
modi 21種語(yǔ)言.rar
http://115.com/file/e7c0qakn#
MODI2003.exe
http://115.com/file/c2iw9jy6#
Download Microsoft Office Document Imaging Visual Basic Reference (MODI) - Microsoft Download Center - Download Details.mht
http://115.com/file/be1b22vp#
modi-kor.rar
http://115.com/file/e7c0bfun#
modi-jap.rar
http://115.com/file/anp2mt9k#
modi-eur.rar
http://115.com/file/e7c0bh6p#
modi-cht.rar
http://115.com/file/c2iwp9s8#
jocr 1.0 繁體中文化版.rar
http://115.com/file/anp2mdi5#
JOCR.rar
補:http://115.com/file/e7c0tbt5#
熱卡文檔拍照識別軟件 Android版 Hotcard OCR Reader for Android.doc
2011-11-2 12:59 就一股股票 | 二級
具體看手機的功能,因為目前手機都有照相功能,安裝一個(gè)識別軟件就能解決,比如我的HTC Touch HD 通過(guò)漢王軟件,就可以將整頁(yè)文字進(jìn)行識別
http://zhidao.baidu.com/question/336527486.html
MODI_OCR_CHN 壓縮包
用途:在未安裝Office 2003/2007的機器上安裝MODI的OCR接口,供第三方軟件的OCR功能調用。內含簡(jiǎn)體中文、英文OCR模塊,只能用于簡(jiǎn)體中文Windows XP/Vista/Win7。其中注冊表項用的是SharePoint Designer 2007的,文件全部用的是Office 2007 SP3的。
安裝方法:雙擊運行install.bat,自動(dòng)完成文件復制(復制到C:Program FilesCommon FilesMicrosoft Shared文件夾),并寫(xiě)入OCR接口所需的注冊表項。install.bat會(huì )自動(dòng)識別是x86還是x64系統。
安裝完成后可以刪除解壓出來(lái)的所有文件,DjVuToy、FreePic2Pdf、Pdg2Pic、UV等軟件的OCR功能即可正常使用。
相關(guān)技術(shù)細節詳見(jiàn)《MODI中的OCR模塊》一文,在此基礎上OCR更多語(yǔ)言的配置過(guò)程詳見(jiàn)《用MODI OCR 21種語(yǔ)言》一文。
老馬:
MODI全稱(chēng)Microsoft Office Document Imaging,是微軟Office 2003/2007所帶的光學(xué)字符識別(OCR)組件,其OCR引擎采用清華文通和ScanSoft的技術(shù),支持21種語(yǔ)言,是一個(gè)方便的OCR工具。
與其他商業(yè)OCR軟件相比,MODI具有下列特點(diǎn):
支持多頁(yè)TIFF。某些OCR只支持單頁(yè)TIFF,OCR以后還需要對結果進(jìn)行合并。當然MODI支持的TIFF頁(yè)數也不是無(wú)限的,我個(gè)人的經(jīng)驗是不要超過(guò)300頁(yè)。單頁(yè)TIFF可用免費的TiffToy合并成多頁(yè)TIFF,再用MODI進(jìn)行OCR。TiffToy合并時(shí)可以選擇每合并多少個(gè)文件生成一個(gè)新文件。
支持的語(yǔ)言比較多,目前有21種。
提供開(kāi)放的編程接口。對于軟件開(kāi)發(fā)人員來(lái)說(shuō),到微軟網(wǎng)站下載一份MODI編程手冊,即可開(kāi)發(fā)出基于MODI的、具有多國語(yǔ)言OCR功能的軟件。MODI編程手冊下載地址:
http://www.microsoft.com/downloads/details.aspx?FamilyId=8F93E445-B1CF-4477-A373-E17417D616BC&displaylang=en
別的語(yǔ)言我沒(méi)試過(guò),但對簡(jiǎn)體、繁體、日文、朝鮮語(yǔ)來(lái)說(shuō),僅支持印刷體識別,不支持手寫(xiě)識別。如果您想要的是手寫(xiě)體識別,別浪費時(shí)間了,找其它軟件去吧。
對于簡(jiǎn)體、繁體、日文、朝鮮語(yǔ),識別結果只有字符、字符位置,沒(méi)有任何字體信息,因此不能做到精確版面還原,不過(guò)對于只想看文字來(lái)說(shuō)是夠了。其他語(yǔ)言能夠識別字體,因此可以做到版面還原。
一次只能選一種語(yǔ)言,因此對于多語(yǔ)言混排的情況識別率不佳。
圖文混排、表格的識別要看人品和運氣。
聯(lián)系客服