我們經(jīng)??吹胶玫奈淖?,又不能在短時(shí)間內記錄下來(lái),一般用掃描儀或照相機拍攝成圖片,那么怎么才能變?yōu)榭勺R別的文字呢。 方法有二: 一、用一些專(zhuān)業(yè)的orc識別軟件可以直接進(jìn)行圖片識別,如漢王、尚書(shū)等。這種最簡(jiǎn)單,不行的話(huà)再用下面的方法。 二、先現將圖片轉換為pdf文件,然后用pdf識別軟件識別,打開(kāi)word編輯文字。 (注意:拍攝的時(shí)候,照片里的文字和背景之間的區別要清晰,圖片內容盡量保持整齊和完整,不要有皺褶,不然會(huì )影響后面的文字識別,另外,如果用數碼相機拍取的話(huà),最好打開(kāi)閃光燈,保持紙質(zhì)文檔中文字區域的背景色一致。) 第一步、圖片轉換為pdf:有五種方法 方法一、用“JPG轉PDF轉換器”比較快,非常簡(jiǎn)單。(http://www.xp500.com/Software/design/zhuanhuantuxiang/1365.html) 方法二、用“圖片PDF轉換精靈pictopdf2006.”也比較快,非常簡(jiǎn)單。 方法三、用TinyPDF虛擬PDF打印機轉換:這里下載:(http://www.nebulasoft.cn/softwares/TinyPDF.zip)。安裝完成后,會(huì )在系統里安裝一臺虛擬打印機。然后選中圖片—打印—照片打印—下一步—選中圖片—下一步“打印選項”選。TinyPDF—下一步另存為—pdf文件—完成。 方法四、用PDF_Factory_Pro_v3.52(http://www.rin9.com/read.php?tid=694899)。安裝完成后,會(huì )在系統里安裝一臺虛擬打印機。然后選中圖片—打印—照片打印—下一步—選中圖片—下一步“打印選項”選PDF_Factory_Pro—下一步—彈出PDF_Factory_Pro窗口--另存為—pdf文件—完成。 方法五:用Office 2003中自帶的MicrosoftOffice Document Imaging工具。安裝以后實(shí)際上在office工具里有兩個(gè)組件:“Microsoft Office Document Scanning”為掃描組件、“Microsoft Office Document Imaging”為圖像組件。 (一般的office2003中都帶。通過(guò)“開(kāi)始”---“程序”---“MicrosoftOffice”---“MicrosoftOffice工具”---看看有沒(méi)有。如果沒(méi)有就到這里下載安裝:http://www.microsoft.com/downloads/info.aspx?na=90&p=&SrcDisplay&SrcCategoryId=&SrcFamilyId=dd172063-9517-41d8-82af-29c38f7437b6&u=http%3a%2f%2fdownload.microsoft.com%2fdownload%2fa%2fb%2fe%2fabe96e44-28a6-4743-b530-a689da658c88%2fCHSOCR.msi?,安裝后會(huì )在在打印機列表里增加一個(gè)Microsoft OfficeDocument Image Writer虛擬打印機。 再不行的話(huà)需要完整版的office2003重新安裝一下,到這里下載“蜻蜓特派員的空間”解壓密碼“dragonflylee”http://hi.baidu.com/dragonflylee/blog/item/d6418a1992dbe3a24bedbc75.html) 操作:選中圖片—打印—照片打印—下一步—選中圖片—下一步“打印選項”選。Microsoft Office Document Image Writer—下一步另存為—Tag圖像TIF文件—完成。
第二步、Pdf文件識別出文字:有2種方法 方法一:直接轉換識別:使用CAJViewer7.0軟件。運行軟件,文件---打開(kāi)—找到圖片pdf。工具---選擇圖像---劃出要識別的部分;工具---文字識別---保存, ok啦。本法簡(jiǎn)單快捷?。?! 方法二|:用office Document Image Writer轉換識別。 1、先使用pdf閱讀器打開(kāi)待轉換的PDF文件,接下來(lái)選擇“文件→打印” →“打印機” →“名稱(chēng)”欄選擇“Microsoft Office Document Image Writer” →確認后→將該PDF文件“另存為”輸出為MDI或TIF格式的虛擬打印文件。 2、運行Microsoft Office Document Imaging,點(diǎn)擊“文件”欄下面的打開(kāi)文件夾“圖標”(不要點(diǎn)擊左上角的“文件”,容易出錯),打開(kāi)前面保存的MDI或TIF文件,用鼠標選擇你需要的文字內容(被選中的內容在紅色 的框內),點(diǎn)擊“工具”→“將文本發(fā)送到Word”,在彈出的窗口中勾選“在輸出時(shí)保持圖片版式不變” →確認→系統提示“必須在執行此操作前重新運行OCR。這可能需要一些時(shí)間”→確認即可。 3、發(fā)送到 word 中后,我們就可以在 word 中對該文檔進(jìn)行編輯、排版等操作了。 另:據說(shuō)圖片文字轉文本最快的是一款叫賽酷OCR的工具,圖片、PDF均可轉換成可編輯的文字。自己找一下吧。 |
聯(lián)系客服