欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費電子書(shū)等14項超值服

開(kāi)通VIP
在簡(jiǎn)體中文Office 2003下OCR繁體中文、日文、韓文
在簡(jiǎn)體中文Office 2003下用Micorsoft Office Document Imaging (MODI)做OCR的步驟為:
先確保MODI已經(jīng)正常安裝。Office 2003的缺省安裝是第一次使用MODI時(shí)安裝,Office 2007的缺省安裝是不裝,都需要改過(guò)來(lái)。
在資源管理器里選中某個(gè)多頁(yè)TIFF文件,從右鍵菜單選擇用Micorsoft Office Document Imaging打開(kāi)。
打開(kāi)后,先選擇“工具->選項”,對OCR選項進(jìn)行設置。常規設置是去掉“自動(dòng)拉伸”、“自動(dòng)旋轉”選項,再選擇合適的語(yǔ)言。
選擇“工具->將文本發(fā)送到Word”,在彈出的對話(huà)框中選擇“所有頁(yè)面”,“在輸出時(shí)保持圖片版式不變”,然后選擇默認文件夾,點(diǎn)“確定”,即可開(kāi)始OCR。
OCR結束后,文本自動(dòng)發(fā)送到Word。缺省格式是HTML,當然也可以另存為txt、doc。
與其他商業(yè)OCR軟件相比,MODI具有下列特點(diǎn):
支持多頁(yè)TIFF。某些OCR只支持單頁(yè)TIFF,OCR以后還需要對結果進(jìn)行合并。當然MODI支持的TIFF頁(yè)數也不是無(wú)限的,我個(gè)人的經(jīng)驗是不要超過(guò)300頁(yè)。單頁(yè)TIFF文件可以用免費的TiffToy合并成多頁(yè)TIFF,然后再用MODI進(jìn)行OCR。TiffToy合并時(shí)可以選擇每合并多少個(gè)文件生成一個(gè)新文件。
中文標點(diǎn)、文本段落保持得比較好,后期校對省了很多事。
支持的語(yǔ)言比較多,Office支持的語(yǔ)言基本都支持。但是這一點(diǎn)對大多數用戶(hù)來(lái)說(shuō)無(wú)法體會(huì ),因為正常情況下,MODI只支持英文和當前Office語(yǔ)言(如簡(jiǎn)體中文)的OCR,要想支持更多的語(yǔ)言,需要進(jìn)行一些設置,這就是本文所要討論的內容。當然我并非語(yǔ)言天才,對于亞洲主要語(yǔ)言(中、日、韓)還算有所了解,其他語(yǔ)言一概無(wú)知,所以本文的討論也僅限于這三國語(yǔ)言。
提供開(kāi)放的編程接口。對于軟件開(kāi)發(fā)人員來(lái)說(shuō),到微軟網(wǎng)站下載一份MODI編程手冊,即可開(kāi)發(fā)出基于MODI的、具有多國語(yǔ)言OCR功能的軟件。
在正式開(kāi)始討論系統設置前,先透露一點(diǎn)技術(shù)背景:
MODI所使用的中、日、韓OCR引擎,均為清華文通的OCR引擎。
由于簡(jiǎn)體中文平臺的GBK字符集完全覆蓋繁體中文、日文,因此繁體中文、日文的OCR結果在簡(jiǎn)體中文Office環(huán)境下均為GBK編碼,可以在支持GBK編碼的中文平臺下正常顯示、編輯。當然如果覺(jué)得繁體中文看起來(lái)比較麻煩,也可以用Word的繁簡(jiǎn)轉換功能,或TextForever的編碼轉換功能,將GBK繁體轉換成GB編碼的簡(jiǎn)體。但是對于韓文來(lái)說(shuō)就沒(méi)有這么美好了,因為目前GBK還不兼容韓文,所以韓文的OCR結果如果想在簡(jiǎn)體Office下編輯,大概只能存為HTML或doc文件,然后用Word編輯。
MODI編程手冊可以到這里下載:
http://www.microsoft.com/downloads/details.aspx?FamilyId=8F93E445-B1CF-4477-A373-E17417D616BC&displaylang=en
要想讓簡(jiǎn)體中文Office 2003能夠OCR繁體、日文、韓文,需要做的工作包括兩個(gè)方面:
安裝相關(guān)語(yǔ)言的OCR模塊。MODI本身可以看作一個(gè)外殼,真正的OCR功能需要靠不同語(yǔ)言的模塊實(shí)現。每個(gè)語(yǔ)言模塊包括相關(guān)DLL文件和數據文件,需要復制到MODI的安裝文件夾下。
告訴MODI,目前有哪些語(yǔ)言的OCR模塊可以使用。這個(gè)需要更改注冊表,更改后在MODI的OCR選項里即可選擇對應的語(yǔ)言。
找一臺安裝了繁體中文Office 2003的機器,進(jìn)入MODI的安裝文件夾,缺省為:
C:\Program Files\Common Files\Microsoft Shared\MODI\11.0
將下面的文件復制到安裝了簡(jiǎn)體中文Office 2003的相同文件夾下:
TCCODE.UNI
TCPRINT.DAT
TCPRINT2.DAT
TCSERHT.DAT
TCTREE.DAT
TW_BU.DAT
TW_UB.DAT
TWBIG532.DLL
復制完成后,用記事本創(chuàng )建一個(gè)reg文件,把下面內容粘貼后存盤(pán):
Windows Registry Editor Version 5.00
[HKEY_CURRENT_USER\Software\Microsoft\Installer\Components\61BA386016BD0C340BBEAC273D84FD5F]
"1028"=hex(7):28,00,26,00,48,00,42,00,56,00,6e,00,2d,00,7d,00,66,00,28,00,5a,\
00,58,00,66,00,65,00,41,00,52,00,36,00,2e,00,6a,00,69,00,4f,00,43,00,52,00,\
5f,00,31,00,30,00,32,00,38,00,3e,00,7d,00,60,00,45,00,4d,00,61,00,65,00,2c,\
00,37,00,71,00,39,00,2a,00,44,00,58,00,64,00,55,00,40,00,45,00,50,00,69,00,\
3d,00,00,00,00,00
雙擊此reg文件導入注冊表后,在MODI的OCR選項卡里,“OCR語(yǔ)言”即可看到“中文(繁體)”。注意導入注冊表時(shí)必須先關(guān)閉所有MODI窗口,導入后再打開(kāi)。
在簡(jiǎn)體中文環(huán)境下,按照上述步驟設置后,用MODI識別出來(lái)的繁體中文是GBK編碼的繁體字,可以用Word的繁簡(jiǎn)轉換,或TextForever的編碼轉換功能 (支持批量)轉換成GB編碼的簡(jiǎn)體字。
需要從日文MODI復制到簡(jiǎn)體MODI文件夾下的文件為:
JPCODE.UNI
JPPRINT.DAT
JPPRINT2.DAT
JPSERHT.DAT
JPTREE.DAT
TW_SU.DAT
TW_US.DAT
TWRECJ.DLL
TWSJIS32.DLL
需要導入的reg內容為:
Windows Registry Editor Version 5.00
[HKEY_CURRENT_USER\Software\Microsoft\Installer\Components\61BA386016BD0C340BBEAC273D84FD5F]
"1041"=hex(7):30,00,5d,00,67,00,41,00,56,00,6e,00,2d,00,7d,00,66,00,28,00,5a,\
00,58,00,66,00,65,00,41,00,52,00,36,00,2e,00,6a,00,69,00,4f,00,43,00,52,00,\
5f,00,31,00,30,00,34,00,31,00,3e,00,2e,00,61,00,45,00,4d,00,61,00,65,00,2c,\
00,37,00,71,00,39,00,2a,00,44,00,58,00,64,00,55,00,40,00,45,00,50,00,69,00,\
3d,00,00,00,00,00
配置成功后,在MODI的OCR選項卡里,“OCR語(yǔ)言”即可看到“日語(yǔ)”。
在簡(jiǎn)體中文環(huán)境下,按照上述步驟設置后,用MODI識別出來(lái)的日文是GBK編碼,可以在支持GBK字符集的簡(jiǎn)體中文環(huán)境下正常顯示、編輯。
需要從韓文MODI復制到簡(jiǎn)體MODI文件夾下的文件為:
DATASIM.DAT
HANGULLB.DAT
KRCODE.UNI
KRDIST.DAT
KRPRINT.DAT
KRSERHT.DAT
KRTREE.DAT
TW_KU.DAT
TW_UK.DAT
TWCUTCKR.DLL
TWCUTLKR.DLL
TWKSC32.DLL
TWLAYKR.DLL
TWRECK.DLL
需要導入的reg內容為:
Windows Registry Editor Version 5.00
[HKEY_CURRENT_USER\Software\Microsoft\Installer\Components\61BA386016BD0C340BBEAC273D84FD5F]
"1042"=hex(7):31,00,5d,00,67,00,41,00,56,00,6e,00,2d,00,7d,00,66,00,28,00,5a,\
00,58,00,66,00,65,00,41,00,52,00,36,00,2e,00,6a,00,69,00,4f,00,43,00,52,00,\
5f,00,31,00,30,00,34,00,32,00,3e,00,30,00,61,00,45,00,4d,00,61,00,65,00,2c,\
00,37,00,71,00,39,00,2a,00,44,00,58,00,64,00,55,00,40,00,45,00,50,00,69,00,\
3d,00,00,00,00,00
配置成功后,在MODI的OCR選項卡里,“OCR語(yǔ)言”即可看到“朝鮮語(yǔ)”。
在簡(jiǎn)體中文環(huán)境下,按照上述步驟設置后,用MODI識別出來(lái)的韓文是韓文編碼(charset:129),可以存為HTML、doc,并能在Word里正常顯示、編輯。如果存為T(mén)XT,則不能在簡(jiǎn)體中文環(huán)境下顯示、編輯。
如果需要在繁體中文環(huán)境下OCR簡(jiǎn)體中文,最正宗的方法是下載、安裝一個(gè)簡(jiǎn)體MODI:
http://www.microsoft.com/downloads/details.aspx?familyid=dd172063-9517-41d8-82af-29c38f7437b6&displaylang=zh-tw
當然如果想省事,也可以復制下列文件:
SCCODE.UNI
SCPRINT.DAT
SCPRINT2.DAT
SCSERHT.DAT
SCTREE.DAT
TW_GU.DAT
TW_UG.DAT
TWGB32.DLL
需要導入的reg內容為:
Windows Registry Editor Version 5.00
[HKEY_CURRENT_USER\Software\Microsoft\Installer\Components\61BA386016BD0C340BBEAC273D84FD5F]
"2052"=hex(7):4d,00,6a,00,33,00,47,00,51,00,66,00,5e,00,62,00,54,00,3f,00,42,\
00,3f,00,56,00,50,00,24,00,5e,00,62,00,53,00,6c,00,6c,00,3e,00,25,00,6d,00,\
45,00,4d,00,61,00,65,00,2c,00,37,00,71,00,39,00,2a,00,44,00,58,00,64,00,55,\
00,40,00,45,00,50,00,69,00,3d,00,00,00,00,00
本站僅提供存儲服務(wù),所有內容均由用戶(hù)發(fā)布,如發(fā)現有害或侵權內容,請點(diǎn)擊舉報。
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
用Pdg2Pic、TextForever實(shí)現批量OCR
用MODI OCR 21種語(yǔ)言
如何在微軟Office Document Imaging中添加日文OCR ?
譯言網(wǎng) | OCR給力基礎指南:把文字從圖像中狠狠地抓出來(lái)
(ocr相關(guān))老馬提取的微軟MODI獨立安裝包和21種語(yǔ)言包等(接口開(kāi)放)
Office2010簡(jiǎn)體與繁體文字怎么轉換
更多類(lèi)似文章 >>
生活服務(wù)
分享 收藏 導長(cháng)圖 關(guān)注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服

欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久