欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費電子書(shū)等14項超值服

開(kāi)通VIP
元碼漢字輸入法 ——漢字編碼由必然王國邁向自由王國之路
前 言
方法就是世界。
在計算機技術(shù)普及教育和推廣應用中,同樣也證明了這一真理。
計算機進(jìn)入我國之后,為了向廣大群眾普及計算機技術(shù),把“BASIC”語(yǔ)言的學(xué)習列為計算機普及教育的首要內容。似乎要學(xué)會(huì )操作計算機就必須從“BASIC”學(xué)起。那時(shí)“BASIC”語(yǔ)言鋪天蓋地而來(lái)。在以“BASIC”語(yǔ)言為中心的計算機普及教育中,我與大多數人一樣,不得不因為普及教育“方法”不對,而半途而廢了。當時(shí)覺(jué)得我與計算機是今身無(wú)緣了。
九十年代中期,聯(lián)合國和美國電腦專(zhuān)家對我國提出警告:指出以“BASIC”語(yǔ)言為中心的課程是第一大危害。如不徹底改變方向,計算機教學(xué)將面臨最大的災難。這時(shí),計算機的普及教育由“語(yǔ)言程序設計”為中心轉變到了以學(xué)習“應用軟件”為中心。從此以后,計算機技術(shù)普及教育取得了極大成效。
一天,閑來(lái)無(wú)事,我踏進(jìn)了老鄉——我省著(zhù)名作家王東滿(mǎn)的家門(mén)。他正在電腦上寫(xiě)作——于是又激起了我學(xué)習電腦的熱情。此時(shí)我已進(jìn)入“知命”之年了,但學(xué)習熱情不減當年。這次是從學(xué)習“應用軟件”著(zhù)手,學(xué)習效果極好。
但在學(xué)習電腦中,發(fā)現拼音太慢、五筆太難;我體會(huì )到漢字輸入是橫在中國人面前的第一道門(mén)檻!
中國中文信息學(xué)會(huì )原理事長(cháng)著(zhù)名學(xué)者錢(qián)偉長(cháng)曾指出:“理想的漢字輸入方法還沒(méi)有實(shí)現”。國家漢字編碼委員會(huì )專(zhuān)家陳一凡教授認為:易學(xué),是漢字鍵盤(pán)輸入方法能否向全社會(huì )推廣普及的關(guān)鍵。企盼有一種易學(xué)而快捷的漢字輸入方法,已成為專(zhuān)家學(xué)者和億萬(wàn)人民長(cháng)久以來(lái)的共同愿望。偌大的一個(gè)國家,有幾億人使用電腦,沒(méi)有一個(gè)較好的輸入方法確實(shí)是不行的!我再一次體會(huì )到了“方法”的重要性!于是,我投入了漢字輸入法的研究探索。工夫不負有心人,經(jīng)過(guò)對漢字的深入剖析,我拋開(kāi)以往落后的漢字編碼理論,另辟溪徑,大膽地提出了元碼漢字結構元素論;精心選擇出116個(gè)字根部件,統一其讀音后,將拼音的第一個(gè)字母與英文鍵盤(pán)字母一一對應地設置,為漢字字根部件與英文鍵盤(pán)之間架起了一座橋梁,揭示了數萬(wàn)漢字與英文鍵盤(pán)內在聯(lián)系的規律,使數萬(wàn)漢字與英文鍵盤(pán)的矛盾得到了完美的統一,徹底免除了人們死記硬背鍵盤(pán)字根之苦,首次實(shí)現了漢字從無(wú)理?yè)幋a到有理?yè)幋a的飛躍!——她的獨創(chuàng )性和新穎性獲得了國家知識產(chǎn)權局的認可,元碼漢字輸入法已被授予國家發(fā)明專(zhuān)利權。
元碼面世后,先后被中國發(fā)明協(xié)會(huì )、中國科協(xié)、全國科技貿易促進(jìn)委員會(huì )和日內瓦國際專(zhuān)利技術(shù)成果博覽會(huì )、聯(lián)合國世界知識組織(WIPO)舉辦的第二十二屆伯爾尼國際專(zhuān)利技術(shù)成果博覽會(huì )評為金獎。受到了國家語(yǔ)委中文信息學(xué)會(huì )漢字編碼委員會(huì )權威專(zhuān)家的首肯、國家教委電教辦專(zhuān)家的贊揚、中國計算機學(xué)會(huì )普及委員會(huì )主任清華大學(xué)博士生導師吳文虎教授的題辭和推薦。山西省計算機學(xué)會(huì )等單位聯(lián)合發(fā)文推薦使用。
元碼漢字輸入法確實(shí)是一個(gè)理想的漢字輸入方法!
本書(shū)目的之一是想把這一理想的漢字輸入方法推薦給讀者。
本書(shū)目的之二是想把這一嶄新的“高效學(xué)習、高速輸入”的訓練方法呈獻給朋友們。
作者衷心希望這兩個(gè)“方法”能為您打開(kāi)一片嶄新的天地!
本書(shū)可作為計算機應用和中文信息處理等相關(guān)專(zhuān)業(yè)的研究生、大中小學(xué)生的輔助教材或參考書(shū),也適合于作為計算機應用培訓班的初級教材使用。本書(shū)融理論、實(shí)用、資料于一體,這對于關(guān)心漢字鍵盤(pán)輸入技術(shù)的計算機用戶(hù)是有一定益處的。
在本書(shū)寫(xiě)作過(guò)程中,山西省計算機軟件協(xié)會(huì )主席、山西大學(xué)劉開(kāi)瑛教授,原山西省科委戰略研究所所長(cháng)、山西省電腦流動(dòng)培訓中心主任何吉成研究員,山西省計算機學(xué)會(huì )和山西省經(jīng)濟信息中心張如浩主任,太原市教委計算機培訓中心劉曉琴老師給予了大量指導和審閱工作;中國計算機學(xué)會(huì )普及委員會(huì )主任、奧林匹克計算機中國隊總教練、清華大學(xué)計算機科學(xué)系博士生導師吳文虎教授和國家教委電教辦劉曉漪專(zhuān)家、山西省省長(cháng)助理、省信息化領(lǐng)導組組長(cháng)張澤宇都給予了熱情關(guān)懷和支持;國家語(yǔ)委漢字編碼委員會(huì )專(zhuān)家陳一凡教授在百忙中為本書(shū)作序,在此一并致以衷心的感謝!
最后,向一切關(guān)心和支持“元碼”工作的領(lǐng)導、同事和家人致以崇高的敬意!
由于作者水平所限,本書(shū)一定存在不少缺點(diǎn)和錯誤,敬請廣大讀者批評指正。
作者  2010年5月于太原
信息高速公路入口處的漢字輸入(代序)
陳一凡
一  “萬(wàn)碼奔騰”的編碼潮
經(jīng)過(guò)技術(shù)、成本、市場(chǎng)檢驗,80年代初整字輸入大鍵盤(pán)、部件輸入中鍵盤(pán)讓位給特征信息編碼通用鍵盤(pán)。用通用鍵盤(pán)輸入漢字需要對字進(jìn)行特征信息編碼,而漢字所攜帶的音、形、義信息又如此豐富,于是一時(shí)間各種漢字編碼方案此呼彼應,發(fā)明迭起,百花齊放,色彩紛呈。大眾傳媒把某些編碼方案譽(yù)為“中國的第五大發(fā)明”,將某些設計喻為“造福于子孫萬(wàn)代”,攻克了“漢字的哥德巴赫猜想”是“當代的倉頡”,這些贊譽(yù)固然有失偏頗,卻是從一個(gè)側面反映了負載在古老表意圖形文字上的漢字信息進(jìn)入信息高速公路的艱難。
1.“編碼潮”涌動(dòng)的歷史背景
碼長(cháng)短、重碼率低意味著(zhù)可以快速輸入。
代表輸入速度的碼長(cháng)和重碼率與代表能否為公眾接受的易學(xué)性構成了推動(dòng)漢字編碼發(fā)展的主矛盾。
同是代表輸入速度素質(zhì)的碼長(cháng)和重碼率之間又存在難以克服的矛盾:碼長(cháng)短了重碼率就高,降低重碼率勢必要增加碼長(cháng)。這是推動(dòng)漢字編碼的次矛盾。
為了解決這兩個(gè)矛盾,優(yōu)美、復雜、字集大得驚人的表意圖形文字——漢字,給有志于攻克這一難題的眾多編碼發(fā)明家提供了廣闊的想象空間。萬(wàn)馬奔騰一陣后,一個(gè)簡(jiǎn)單的結論是:“好學(xué)的編碼打不快,打得快的不好學(xué)”。實(shí)例是“拼音好學(xué)打不快,形碼難學(xué)打得快”。
能否發(fā)明一種形碼或音形碼,即解決上述兩個(gè)矛盾,激勵著(zhù)眾多仁人志士涌入到編碼大潮,發(fā)明、專(zhuān)利,層出不窮,但卻始終不能沖破漢字輸入計算機這一“瓶頸”。
2.三個(gè)指標
平均碼長(cháng)(average code length)  在輸入給定的測試樣本時(shí),測得的輸入每個(gè)漢字的平均擊鍵次數。
字編碼重碼率(coincident code rate for chinesecharacter)  在給定的漢字字符集范圍內,字編碼碼本中重碼字的字數與字符集字數的比值。
易學(xué)性:掌握某種輸入方法所需要的學(xué)習期。
平均碼長(cháng)和重碼率都是速度指標,可以定量考核。易學(xué)性是能否推廣的關(guān)鍵因素,缺乏可操作的定量評測辦法。
3.詞輸入迎來(lái)了漢字輸入的小陽(yáng)春
我們可以從兩個(gè)方面出發(fā)考慮以詞語(yǔ)為單位提取其特征信息進(jìn)行編碼比以字為單位編碼輸入更為合理。
首先,從語(yǔ)言學(xué)的角度考慮,在句子中具有獨立運用的最小音(形)義結合單位是詞,字只是書(shū)寫(xiě)和組成詞的單位。詞的特征信息在某些方面比字的特征更具確定性,如字的多個(gè)義項在詞中只有一個(gè)被激活。
再從信息論的角度來(lái)看,孤立漢字的零階熵為9.71bit/字,詞的零階熵為11.46bit/詞。目前多數漢字鍵盤(pán)輸入方法使用26個(gè)字母鍵進(jìn)行碼長(cháng)為4的字、詞編碼,顯然詞編碼信息利用率遠遠高于字編碼。
下面先對字音類(lèi)、字形類(lèi)字特征信息編碼和詞特征信息編碼的輸入效率和編碼規則作一比較。
表1  拼音輸入法
詞條字數
編碼規則
例  子
碼長(cháng)(鍵/字)
單字詞、字
聲韻調選
“叢”CONG2 2
5
雙字詞
聲韻聲韻
“籬笆”LIBA
2
三字詞
聲韻聲聲
“計算機”JISJ
1.3
多字詞
聲聲聲聲
“中華人民共和國”ZHRG
0.7
表2-1 元碼輸入法(音形類(lèi))
詞條字數
編碼規則
例  子
碼長(cháng)(鍵/字)
單字詞、字
聲1部1部2部末
“叢”人人一RRH
4
雙字詞
聲1聲12部11部12
“籬笆”竹竹BLZZ
2
三字詞
聲1聲12聲3U
“計算機”JSJU
1.3
多字詞
聲1聲2聲3聲末
“中華人民共和國” ZHRG
0.7
表2-2  元碼輸入法(部件類(lèi))
詞條字數
編碼規則
例  子
碼長(cháng)(鍵/字)
單字詞、字
部1部2部3部末
“叢”人人一RRH
4
雙字詞
部11部12部21部22
“籬笆”竹丶竹巴ZDZZ
2
三字詞
部11部21部31U
“計算機”讠竹木YZMU
1.3
多字詞
部11部21部31部末1
“中華人民共和國” KRPK
0.7
從上面幾類(lèi)典型的輸入方法我們可以見(jiàn)到,在字輸入情況下,平均碼長(cháng)為3~5鍵/字,當采用詞語(yǔ)輸入后,平均碼長(cháng)將大幅度下降。如高頻字、高頻詞采用簡(jiǎn)碼輸入,首選字、詞自動(dòng)上屏,則平均碼長(cháng)將降到2鍵/字左右。這樣,以詞語(yǔ)輸入為主的輸入方法,輸入效率比字輸入提高一倍以上。
再從詞語(yǔ)特征信息提取和編碼規則來(lái)看,音碼類(lèi)從二字詞開(kāi)始不必提取音素中最難以確定的聲調,音形碼類(lèi)不再需要字形部分,三字以上詞則最易提取的聲母為主要特征信息;部件類(lèi)二字詞只提取每個(gè)字前兩部件,三字以上詞則以最易提取的第一部件為主要特征信息。由此可見(jiàn),各類(lèi)輸入方法的詞語(yǔ)特征信息提取均較字特征信息容易,減輕了操作人員的腦力負擔,提高了易用性。
綜合以上分析,提取詞語(yǔ)特征信息進(jìn)行編碼輸入比提取字特征信息進(jìn)行編碼輸入具有以下優(yōu)點(diǎn):
⑴縮短了碼長(cháng),提高輸入效率一倍以上;
⑵簡(jiǎn)化了編碼規則,減輕了操作者人工編碼的腦力負擔,降低出錯率。
二  規范與標準
“書(shū)同文”推動(dòng)了漢文化的發(fā)展。漢字信息要順暢地進(jìn)入當代的信息高速公路,僅靠“萬(wàn)碼奔騰”,勢必形成“瓶頸”堵塞。因此,不但需要“書(shū)同文”,還需要“車(chē)同軌”。從1980年開(kāi)始,特別是九十年代后期以來(lái),國家有關(guān)部門(mén)制定了一系列規范和標準,這些規范和標準為漢字進(jìn)入信息高速公路創(chuàng )造了條件。與漢字鍵盤(pán)輸入有關(guān)的標準和規范主要有:
1.編碼字符集國家標準
GB 2312-80  信息交換用漢字編碼字符集  基本集,6763個(gè)漢字。
GB 13000.1-93  信息技術(shù) 通用多八位編碼字符集(UCS) 第一部分:體系結構與基本多文種平面,20902個(gè)漢字。
GB 18030.2000  信息技術(shù) 信息交換用漢字編碼字符集  基本集的擴充,27484個(gè)漢字。
2.鍵盤(pán)輸入國家標準
GB 18031-2000 信息技術(shù) 數字鍵盤(pán)漢字輸入通用要求
GB (待定)   信息技術(shù) 通用鍵盤(pán)漢字輸入通用要求
3.國家語(yǔ)委有關(guān)規范
GF 3011-1997 信息處理用GB13000.1字符集漢字部件規范
GF 3002-1999 GB13000.1字符集漢字筆順規范
GB 3006-2001 漢語(yǔ)拼音方案的通用鍵盤(pán)表示規范
三  智能化與簡(jiǎn)約化
早在20世紀80年代中期得到周有光先生支持的計算機軟件設計高手廣東小伙子林才松嘗試漢語(yǔ)拼音句輸入開(kāi)發(fā),想法超前,卻“生不逢時(shí)”,當時(shí)的微型計算機IBMPC/XT和長(cháng)城0520-A以及操作系統CCDOS對他的理想“愛(ài)莫能助”,不得不中斷了研究。
到了90年代后期,“句輸入”、“字段處理”等“后處理”軟件不斷取得可喜的進(jìn)步,以拼音輸入為突破口,在學(xué)科上屬于人工智能自然語(yǔ)言理解的“重碼字、詞”自動(dòng)識別日臻完善,不但為漢語(yǔ)拼音輸入帶來(lái)了艷陽(yáng)天,也為“形碼”的規范化、簡(jiǎn)約化創(chuàng )造了條件。智能化漢字鍵盤(pán)輸入的信息處理流程見(jiàn)圖1。
編碼               軟件
                                   層次               層次
                         外部碼           內部碼            內部碼            內部碼
圖1 90年代中、后期至當前的漢字鍵盤(pán)輸入系統的信息流程
技術(shù)特點(diǎn):
⑴ “字為基礎、詞為主導、智能處理”的漢字鍵盤(pán)輸入系統使得部分或大部分重碼字、詞根據語(yǔ)法關(guān)系或語(yǔ)用統計等方法,由“后處理”軟件人工智能選定,人工鍵選的重碼字、詞大大減少,同時(shí)也縮短了平均碼長(cháng)。在GB 18031等國家標準中,由“鍵選率”替代“重碼率”作為考核輸入系統的重要指標。
⑵ 在后處理軟件支持下,編碼層次趨向規范化、易學(xué)化,拼音(全拼、簡(jiǎn)拼、雙拼)、筆畫(huà)等簡(jiǎn)易編碼輸入方法在廣大計算機用戶(hù)群中普及。招聘文秘的條件由“熟練掌握五筆字型”轉向“熟練使用office軟件”。
四  “萬(wàn)碼奔騰”成為歷史,世紀難題終將破解
1.從開(kāi)發(fā)人腦到開(kāi)發(fā)電腦
從圖1我們可以看到,漢字鍵盤(pán)輸入系統(chinese character inputsystem with universal keybard)是由編碼層次和軟件層次兩部分構成,這兩個(gè)層次互相補充,互為依托,構成完整的輸入系統?!案哳l先見(jiàn)”、“聯(lián)想”到“自動(dòng)識別重碼字、詞”,軟件智能化的程度在不斷提高。那么什么是漢字鍵盤(pán)輸入系統的智能化?簡(jiǎn)單地說(shuō)就是賦予計算機一定的有關(guān)漢字、漢語(yǔ)的語(yǔ)法、語(yǔ)用知識,計算機根據這些知識,由軟件來(lái)識別、選定重碼字、詞,而不是由人工選定重碼字、詞。計算機智能化的過(guò)程也就是計算機用戶(hù)“傻瓜”化的過(guò)程,正如裝置了微處理器的照像機具有自動(dòng)變焦、自動(dòng)測定感光量成為“傻瓜”相機一樣。智能化漢字鍵盤(pán)輸入軟件結構示意見(jiàn)圖2。
外部碼         內部碼
圖2  漢字鍵盤(pán)輸入智能化軟件結構示意圖
2.此電腦非彼電腦
數字式計算機從1946年發(fā)明至今工作原理未變,性能的提高卻越來(lái)越快。反映計算機的性能有兩個(gè)主要指標:處理數據的速度和存儲數據的容量。從80年代初以Intel8080為中央處理器(CPU)的IBMPC/XT或長(cháng)城0520微型計算機,到時(shí)今各種品牌的以奔騰Ⅲ為CPU的微電腦,體積依舊,處理速度卻提高了近2,000倍,存儲容量增加近100,000倍,見(jiàn)表3。
表3    1984年至2003年流行微型計算機的主要性能比較
年代
CPU型號
時(shí)鐘頻率
(MHZ)
處理位數
(bit)
內存容量
(KByte)
硬盤(pán)容量
(MByte)
1984
1992
2003
Intel8088
Intel486
PentiumⅣ
4.7
66
2500
8
16
32
512
1600
2560000
10
120
819200
漢字鍵盤(pán)輸入系統是計算機中文應用系統的一個(gè)不可缺少的子系統,它的功效需由計算機系統軟硬件資源的支持。如果把Intel8080時(shí)期的信息處理比喻為一條能通行獨輪車(chē)的土路的話(huà),PⅣ構筑的就是高速公路。
3.萬(wàn)“碼”奔騰成為歷史,世紀難題終將破解
表3所示微型計算機軟硬件資源的不斷擴展,提供給漢字鍵盤(pán)輸入系統軟件層次的空間越來(lái)越大,支持越來(lái)越有力,漢字輸入的智能化程度勢必由量變發(fā)生質(zhì)變。20年來(lái)漢字鍵盤(pán)輸入系統的軟件規模的擴張情況見(jiàn)表4。
表4  從 字輸入到句(段)輸入軟件規模比較
年代
操作系統
字處理軟件
輸入方式
輸入軟件規模
(KByte)
1984
1992
2003
CCDOS
CCDOS
Windows9x,xp
Edline
Wardstar
Word2000
字輸入
字、詞混合輸入
智能處理字、詞輸入
40~60
120~180
103~5×105
80年代初,微型計算機是“傻瓜”,簡(jiǎn)單的軟件支撐復雜的編碼,絞盡腦汁的設計出各種編碼是在開(kāi)發(fā)人腦,漢字編碼進(jìn)入興盛期;90年代末,微型機被調教得“聰明”——智能化起來(lái),簡(jiǎn)單、規范的編碼配上復雜的軟件是在開(kāi)發(fā)電腦,漢字編碼進(jìn)入規范、簡(jiǎn)約期。計算機用戶(hù)省時(shí)、省腦地輸入漢字,權當充起“傻瓜”的角色。
在計算機軟硬件資源構筑的信息處理高速公路上,智能輸入軟件成為漢字進(jìn)入信息高速公路的立交橋。一系列國家標準和規范為漢字進(jìn)入信息高速公路制定了交通規則,也指明了發(fā)展趨勢。
漢字鍵盤(pán)輸入的研究和產(chǎn)品更新進(jìn)入了開(kāi)發(fā)電腦的階段,同時(shí)也明確發(fā)出了社會(huì )拒絕接受“80年代型漢字編碼”的信號。
聰穎的華夏祖先創(chuàng )造了漢字和中華文化,智慧的炎黃子孫解決了漢字快速輸入計算機這一世紀難題。
4.快速的漢字鍵盤(pán)輸入
漢字比拼音文字以更快的速度用通用鍵盤(pán)輸入計算機已成為事實(shí),有例為證。下面是一段內容相同的英文文本和中文文本:
英文文本“The bank must obey its customer's instructions andmot those of anyone eles ,When,for example,a customer first opens an account,heinstructs the bank to debit his account only in respect of cheques drawn byhimself.”
中文文本“銀行必須服從客戶(hù)的指示,而不是別人的指示。例如,當一個(gè)客戶(hù)第一次開(kāi)戶(hù)時(shí),他指示銀行僅以他簽發(fā)的支票付款?!?div style="height:15px;">
用鍵盤(pán)輸入英文,每輸入一個(gè)字母擊一鍵,詞間空格也是一鍵,上面兩句英文輸入計算機共需擊鍵204次。同樣內容的中文共52字(包括標點(diǎn)符號),若用元碼輸入,共擊鍵107次,輸入速度是英文鍵盤(pán)輸入的1.9倍,每個(gè)漢字平均擊鍵才2.05次。
*陳一凡系國家語(yǔ)委漢字編碼委員會(huì )委員、北京信息工程學(xué)院教授
本站僅提供存儲服務(wù),所有內容均由用戶(hù)發(fā)布,如發(fā)現有害或侵權內容,請點(diǎn)擊舉報。
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
國內輸入法專(zhuān)利一覽(3)
輸入法分類(lèi)
漢字編碼 百科
輸入法
怎樣打五筆
漢字學(xué)概要(北師大精品課程)07
更多類(lèi)似文章 >>
生活服務(wù)
分享 收藏 導長(cháng)圖 關(guān)注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服

欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久