一、圖林與人工智能
介紹人工智能, 不能不從圖林說(shuō)起。英國著(zhù)名學(xué)者 阿蘭·圖林(A. Turing) 不僅以“紙上下棋機”率先探討了下棋與機器智能的聯(lián)系,他還是舉世公認的“人工智能之父”。
圖林的一生充滿(mǎn)著(zhù)未解之謎,他就象上天派往下界的神祗 ,匆匆而來(lái),又匆匆而去,為人間留下了智慧,留下了深邃的思想,后人必須為之思索幾十年甚至幾百年。
許多文獻甚至提出,圖林不僅是“人工智能之父”,他也是“計算機之父”。曾擔任過(guò)馮·諾依曼助手的美國學(xué)者弗蘭克爾這樣寫(xiě)到:“許多人都推舉馮·諾依曼為‘計算機之父‘,然而我確信他本人從來(lái)不會(huì )促成這個(gè)錯誤?;蛟S,他可以被恰當地稱(chēng)為助產(chǎn)士,但是他曾向我,并且我肯定他也曾向別人堅決強調:如果不考慮巴貝奇、阿達和其他人早先提出的有關(guān)概念,計算機的基本概念屬于圖林。”
正是馮·諾依曼本人親手把“計算機之父”的桂冠轉戴在圖林頭上。直到現在,計算機界仍有個(gè)一年一度“圖林獎” ,由美國計算機學(xué)會(huì )(ACM)頒發(fā)給世界上最優(yōu)秀的電腦科學(xué)家,像科學(xué)界的諾貝爾獎金那樣,是電腦領(lǐng)域的最高榮譽(yù)。阿蘭·圖林以其獨特的洞察力提出了大量有價(jià)值的理論思想,似乎都成為計算機發(fā)展史不斷追逐的目標,不斷地被以后的發(fā)展證明其正確性。
圖林1912年6月23日出生于英國倫敦,孩提時(shí)代性格活潑好動(dòng)。3歲那年,他進(jìn)行了在科學(xué)實(shí)驗方面的首次嘗試──把玩具木頭人的胳膊掰下來(lái)種植到花園里,想讓它們長(cháng)成更多的木頭人。 8歲時(shí),圖林嘗試著(zhù)寫(xiě)了一部科學(xué)著(zhù)作,題名《關(guān)于一種顯微鏡》,這個(gè)小孩雖然連單詞都拼錯了許多,但畢竟寫(xiě)得還像那么回事。在書(shū)的開(kāi)頭和結尾,圖林都用同一句話(huà)“首先你必須知道光是直的”前后呼應,但中間的內容很短很短,可謂短得破了科學(xué)著(zhù)作的紀錄。
1931年,圖林考入英國劍橋皇家學(xué)院。大學(xué)畢業(yè)后留校任教,不到一年,他就發(fā)表了幾篇很有份量的數學(xué)論文,被選為皇家學(xué)院最年輕的研究員,年僅22歲。1937年,倫敦權威的數學(xué)雜志又收到圖林一篇論文《論可計算數及其在判定問(wèn)題中的應用》,作為闡明現代電腦原理的開(kāi)山之作,被永遠載入了計算機的發(fā)展史冊。這篇論文原本是為了解決一個(gè)基礎性的數學(xué)問(wèn)題:是否只要給人以足夠的時(shí)間演算,數學(xué)函數都能夠通過(guò)有限次機械步驟求得解答?傳統數學(xué)家當然只會(huì )想到用公式推導證明它是否成立,可是圖林獨辟蹊徑地想出了一臺冥冥之中的機器。
圖林想象的機器說(shuō)起來(lái)很簡(jiǎn)單:該計算機使用一條無(wú)限長(cháng)度的紙帶,紙帶被劃分成許多方格,有的方格被畫(huà)上斜線(xiàn),代表“1”;有的沒(méi)有畫(huà)任何線(xiàn)條,代表“0”。該計算機有一個(gè)讀寫(xiě)頭部件,可以從帶子上讀出信息,也可以往空方格里寫(xiě)下信息。該計算機僅有的功能是:把紙帶向右移動(dòng)一格,然后把“1”變成“0”,或者相反把“0”變成“1”。
圖林設計的“理想計算機”被后人稱(chēng)為“圖林機”,實(shí)際上是一種不考慮硬件狀態(tài)的計算機邏輯結構。圖林還提出可以設計出另一種“萬(wàn)能圖林機”,用來(lái)模擬其它任何一臺“圖林機”工作,從而首創(chuàng )了通用計算機的原始模型。圖林甚至還想到把程序和數據都儲存在紙帶上,比馮·諾依曼更早提出了“儲存程序”的概念。
阿蘭·圖林對計算機科學(xué)的貢獻也并非停留在“紙上談兵”。在第二次世界大戰期間,圖林應征入伍,在戰時(shí)英國情報中心“布雷契萊莊園”(Bletchiy)從事破譯德軍密碼的工作,與戰友們一起制作了第一臺密碼破譯機。在圖林理論指導下,這個(gè)“莊園”后來(lái)還 研制出破譯密碼的專(zhuān)用電子管計算機“巨人”(Colossus),在盟軍諾曼底登陸等戰役中立下了豐功偉績(jì)。
1945年,脫下軍裝的圖林,帶著(zhù)大英帝國授予的最高榮譽(yù)勛章,被錄用為泰丁頓國家物理研究所高級研究員。由于有了布雷契萊的實(shí)踐,他提交了一份“自動(dòng)計算機”的設計方案,領(lǐng)導一批優(yōu)秀的電子工程師,著(zhù)手制造一種名叫ACE的電腦。1950年, ACE電腦樣機 公開(kāi)表演,被認為是當時(shí)世界上最快最強有力的電子計算機之一。
1950年,圖林來(lái)到曼徹斯特大學(xué)任教,并被指定為該大學(xué)自動(dòng)計算機項目的負責人。就在這年10月, 他的又一篇劃時(shí)代論文《計算機與智能》 發(fā)表。這篇文章后來(lái)被改名為《機器能思維嗎?》,它引來(lái)的驚雷,今天還在震撼著(zhù)電腦的世紀。在“第一代電腦”占統治地位的時(shí)期,這篇論文甚至可以作為“第五代電腦”和“第六代電腦”的宣言書(shū)。
圖林寫(xiě)道:你無(wú)法制造一臺替你思考的機器,這是人們一般會(huì )毫無(wú)疑義接受下來(lái)的老生長(cháng)談。我的論點(diǎn)是:與人腦的活動(dòng)方式極為相似的機器是可以制造出來(lái)的。更有趣的是,圖林還設計了一個(gè)“圖林試驗”,試圖通過(guò)讓機器模仿人回答某些問(wèn)題,判斷它是否具備智能。圖林試驗采用“問(wèn)”與“答”模式,即觀(guān)察者通過(guò)控制打字機向兩個(gè)試驗對象通話(huà),其中一個(gè)是人,另一個(gè)是機器。要求觀(guān)察者不斷提出各種問(wèn)題,從而辨別回答者是人還是機器。圖林還為這項試驗親自擬定了幾個(gè)示范性問(wèn)題:
問(wèn): 請給我寫(xiě)出有關(guān)“第四號橋”主題的十四行詩(shī)。
答:不要問(wèn)我這道題,我從來(lái)不會(huì )寫(xiě)詩(shī)。
問(wèn):34957加70764等于多少?
答:(停30秒后)105721
問(wèn):你會(huì )下國際象棋嗎?
答:是的。
問(wèn):我在我的K1處有棋子K;你僅在K6處有棋子K,在R1處有棋子R?,F在輪到你走,你應該下那步棋?
答:(停15秒鐘后)棋子R走到R8處,將軍!
圖林指出:“如果機器在某些現實(shí)的條件下,能夠非常好地模仿人回答問(wèn)題,以至提問(wèn)者在相當長(cháng)時(shí)間里誤認它不是機器,那么機器就可以被認為是能夠思維的。”
從表面上看,要使機器回答按一定范圍提出的問(wèn)題似乎沒(méi)有什么困難,可以通過(guò)編制特殊的程序來(lái)實(shí)現。然而,如果提問(wèn)者并不遵循常規標準,編制回答的程序是極其困難的事情。例如,提問(wèn)與回答呈現出下列狀況:
問(wèn):你會(huì )下國際象棋嗎?
答:是的。
問(wèn):你會(huì )下國際象棋嗎?
答:是的。
問(wèn):請再次回答,你會(huì )下國際象棋嗎?
答:是的。
你多半會(huì )想到,面前的這位是一部笨機器。如果提問(wèn)與回答呈現出另一種狀態(tài):
問(wèn): 你會(huì )下國際象棋嗎?
答:是的。
問(wèn):你會(huì )下國際象棋嗎?
答:是的,我不是已經(jīng)說(shuō)過(guò)了嗎?
問(wèn):請再次回答,你會(huì )下國際象棋嗎?
答:你煩不煩,干嘛老提同樣的問(wèn)題。
那么,你面前的這位,大概是人而不是機器。上述兩種對話(huà)的區別在于,第一種可明顯地感到回答者是從知識庫里提取簡(jiǎn)單的答案,第二種則具有分析綜合的能力,回答者知道觀(guān)察者在反復提出同樣的問(wèn)題。“圖林試驗”沒(méi)有規定問(wèn)題的范圍和提問(wèn)的標準,如果想要制造出能通過(guò)試驗的機器,以我們現在的技術(shù)水平,必須在電腦中儲存人類(lèi)所有可以想到的問(wèn)題,儲存對這些問(wèn)題的所有合乎常理的回答,并且還需要理智地作出選擇。
圖林曾預言,隨著(zhù)電腦科學(xué)和機器智能的發(fā)展,本世紀末將會(huì )出現這樣的機器。在這點(diǎn)上,圖林也過(guò)于樂(lè )觀(guān)。但是,“圖林試驗”大膽地提出“機器思維”的概念,為人工智能確定了奮斗的目標,并指明了前進(jìn)的方向。
經(jīng)過(guò)人工智能學(xué)者幾十年不懈努力,目前的電腦已經(jīng)“學(xué)習”得相當“聰明”。1993年11月,美國波士頓電腦博物館曾公開(kāi)舉行了一次“圖林試驗”。該博物館聘請了10位沒(méi)有受過(guò)電腦訓練的波士頓市民充當裁判,他們的任務(wù)是通過(guò)14分鐘問(wèn)答交談,判別參賽者是電腦還是人。 經(jīng)過(guò)3小時(shí)的試驗,居然有4個(gè)軟件騙過(guò)了至少1位裁判,它們侃談的話(huà)題分別是人際關(guān)系和大學(xué)生活等。有人不解地問(wèn)道:難道圖林的預言已經(jīng)實(shí)現了?一位程序編制者解釋說(shuō):參賽的軟件都是圍繞特定的話(huà)題先存入了許多問(wèn)題和答案,機器根據裁判提問(wèn)中的關(guān)鍵詞對號入座,無(wú)非故意摹仿人作答時(shí)的語(yǔ)氣來(lái)“欺騙”裁判??茖W(xué)家仍然一致認為,要完全按照圖林的設想不規定話(huà)題,那么人工智能還要走過(guò)漫長(cháng)的路程。比賽組委會(huì )也對實(shí)現這一目標的軟件選手懸賞10萬(wàn)美金。
1954年,圖林就要跨進(jìn)他人生的第42個(gè)年頭,風(fēng)華正茂,正處于生命最輝煌的創(chuàng )造巔峰期,計算機科學(xué)界翹首等待著(zhù)他新的發(fā)現和發(fā)明。6月8日清晨,圖林的女管家象往常一樣走進(jìn)他的臥室,臺燈還亮著(zhù),書(shū)桌上放著(zhù)一封準備寄出的信,床頭柜上有個(gè)只吃了一小半的蘋(píng)果。圖林安祥地沉睡在床上,他永遠地睡著(zhù)了,再也沒(méi)有醒來(lái)……
阿蘭·圖林,一顆正在升起的巨星突然隕落,巨大的噩耗震驚了全世界。就在他吃剩的那只蘋(píng)果里,法醫檢驗出氰化鉀殘液。朋友們絕不相信所謂“圖林服毒自殺”的傳聞,認為圖林可能死于無(wú)法解釋的意外事故,他的死無(wú)疑是電腦科學(xué)界的巨大損失。
圖林開(kāi)創(chuàng )了計算機科學(xué)的重要分支──人工智能,雖然他當時(shí)并沒(méi)有明確使用這個(gè)術(shù)語(yǔ)。把“圖林獎”獲獎?wù)咦饕唤y計后就會(huì )發(fā)現,許多電腦科學(xué)家恰好是在人工智能領(lǐng)域作出的杰出貢獻。例如,1969年“圖林獎”獲得者是哈佛大學(xué)的明斯基(M.Minsky);1971年“圖林獎”獲得者是達特莫斯大學(xué)的麥卡錫(J.McCarthy);1975年“圖林獎”則由卡內基—梅隆大學(xué)的紐厄爾(A. Newell)和赫伯特·西蒙(H.Simon)共同獲得。正是這些人,把圖林開(kāi)創(chuàng )的事業(yè)演繹為意義深遠的“達特莫斯會(huì )議”。
二、達特莫斯會(huì )議
1956年夏天, 美國達特莫斯大學(xué)(Dartmouth)召開(kāi)了一次影響深遠的歷史性會(huì )議。這次聚會(huì )本來(lái)屬于朋友間沙龍式的學(xué)術(shù)研討,與會(huì )者也僅僅只有10個(gè)人。主要發(fā)起人是該校青年助教 麥卡錫 ,此外會(huì )議發(fā)起者還有哈佛大學(xué)明斯基、貝爾實(shí)驗室申龍(E.Shannon)和IBM公司信息研究中心羅徹斯特(N. Lochester),他們邀請了卡內基—梅隆大學(xué)紐厄爾和赫伯特·西蒙、麻省理工學(xué)院塞夫里奇(O. Selfridge)和索羅門(mén)夫(R.Solomamff),以及IBM公司塞繆爾(A.Samuel)和莫爾(T.More)。這些青年學(xué)者的研究專(zhuān)業(yè)包括數學(xué)、心理學(xué)、神經(jīng)生理學(xué)、信息論和電腦科學(xué),分別從不同的角度共同探討人工智能的可能性。他們的名字人們并不陌生,例如申龍是《信息論》的創(chuàng )始人,塞繆爾編寫(xiě)了第一個(gè)電腦跳棋程序,麥卡錫、明斯基、紐厄爾和西蒙都是“圖林獎”的獲獎?wù)摺?
達特莫斯會(huì )議歷時(shí)長(cháng)達兩個(gè)多月,學(xué)者們在充分討論的基礎上,首次提出了“人工智能” (Artificial Intelligence)這一術(shù)語(yǔ),標志著(zhù)人工智能(AI)作為一門(mén)新興學(xué)科正式誕生。
智能是人類(lèi)具有的特征之一,然而,對于什么是人類(lèi)智能(或者說(shuō)智力),科學(xué)界至今還沒(méi)有給出令人滿(mǎn)意的定義。有人從生物學(xué)角度定義為“中樞神經(jīng)系統的功能”,有人從心理學(xué)角度定義為“進(jìn)行抽象思維的能力”,甚至有人同義反復地把它定義為“獲得能力的能力”,或者不求甚解地說(shuō)它“就是智力測驗所測量的那種東西”。正如《大不列顛百科全書(shū)》指出的那樣,這些定義并未被人們所普遍接受。既然連人類(lèi)智能都無(wú)法給出精確的定義,對人工智能也只好眾說(shuō)紛紜了。例如,西蒙認為:AI是學(xué)會(huì )怎樣編制計算機程序完成機智的行為,學(xué)習人類(lèi)怎樣做這些機智行為;明斯基則認為人工智能一方面幫助人的思考,另一方面使計算機更有用。鑒于圖林是用行為來(lái)判斷機器是否具有智能,麻省理工學(xué)院溫斯頓(P. Winston)在A(yíng)I教科書(shū)里下定義說(shuō):“人工智能就是研究如何使計算機去做過(guò)去只有人才能做的智能的工作。”
讓我們姑且接受溫斯頓的這種含糊的定義,它至少使我們明確了,達特莫斯會(huì )議確立的這一新興學(xué)科,研究的對象仍然是一種電腦系統,這種電腦能夠表現出人類(lèi)智力活動(dòng)的特征,從而延伸和“放大”人類(lèi)的智能。
無(wú)可辯駁的事實(shí)說(shuō)明,現代電腦是一種具有高超能力的機器,它的種類(lèi)多,價(jià)格低,體積小,用途廣,它在計算、控制和數據處理方面,廣泛替代人類(lèi)完成了大量的工作,甚至比人做得更加出色。那么,不妨仿照“圖林試驗”,請它做幾件簡(jiǎn)單的工作,探討這種機器的智能究竟能達到多高的水平。讓世界上運算速度最高的超級電腦計算一個(gè)小小的題目:“樹(shù)上有10只鳥(niǎo),被獵人用槍打下1只, 問(wèn)樹(shù)上還剩下幾只鳥(niǎo)? ” 這臺超級電腦或許對此不屑一顧, 或許會(huì )在0.0000000001秒時(shí)間內, 斬釘截鐵地輸出答案“9只!”如果你把同樣的問(wèn)題問(wèn)小學(xué)一年級學(xué)生,有誰(shuí)會(huì )回答說(shuō)是“9只”呢?連小學(xué)生都能正確推理的問(wèn)題,電腦卻不會(huì )。
幼兒園的孩子也能自己橫穿馬路。老師告訴他:過(guò)馬路前先向兩邊看,附近沒(méi)有汽車(chē)再橫穿。小朋友記住了這些常識,即使在較遠處有駛來(lái)的汽車(chē),他也敢于不慌不忙穿過(guò)馬路?,F在,假如有一位盲人也想橫穿馬路,請來(lái)電腦幫助計算。那么,電腦會(huì )向他提出各種問(wèn)題:馬路寬度是多少米?附近有汽車(chē)嗎?最近的一輛離我們多遠?時(shí)速是每小時(shí)多少公里?這些都是電腦計算所必須輸入的基本數據,它不會(huì )根據生活常識進(jìn)行模糊判斷。
無(wú)須把“試驗”繼續進(jìn)行下去。凡是長(cháng)期與電腦打交道的人難免會(huì )產(chǎn)生這些的感覺(jué):一方面,電腦能計算出10億位的π值,能快速處理全國人口普查的海量數據,能精確地控制宇宙飛船登上月球的每一步驟,使任何聰明絕頂的人在它面前都相形見(jiàn)絀;另一方面,電腦的智力水平可以說(shuō)連普通3歲孩童都不如。 正如1980年國外有人給它下的一個(gè)通俗的定義:“快速的、按規矩行事的傻子機器。”。
人工智能科學(xué)想要解決的問(wèn)題,是讓電腦也具有人類(lèi)那種聽(tīng)、說(shuō)、讀、寫(xiě)、思考、學(xué)習、適應環(huán)境變化、解決各種實(shí)際問(wèn)題等等能力。換言之,人工智能是電腦科學(xué)的一個(gè)重要分支,它的近期目標是讓電腦更聰明、更有用,它的遠期目標是使電腦變成“像人一樣具有智能的機器”。
1956年作為人工智能興起的標志事出有因:就在這一年,塞繆爾的《跳棋機》電腦程序研制成功,揭開(kāi)了機器挑戰人類(lèi)智能的序幕,直到40年后把卡斯帕洛夫逼下了“棋王”寶座,機器博弈也成為AI研究的一個(gè)重要領(lǐng)域。
三、機器數學(xué)家
1956年AI研究另外一個(gè)重大的突破,是 紐厄爾、赫伯特·西蒙 等人合作編制的《邏輯理論機》數學(xué)定理證明程序(簡(jiǎn)稱(chēng)LT),從而使機器邁出了邏輯推理的第一步。
在卡內基—梅隆大學(xué)的計算機實(shí)驗室,紐厄爾和西蒙從分析人類(lèi)解答數學(xué)題的技巧入手,讓一些人對各種數學(xué)題作周密的思考,要求他們不僅寫(xiě)出求解的答案,而且說(shuō)出自己推理的方法和步驟。通過(guò)大量的觀(guān)察實(shí)例,紐厄爾和赫伯特·西蒙廣泛收集了人類(lèi)求解一般性問(wèn)題的各種方案。他們發(fā)現,人們求解數學(xué)題通常是用試湊的辦法進(jìn)行的,試湊時(shí)不一定列出了所有的可能性,而是用邏輯推理來(lái)迅速縮小搜索范圍。
經(jīng)過(guò)反復的實(shí)驗,紐厄爾和赫伯特·西蒙進(jìn)一步認識到,人類(lèi)證明數學(xué)定理也有類(lèi)似的思維規律,通過(guò)“分解”(把一個(gè)復雜問(wèn)題分解為幾個(gè)簡(jiǎn)單的子問(wèn)題)和“代入”(利用已知常量代入未知的變量)等方法,用已知的定理、公理或解題規則進(jìn)行試探性推理,直到所有的子問(wèn)題最終都變成已知的定理或公理,從而解決整個(gè)問(wèn)題。人類(lèi)求證數學(xué)定理也是一種啟發(fā)式搜索,與電腦下棋的原理異曲同工。
在實(shí)驗結果的啟發(fā)下,紐厄爾和赫伯特·西蒙便利用這個(gè)LT程序向數學(xué)定理發(fā)起了激動(dòng)人心的沖擊。電腦果然不孚眾望,它一舉證明了數學(xué)家羅素的數學(xué)名著(zhù)《數學(xué)原理》第二章中的38個(gè)定理。1963年,經(jīng)過(guò)改進(jìn)的LT程序在一部更大的電腦上,最終完成了第二章全部52條數學(xué)定理的證明?;谶@一成功,紐厄爾和赫伯特·西蒙把LT程序擴充到人類(lèi)求解一般問(wèn)題的過(guò)程,設想用機器模擬具有普遍意義的人類(lèi)思維活動(dòng)。他們編制了能解答十種類(lèi)型不同問(wèn)題的“通用問(wèn)題求解程序” (GPS),從而開(kāi)拓出人工智能中“問(wèn)題求解”的一大領(lǐng)域。
在紐厄爾和赫伯特·西蒙之后,美籍華人學(xué)者、洛克菲勒大學(xué)教授王浩在“自動(dòng)定理證明”上獲得了更大的成就。1959年,王浩用他首創(chuàng )的“王氏算法”,在一臺速度不高的IBM704電腦上再次向《數學(xué)原理》發(fā)起挑戰。不到9 分鐘,王浩的機器把這本數學(xué)史上視為里程碑的著(zhù)作中全部(350條以上) 的定理,統統證明了一遍。該書(shū)作者、數學(xué)大師羅素得知此事后感慨萬(wàn)端,他在信里寫(xiě)到:“我真希望,在懷海特和我浪費了10年的時(shí)間用手算來(lái)證明這些定理之前,就知道有這種可能。”王浩教授因此被國際上公認為機器定理證明的開(kāi)拓者之一。
人工智能定理證明研究最有說(shuō)服力的例子, 是機器證明了困擾數學(xué)界長(cháng)達100余年之久的難題──“四色定理”。據說(shuō),“四色問(wèn)題”最早是1852年由一位21歲的大學(xué)生提出來(lái)的數學(xué)難題:任何地圖都可以用最多四種顏色著(zhù)色,就能區分任何兩相鄰的國家或區域。這個(gè)看似簡(jiǎn)單的問(wèn)題,就象“哥德巴赫猜想”一樣,屬于世界上最著(zhù)名的數學(xué)難題之一。
1976年6月,美國伊利諾斯大學(xué)的兩位數學(xué)家沃爾夫岡·哈肯(W.Haken)和肯尼斯·阿佩爾(K. Apple) 宣布, 他們成功地證明了這一定理,使用的方法就是機器證明。當“四色定理”被證明的消息傳出后,許多大學(xué)的教師都紛紛中斷講課,打開(kāi)香檳酒以示慶賀。在該定理被證明的所在地伊利諾斯州烏班納,連郵政局員工都欣喜若狂,他們在寄出的所有信件上都加蓋了“四色是足夠的”字樣郵戳。
哈肯和阿佩爾攻克這一難題使用的方法仍然是前人常用的“窮舉歸納法”,只是用手工計算無(wú)論如何也不能“窮舉”所有的可能性。哈肯和阿佩爾編制出一種很復雜的程序,讓3臺IBM360電腦自動(dòng)高速尋找各種可能的情況, 并逐一判斷它們是否可以被“歸納”。十幾天后, 共耗費1200個(gè)機時(shí),做完200億個(gè)邏輯判斷,電腦終于證明了“四色定理”。雖然至今有些從事純數學(xué)研究的學(xué)者仍對此半信半疑,那冗長(cháng)乏味的證明難道就是最后結論? 他們毫無(wú)辦法來(lái)驗證電腦是否真正給出了答案,200億個(gè)邏輯判斷是凡人不可能逐一檢驗的天文數字。如果你有興趣深入探討,可以自己去研究《伊利諾斯數學(xué)雜志》第21卷刊載的檢驗表,那張表足有460頁(yè)厚,可能會(huì )消磨掉你10年的光陰。
攻克“四色定理”似乎應該昭示機器證明時(shí)代的來(lái)臨??墒?,直到今天,它仍然是著(zhù)名數學(xué)難題被電腦證明的絕無(wú)僅有的一例。人工智能先驅們認真地研究下棋,研究機器定理證明,但效果仍不盡如人意。問(wèn)題的癥結在于,雖然機器能夠解決一些極其錯綜復雜的難題,但是有更多的工作,對人來(lái)說(shuō)是簡(jiǎn)單到不能再簡(jiǎn)單的事情,對電腦卻難似上青天。
人類(lèi)的智能最重要的部分,可能并不是慎密的邏輯推理,而是能掌握和運用那些極普通的常識,有效地解決現實(shí)問(wèn)題。60年代末,由于許多世界一流的人工智能學(xué)者過(guò)高地估計了智能電腦的能力,而現實(shí)卻一再無(wú)情地打破了他們樂(lè )觀(guān)的夢(mèng)想,以致遭到越來(lái)越多的嘲笑和反對。AI研究曾一度墮入低谷,出現了所謂“黑暗時(shí)期”。
四、知識就是力量
“長(cháng)江后浪推前浪”,1977年,曾是赫伯特·西蒙的研究生、斯坦福大學(xué)青年學(xué)者費根鮑姆(E.Feigenbaum),在第五屆國際人工智能大會(huì )上提出了“知識工程”的概念,標志著(zhù)AI研究從傳統的以推理為中心,進(jìn)入到以知識為中心的新階段。人工智能重新獲得人們的普遍重視,逐步跨進(jìn)了復興期。
在大學(xué)的一次講演中,費根鮑姆向聽(tīng)眾發(fā)起挑戰:“各位正在研究博弈問(wèn)題,下棋和邏輯推理都屬于博弈。假如你們解決了下棋和邏輯推理,那么博弈問(wèn)題也就得到了解決,各位正在做的僅此而已。請大家跨入真實(shí)世界,努力解決現實(shí)世界中的問(wèn)題吧!”他具體介紹了他們開(kāi)發(fā)的第一個(gè)“專(zhuān)家系統”,并提出“知識庫”、“知識表達”和“知識工程”等一系列全新的概念。
要說(shuō)明什么是“專(zhuān)家系統”,必須弄清什么是人類(lèi)“專(zhuān)家”。一個(gè)人要成為專(zhuān)家,至少必須掌握某一學(xué)科淵博的知識,具有豐富的實(shí)踐經(jīng)驗,能解決一般人不能夠解決的疑難問(wèn)題。專(zhuān)家的數量和質(zhì)量標志著(zhù)一個(gè)國家、一個(gè)時(shí)代的科學(xué)水平。
費根鮑姆構建的“專(zhuān)家系統”,就是要在機器智能與人類(lèi)智慧集大成者──專(zhuān)家的知識經(jīng)驗之間建造橋梁。他解釋說(shuō):專(zhuān)家系統“是一個(gè)已被賦予知識和才能的計算機程序,從而使這種程序所起到的作用達到專(zhuān)家的水平。”這種“專(zhuān)家水平”意味著(zhù)醫學(xué)教授作出診斷和治療的水平,高級工程師從事工程技術(shù)研究和開(kāi)發(fā)的水平,特級教師在課堂上傳授知識的水平。專(zhuān)家系統是人類(lèi)專(zhuān)家可以信賴(lài)的高水平智力助手。
人類(lèi)專(zhuān)家的知識通常包括兩大類(lèi)。一類(lèi)是書(shū)本知識,它可能是專(zhuān)家在學(xué)校讀書(shū)求學(xué)時(shí)所獲,也可能是專(zhuān)家從雜志、書(shū)籍里自學(xué)而來(lái);然而,僅僅掌握了書(shū)本知識的學(xué)者還不配稱(chēng)為專(zhuān)家,專(zhuān)家最為寶貴的知識是他憑借多年的實(shí)踐積累的經(jīng)驗知識,這是他頭腦中最具魅力的知識瑰寶。在A(yíng)I研究里,這類(lèi)知識稱(chēng)之為“啟發(fā)式知識”。
由于專(zhuān)家本人不一定了解電腦程序,構建專(zhuān)家系統還必須有所謂“知識工程師”參與,幫助領(lǐng)域專(zhuān)家從頭腦中挖掘啟發(fā)式知識,并設計知識庫和知識推理程序。因此,專(zhuān)家系統又被稱(chēng)為知識工程,據說(shuō),這兩種不同的稱(chēng)謂在英國和日本涇渭分明:英國學(xué)界崇尚科學(xué),成為專(zhuān)家是人們追逐的境界;而日本學(xué)界推崇技術(shù),工程師是人們向往的職業(yè),于是,才有了“專(zhuān)家系統”與“知識工程”兩種同義的名稱(chēng)。
1965年, 在斯坦福大學(xué)化學(xué)專(zhuān)家的配合下,費根鮑姆研制的第一個(gè)專(zhuān)家系統DENDRAL是化學(xué)領(lǐng)域的“專(zhuān)家”。在輸入化學(xué)分子式和質(zhì)譜圖等信息后,它能通過(guò)分析推理決定有機化合物的分子結構,其分析能力已經(jīng)接近、甚至超過(guò)了有關(guān)化學(xué)專(zhuān)家的水平。該專(zhuān)家系統為AI的發(fā)展樹(shù)立了典范,其意義遠遠超出了系統本身在實(shí)用上創(chuàng )造的價(jià)值。在費根鮑姆發(fā)表演講后, 專(zhuān)家系統如同雨后春筍迅速遍及世界各地。為繼承DRNDRAL的衣缽,化學(xué)領(lǐng)域判斷結構的專(zhuān)家系統大量涌現,有判斷蛋白質(zhì)結構的,有判定原子排列結構的,有推論未知化合物分子結構的,目前已呈汗牛充棟之勢。此外,在極其廣泛的領(lǐng)域, 人工智能研究者構建了不計其數的“電腦專(zhuān)家” 。 如數學(xué)專(zhuān)家MACSYMA,農業(yè)專(zhuān)家PLANT,生物專(zhuān)家MOLGEN,地質(zhì)探礦專(zhuān)家PROSPECTOR,教育專(zhuān)家GUIDON,法律專(zhuān)家LDS,軍事專(zhuān)家ACES、ADEPT、ANALYST等系統。
專(zhuān)家系統最成功的實(shí)例之一, 是1976年美國斯坦福大學(xué)肖特列夫(Shortliff)開(kāi)發(fā)的醫學(xué)專(zhuān)家系統MYCIN,這個(gè)系統后來(lái)被知識工程師視為“專(zhuān)家系統的設計規范”。MYCIN主要用于協(xié)助醫生診斷腦膜炎一類(lèi)的細菌感染疾病。在MYCIN的知識庫里,大約存放著(zhù)450條判別規則和1000條關(guān)于細菌感染方面的醫學(xué)知識。它一邊與用戶(hù)進(jìn)行對話(huà),一邊進(jìn)行推理診斷。它的推理規則稱(chēng)為“產(chǎn)生式規則”,類(lèi)似于:“IF(打噴嚏)OR(鼻塞)OR(咳嗽),THEN(有感冒癥狀)”這種醫生診斷疾病的經(jīng)驗總結,最后顯示出它“考慮”的可能性最高的病因,并以給出用藥的建議而結束。
80年代以后的專(zhuān)家系統逐步朝著(zhù)大型化、集成化發(fā)展,使它從狹窄的專(zhuān)業(yè)領(lǐng)域走向寬廣的多科領(lǐng)域,知識工程開(kāi)始具備了方法學(xué)的性質(zhì)。例如,上述那個(gè)著(zhù)名的醫學(xué)專(zhuān)家系統MYCIN被研究者抽掉其具體醫學(xué)知識內容而構成一個(gè)框架系統EMYCIN, 如果向其中充實(shí)其他學(xué)科的具體知識,它就能變成不同學(xué)科領(lǐng)域的專(zhuān)家??梢哉J為,EMYCIN成了一種“建造專(zhuān)家系統的專(zhuān)家系統”。
費根鮑姆是人工智能領(lǐng)域的后來(lái)者,他以“知識工程”的創(chuàng )新思想,最終躋身于人工智能一代宗師的行列。1994年,第二屆世界專(zhuān)家系統大會(huì )又提出鮮明的主題:“專(zhuān)家系統向21世紀全面推進(jìn)”,再次表明費根鮑姆倡導的知識工程在未來(lái)世紀強大的生命力。早在17世紀初,英國哲學(xué)家培根提出了“知識就是力量”的著(zhù)名論斷。面對人工智能學(xué)科的迅猛發(fā)展,費根鮑姆充滿(mǎn)激情地補充說(shuō):“知識就是力量,電子計算機則是這種力量的放大器,而能把人類(lèi)知識予以放大的機器,也會(huì )把一切方面的力量予以放大。”
五、會(huì )看會(huì )聽(tīng)的機器
1997年12月,美國微軟公司比爾·蓋茨第五次訪(fǎng)問(wèn)中國,為在中國舉辦的微軟專(zhuān)業(yè)開(kāi)發(fā)人員大會(huì )助陣。在清華大學(xué)等處的演講中,蓋茨先生一方面說(shuō)到美國已有40%的家庭擁有個(gè)人電腦,一方面又反復強調這個(gè)數量還是太少。他認為,必須讓電腦能夠識別自然語(yǔ)言,才能使電腦走出專(zhuān)家的圈子,普及到每個(gè)家庭。當介紹到微軟正在著(zhù)手開(kāi)發(fā)手寫(xiě)輸入和語(yǔ)音識別軟件時(shí),比爾·蓋茨當場(chǎng)為聽(tīng)眾播放了一段電腦識別人體語(yǔ)言的錄像,精彩的情節引起了與會(huì )者濃厚的興趣。 人們看到一臺電腦正在分辨人用點(diǎn)頭或搖頭表示YES和NO的動(dòng)作,還有電腦跟蹤人眼的指向,在眼睛的指揮下,下了一盤(pán)“三子棋”。
比爾·蓋茨提及的人體動(dòng)作識別、手寫(xiě)輸入和語(yǔ)音識別,都屬于人工智能模式識別的范疇, 它要在實(shí)現電腦與人交流的基礎上, 使電腦變成像人一樣“會(huì )看”、“會(huì )聽(tīng)”的“智能動(dòng)物”。
人之所以能夠根據外界環(huán)境做出相應的反應,是因為人可以感知紛繁復雜的信息并加以識別。電腦也需要有像人類(lèi)那樣的感覺(jué)器官接受信息,進(jìn)而根據信息分辨和識別外界各種事物。目前在多媒體電腦里,我們已經(jīng)為它配置了一大批“感覺(jué)器官”,即外部輸入設備,如鍵盤(pán)、鼠標、掃描儀、觸摸屏、話(huà)筒、數字攝像機……,類(lèi)似于人的五官之類(lèi)的東西應有盡有。然而,電腦把外界輸入的有所信息統統都轉換成比特方式儲存,它自己并不知道“看到”和“聽(tīng)到”的是什么東西。
模式識別是近30年來(lái)得到迅速發(fā)展的人工智能分支學(xué)科。但是,對于什么是“模式”,或者什么是機器(也包括人)能夠辨認的模式,迄今尚無(wú)確切的定義。這里,我們又一次遇到了如同定義“人工智能”一樣的困惑。我們只能形象地解釋說(shuō),人之所以能識別圖象、聲音、動(dòng)作,文字字形、面部表情等等,因為它們都存在著(zhù)反映其特征的某種模式。這種解釋仍屬同義反復,根本沒(méi)有詮釋模式的內涵和外延。連人工智能專(zhuān)家卡納爾(L.Kanal)也認為:“如果一旦出現了對模式的定義并被證實(shí)能夠推動(dòng)理論的發(fā)展,那將標志著(zhù)人類(lèi)智力的一大進(jìn)步。雖然如此,目前的局面并不影響模式識別在各領(lǐng)域中廣泛的應用。”
電腦模式識別技術(shù)最初起源于圖象識別的需要,比如協(xié)助警方根據照片從茫茫人海里搜尋某個(gè)罪犯,或者幫助醫生把顯微鏡下觀(guān)察的細菌形態(tài)進(jìn)行分類(lèi),確認它是球菌、桿菌還是弧菌。嚴格地說(shuō),模式識別又不是簡(jiǎn)單的分類(lèi)學(xué),它的目標包括對于識別對象的描述、理解與綜合。
如果不是電腦,而是人腦接受到視覺(jué)器官(如眼睛和視網(wǎng)膜)傳遞來(lái)的信息,它究竟是怎樣識別和區分大千世界的萬(wàn)物呢?一種可能的解決方案是:圖象上的每一點(diǎn)都用一個(gè)神經(jīng)細胞與之對應并逐一判別,最后綜合為整體;但是,既使只描述圖象局部的大致輪廓,神經(jīng)元的數目仍不敷使用。另一種可能的方案更符合實(shí)際:大腦感知的不是圖象上所有的點(diǎn),而是其輪廓中最典型的特征,如線(xiàn)段、角度、弧度、反差、顏色等等,把它們從圖象中抽取出來(lái),然后結合頭腦中過(guò)去的記憶和有關(guān)經(jīng)驗和知識分析判斷。“特征抽取”也是電腦圖象識別的基礎。若根據一張照片讓電腦在一群人中間辨認出某個(gè)人,可以先把這張照片輸入電腦,抽取照片上人像上的特征,比如鼻子、嘴巴、眼睛和輪廓特點(diǎn),進(jìn)行分類(lèi)和加工,存放在機器里作為識別那個(gè)人的“模板”。然后,讓所有的人都接受光電設備的掃描,把他們的圖象與機器預先存放的“模板”一一匹配。只要待辨認的人躲在這群人中間,哪怕他化了裝,留了長(cháng)發(fā),蓄了胡須,也逃不脫電腦的“火眼金睛”。這種圖象識別方法又稱(chēng)為“模板匹配”,它已經(jīng)廣泛運用于公安部門(mén)識別犯罪嫌疑人的偵破工作。
有消息報道說(shuō), 1990年日本研制的人像識別機,可在1秒鐘內中從3500人中識別到你要找的人。1997年我國武漢市公安部門(mén),也首次成功地運用這項技術(shù)破獲了一起犯罪案件。此外,用電腦識別指紋的技術(shù)已日趨成熟,美國、日本等發(fā)達國家正在運用電腦管理上百萬(wàn)甚至上千萬(wàn)人的指紋檔案, 世界上最快速的指紋識別系統,可以在0.1秒內查證出某個(gè)人的相關(guān)資料。近年來(lái),由于互聯(lián)網(wǎng)絡(luò )的興起,指紋識別的應用已經(jīng)擴展到金融、出入境、戶(hù)政、上下班打卡等管理工作,指紋將作為辨別個(gè)人身份的特殊“印章”。
進(jìn)一步“使電腦能夠辨認人的臉部和表情,”正如《數字化生存》作者尼葛洛龐帝教授指出的那樣,“是一個(gè)令人生畏的技術(shù)挑戰。”據說(shuō)在八十年代末期,日本研制了一個(gè)根據人臉辨別出不同人種的識別程序,并將它送到國際智能學(xué)術(shù)會(huì )議上展示。一位黃皮膚黑眼睛的日本人上前接受檢驗,電腦正確地指出“這是日本人”??墒?,當一位金發(fā)碧眼白皮膚的西方學(xué)者第二個(gè)接受檢驗時(shí),電腦經(jīng)過(guò)長(cháng)時(shí)間的“思考”后,居然顯示出“這不是人”的結論,引來(lái)滿(mǎn)場(chǎng)大笑,程序設計者趕快把程序語(yǔ)句修改為顯示“不認識”,可這也于事無(wú)補。
圖象模式識別技術(shù)比較成功的運用領(lǐng)域是文字識別。如果把每一個(gè)中文漢字或西文字母都視為一個(gè)小圖形,模板匹配的方法自然可以移植到文字識別過(guò)程中。目前, 印刷體文字識別軟件早已經(jīng)進(jìn)入商品化階段,被稱(chēng)為OCR光學(xué)字符識別軟件。通??蓪?shū)籍、報紙等印刷品上的文字用掃描儀輸入,首先經(jīng)過(guò)特征抽取處理,例如,某字的筆畫(huà)有幾筆,收尾端點(diǎn)有幾個(gè),拐角有多少等等。在電腦里已經(jīng)預先保存了各種字的圖形和它們的特征,也稱(chēng)為“模板”,全部模板就構成一部“模板字典庫”。由于要考慮字體、字號、紙張、油墨等因素影響,每一個(gè)字都有若干套不同的模板。接下來(lái)就是將抽取到的文字特征與模板字典逐一匹配,直到在字典庫中尋找到最接近的模板為止。運用這種方法,對于印刷體文字,電腦能夠以“一目十行”的速度進(jìn)行閱讀。此外,實(shí)時(shí)跟蹤人手寫(xiě)字的筆畫(huà)順序來(lái)識別手寫(xiě)文字的模式識別技術(shù),也已經(jīng)達到實(shí)用化程度,諸如常見(jiàn)的漢字筆輸入軟件。
不過(guò),目前難以攻克的技術(shù)難關(guān)是所謂“脫機識別手寫(xiě)文字”,即讓電腦看懂事前寫(xiě)在紙上的手寫(xiě)文字。如果也采用類(lèi)似印刷體文字識別的模板匹配方法識別手寫(xiě)漢字,由于每個(gè)人的手寫(xiě)字體和書(shū)寫(xiě)習慣絕不會(huì )完全相同,12億中國人就需要12億套模板,每套模板都必須儲存數以萬(wàn)計的漢字,叫電腦從何匹配?為了做好手寫(xiě)漢字脫機識別的基礎工作,我國科學(xué)家曾從不同范圍、不同職業(yè)、不同文化程度的大量書(shū)寫(xiě)人員中選擇了一批有代表性的典型樣本,建立了1000套樣張的手寫(xiě)漢字樣本庫,每套樣張均包括近4000個(gè)常用漢字。雖然這是一項浩瀚的工程,但在脫機手寫(xiě)漢字識別研究進(jìn)程中,也僅僅走出了一小步。
人類(lèi)相互之間交流思想,除“讀寫(xiě)”之外的重要途徑是“聽(tīng)說(shuō)”,電腦語(yǔ)音識別理所當然被列為與圖象識別同等重要的人工智能技術(shù)。阿拉伯神話(huà)《天方夜譚》描寫(xiě)說(shuō),阿里巴巴大聲喊道:芝麻,開(kāi)門(mén)吧!大門(mén)立刻應聲而敞開(kāi)。用口令控制電腦的動(dòng)作,或者根據口述聲音錄入文字,設計出“會(huì )聽(tīng)話(huà)”的電腦,同樣是人工智能多年來(lái)追逐的目標。就電腦處理而言,聲音信息與圖象信息并沒(méi)有太大的差別,語(yǔ)音識別方法以及面臨的難題基本上大同小異。與“視覺(jué)”輸入設備掃描儀對應的“聽(tīng)覺(jué)”輸入設備是話(huà)筒,語(yǔ)音識別的基礎技術(shù)也是模式識別。
通常,每個(gè)人說(shuō)話(huà)的音色和音調都有一定的差異,發(fā)聲頻率各不相同。人腦對語(yǔ)音似乎有一種自適應的能力,既能區分不同性別不同年齡的語(yǔ)音差異,又能調整為能夠理解的基本音素,從而聽(tīng)懂各色人等說(shuō)出的話(huà)語(yǔ)。采用模板匹配方式的電腦不可能具備這種本領(lǐng),它通常只能“聽(tīng)懂”特定某人的聲音,而且是經(jīng)過(guò)了一段時(shí)間“學(xué)習”的結果。學(xué)習過(guò)程稱(chēng)為“訓練”,即對著(zhù)電腦大聲重復地講述某些字詞,直到它把這些字詞的聲音頻譜特征“記住”,存放在參考樣本庫作為識別這個(gè)字詞的模板。如果換了另一人說(shuō)話(huà),電腦就不能正確地識別,這就是對說(shuō)話(huà)者的依賴(lài)性,也叫“認人”的識別系統。此外,語(yǔ)音識別對說(shuō)話(huà)者使用的詞匯必須作出限制,否則要求電腦具有極大的存儲容量和極高的處理速度。根據語(yǔ)言學(xué)家估計, 電腦若要聽(tīng)懂經(jīng)常使用的2萬(wàn)個(gè)英語(yǔ)詞匯的普通人說(shuō)英語(yǔ),需要達到每秒執行1000億條指令的速度,大約是我國研制的銀河Ⅰ號巨型機的1000倍。
1997年,一年一度的美國Comdex世界電腦大展展示了迄今為止最先進(jìn)的語(yǔ)音識別技術(shù)。過(guò)去的識別軟件人們必須學(xué)著(zhù)像機器人那樣說(shuō)話(huà),以便在字與字之間留出停頓;目前出臺的識別軟件大幅度提高了準確性,允許用戶(hù)以正常的語(yǔ)音語(yǔ)調輸入。但是,這些軟件仍需要一個(gè)耗時(shí)較長(cháng)的人機培訓過(guò)程,以便電腦對用戶(hù)語(yǔ)音特點(diǎn)進(jìn)行記憶。也就是說(shuō),這些電腦的“聽(tīng)覺(jué)”仍然是認人的,并且只“聽(tīng)得懂”規定的詞匯,不可能陪你海闊天空地侃大山。據報道,美國IBM公司積26年語(yǔ)音技術(shù)研究之功底,針對比較流行的7種國際語(yǔ)言開(kāi)發(fā)了商品化的語(yǔ)音聽(tīng)寫(xiě)軟件,技術(shù)處于國際領(lǐng)先地位。當年10月,該公司率先推出了第一臺非特定人連續語(yǔ)句的中文語(yǔ)音識別系統Via Voice4.0,配置了用于聽(tīng)寫(xiě)的語(yǔ)音感知字處理器,實(shí)現了漢字輸入“動(dòng)口不動(dòng)手”,每分鐘可輸入漢字200個(gè)以上。但是,即使你用標準普通話(huà)講話(huà),仍然需要隨時(shí)人工干預糾錯;而操方言講話(huà)者,則需根據“口音適應”提示,至少需要54句話(huà)、40分鐘或一個(gè)小時(shí)的訓練時(shí)間,即通過(guò)訓練使電腦適應你的口音,不斷更新儲存在內存里的個(gè)人語(yǔ)言模板庫,這種軟件也沒(méi)有完全脫離“認人”的約束。
直到1998年12月,IBM公司發(fā)布了代表中文語(yǔ)音識別技術(shù)真正進(jìn)入實(shí)用的第二代技術(shù)ViaVoice98,詞庫量是ViaVoice4.0的三倍,同時(shí)增加了語(yǔ)音導航功能;在普通話(huà)的基礎上能適應廣東、四川、上海三種口音,識別率提高了20個(gè)百分點(diǎn)以上,平常速度口音讀一般文章的識別率達到了85%~95%,并具備自適應功能,快速口音適應只需訓練5個(gè)詞、3句話(huà),5分鐘左右即可建立一個(gè)語(yǔ)音模型,使中文語(yǔ)音識別技術(shù)取得了實(shí)質(zhì)性突破,語(yǔ)音識別終于走到了用戶(hù)面前,使人們感到上下求索后初見(jiàn)光明的興奮。
至于“會(huì )說(shuō)話(huà)”的電腦,目前基本上有兩種解決方案,其一是“真人發(fā)聲”,即事先錄制好人說(shuō)的話(huà)語(yǔ),再由電腦來(lái)“鸚鵡學(xué)舌”,這當然只能局限為某些特定的話(huà)語(yǔ);其二是語(yǔ)音合成,某些文字校對軟件已經(jīng)在使用這種技術(shù)。電腦合成的語(yǔ)音聽(tīng)起來(lái)就像在“念字”、“說(shuō)詞”而不是“說(shuō)話(huà)”。不信你可以試著(zhù)運行市場(chǎng)上發(fā)售的一些文字校對商品軟件,由于無(wú)法做到抑揚頓挫、聲情并茂的誦讀,電腦單調的念白實(shí)在令人大倒胃口。經(jīng)過(guò)多年努力,電腦說(shuō)話(huà)的能力已經(jīng)越來(lái)越強,然而,要想象趙忠祥那樣動(dòng)情地講解《動(dòng)物世界》,或者像宋世雄那樣鏗鏘有力地解說(shuō)足球比賽,這些語(yǔ)音合成技術(shù)產(chǎn)品顯然還難以勝任。
同樣是在1998年,中文語(yǔ)音合成技術(shù)也取得了實(shí)質(zhì)性的突破。令人欣慰的是,在這一領(lǐng)域的成功者是我國國家863計劃專(zhuān)家組。863計劃先后支持了清華大學(xué)、中科院聲學(xué)所、中國科技大學(xué)等八家單位進(jìn)行語(yǔ)音合成技術(shù)攻關(guān)。中國科技大學(xué)人機語(yǔ)音通信實(shí)驗室,在十幾年語(yǔ)音技術(shù)研究和積累的基礎上,毅然拋棄了國際通行的算法,獨創(chuàng )了以“人聲道模擬技術(shù)”為基礎的KD—863系統,一舉突破了語(yǔ)音合成清晰度和自然度的制約瓶頸,將語(yǔ)音合成技術(shù)推進(jìn)到應用的水平。1998年3月,該系統被評為唯一“達到實(shí)用化水平的產(chǎn)品”,其語(yǔ)音清晰度達到了95%,自然度達到4分(5分為標準播音員水平)。1998年初,以國家智能計算機中心等單位組建的天音軟件公司,迅速完成了中文語(yǔ)音合成技術(shù)產(chǎn)品的轉化,推出的“天音話(huà)王”軟件,具有語(yǔ)音校對、文稿朗讀、標準普通話(huà)學(xué)習等功能,率先讓電腦開(kāi)口說(shuō)出了中國話(huà)。1999年,該公司與IBM合作,又推出了代表中文語(yǔ)音識別和合成技術(shù)最高水平的產(chǎn)品——“中國話(huà)王”,向著(zhù)全方位應用大踏步地邁進(jìn)。
人工智能模式識別的進(jìn)展,已經(jīng)在一定程度上使電腦具備了“聽(tīng)”、“說(shuō)”、“讀”的能力,但距離理想的目標還有較長(cháng)的路程。對于人類(lèi)來(lái)說(shuō),哪怕你把字寫(xiě)得龍飛鳳舞,哪怕你把話(huà)說(shuō)得含糊不清,我們也能根據對上下文的理解做出正確的識別,它表明人腦模式識別的方法,不是或者不完全是什么“模板匹配”。對與模糊信息的識別處理,人腦比電腦要擅長(cháng)得多。此外,電腦儲存的模板庫或樣本庫,與它的判斷識別機構兩相分離,當模板庫容量十分龐大時(shí),搜索匹配就顯得力不從心;而人腦記憶的知識與其判斷機構渾然一體,它的模式識別是尋找、運用知識的思維決策。
從廣義上理解,“模式”普遍存在于各種事物之中。人或者電腦下棋,是對著(zhù)法和棋局模式的識別;人或者電腦診斷疾病,是對病人癥狀和病理模式的識別。此外,地質(zhì)探礦、天氣預報、產(chǎn)品質(zhì)量檢驗……乃至市場(chǎng)預測、經(jīng)濟決策等等,都有自己的不同的模式,模式識別是人類(lèi)思維中最常見(jiàn)的過(guò)程,只不過(guò)沒(méi)有被人們意識到而已。為此,在1973年召開(kāi)的模式識別第一次國際學(xué)術(shù)會(huì )議基礎上,成立了國際模式識別協(xié)會(huì )(IAPP),并決定每隔兩年召開(kāi)一次國際會(huì )議。一位專(zhuān)家曾經(jīng)指出:“模式識別是本世紀雄心最大的學(xué)科,需要電腦科學(xué)家、數學(xué)家、生物學(xué)家、心理學(xué)家、哲學(xué)家和社會(huì )學(xué)家的通力合作。”會(huì )看會(huì )聽(tīng)會(huì )說(shuō)的機器已經(jīng)現出希望的曙光。
六、第五代計算機
達特莫斯會(huì )議以來(lái)數十年間,除了在問(wèn)題求解(包括機器博弈、定理證明等)、專(zhuān)家系統、模式識別等領(lǐng)域外,人工智能在自然語(yǔ)言理解、自動(dòng)程序設計、機器人學(xué)、知識庫的智能檢索等各種不同的領(lǐng)域,都開(kāi)拓出極其廣闊的應用前景。
縱觀(guān)人類(lèi)科學(xué)技術(shù)發(fā)展歷史,當一門(mén)科學(xué)技術(shù)的各組成部分,分別發(fā)展到一定階段時(shí),總是需要有人出來(lái)作綜合工作,將分散的理論與實(shí)踐成果集成為系統。誰(shuí)也沒(méi)有想到,勇敢地站出來(lái),試圖集人工智能研究成果之大成者,竟然是在這個(gè)領(lǐng)域并沒(méi)有多少影響力的日本科學(xué)家。
1982年夏天,日本“新一代計算機技術(shù)研究所”(ICOT),40位年輕人正聚精會(huì )神地聆聽(tīng)他們的所長(cháng)淵一博(Kazuhiro Fuchi)發(fā)表講演,就像是軍校里整裝待發(fā)的一群畢業(yè)生。淵一博博士本人雖已年逾不惑,但他有自己的擇人標準──年齡不超過(guò)35歲,他認為年紀大的人搞不成革命。
淵一博的講演深深打動(dòng)了在座的每一位聽(tīng)眾, 辦公室回蕩著(zhù)他那鏗鏘有力的話(huà)語(yǔ):“將來(lái),你們會(huì )把這段時(shí)間作為一生中最光輝的年代來(lái)回顧,這段時(shí)間對你們來(lái)說(shuō)具有偉大的意義。毫無(wú)疑問(wèn),我們會(huì )非常努力地工作,如果計劃失敗,由我負完全責任。”淵一博他們將要承擔的任務(wù)確實(shí)是革命性的。對此,“知識工程”奠基人費根鮑姆博士描述道:“他們斷言,人工智能在許多領(lǐng)域已趨成熟,可以進(jìn)行系統的、有條理的、而最終是驚人的開(kāi)發(fā)。他們自信人工智能是能夠實(shí)現的,而他們正是使之實(shí)現的人。”
“新一代計算機”的主要目標之一是突破電腦所謂“馮·諾依曼瓶頸”。我們知道,從用電子管制作的ENIAC, 直到用超大規模集成電路設計的微型電腦,都毫無(wú)例外遵循著(zhù)40年代馮·諾依曼為它們確定的體系結構。這種體系必須不折不扣地執行人們預先編制、并且已經(jīng)儲存的程序, 不具備主動(dòng)學(xué)習和自適應能力。所有的程序指令都必須調入CPU,一條接著(zhù)一條地順序執行。 人們把這種順序執行(串行) 已儲存程序的電腦類(lèi)型統稱(chēng)為“諾依曼機”。
“諾依曼機”曾在電腦的發(fā)展歷程中作出了不可磨滅的貢獻,幾乎“統治”著(zhù)所有的電腦“領(lǐng)地”,但是,面對人工智能研究,它已經(jīng)變成限制電腦進(jìn)一步發(fā)展的障礙,成為制約電腦高速處理知識信息的“瓶頸”。新一代電腦必須能夠大規模并行處理信息,采用新的儲存器結構、新的程序設計語(yǔ)言和新的操作方式。淵一博和研究人員甚至不把他們研制的機器命名為計算機,而稱(chēng)作“知識信息處理系統”(KIPS)。
日本人宣稱(chēng)這種機器將以Prolog為機器的語(yǔ)言,其應用程序將達到知識表達級,具有聽(tīng)覺(jué)、視覺(jué)甚至味覺(jué)功能,能夠聽(tīng)懂人說(shuō)話(huà),自己也能說(shuō)話(huà),能認識不同的物體,看懂圖形和文字。人們不再需要為它編寫(xiě)程序指令,只需要口述命令,它自動(dòng)推理并完成工作任務(wù)。這種新型的機器,也就是當時(shí)人們常掛在嘴邊的“第五代計算機”,費根鮑姆認為它引起了“重要的第二次計算機革命”。據《日本經(jīng)濟新聞》報道,五代機計劃最終目標是組裝1000臺要素信息處理器來(lái)實(shí)現并行處理,解題和推理速度達到每秒10億次;與此相連接的是容量高達10億信息組的數據庫和知識庫, 包括1萬(wàn)個(gè)日語(yǔ)和外國語(yǔ)言的基本符號,以及語(yǔ)法規則2000條,可以分析95%以上的文章,自然語(yǔ)言識別率達到95%。此外,還將配置語(yǔ)音識別裝置和儲存10萬(wàn)個(gè)圖象的模式識別裝置等等。
這真是一個(gè)雄心勃勃的誘人的計劃。日本通產(chǎn)省全力支持了該項計劃,總投資預算達到8億美元, 并且組織富士通、NEC、日立、東芝、松下、夏普等8大著(zhù)名企業(yè)配合淵一博的研究所共同開(kāi)發(fā)。五代機計劃定為10年完成,分為三個(gè)階段實(shí)施。淵一博他們苦苦奮戰了將近10年,他們幾乎沒(méi)有回過(guò)家,長(cháng)年整天穿梭于實(shí)驗室與公寓之間,近乎玩命式的拼搏。報社記者動(dòng)情地寫(xiě)到:如果你在地鐵上看見(jiàn)有人一邊看資料一邊啃面包,十之八九是ICOT的研究者。
然而,“五代機”的命運是悲壯的。1992年,因最終沒(méi)能突破關(guān)鍵性的技術(shù)難題,無(wú)法實(shí)現自然語(yǔ)言人機對話(huà)、程序自動(dòng)生成等目標,導致了該計劃最后階段研究的流產(chǎn),淵一博也不得不重返大學(xué)講壇。也有人認為,“五代機”計劃不能算作失敗,它在前兩個(gè)階段基本上達到了預期目標。 1992年6月,就在“五代機”計劃實(shí)施整整10年之際,ICOT展示了它研制的五代機原型試制機,由64臺處理器實(shí)現了并行處理,已初步具備類(lèi)似人的左腦的先進(jìn)功能,可以對蛋白質(zhì)進(jìn)行高精度分析,已經(jīng)在基因研究中發(fā)揮了作用。
流產(chǎn)也好,失敗也罷,歷史已經(jīng)給“五代機”劃上了句號,現實(shí)迫使人們尋找研制智能電腦新的途徑。日本民族是頑強的,就在1992年,它重新開(kāi)始實(shí)施“現實(shí)世界計算機”計劃,接著(zhù)研制具有類(lèi)似于人的右腦功能的計算機。
七、大 腦 復 制 ?
長(cháng)期以來(lái), 一個(gè)誘人的科學(xué)幻想主題經(jīng)常涉及到人腦與電腦的關(guān)系。人類(lèi)大腦有140多億個(gè)腦神經(jīng)細胞,每個(gè)細胞都與另外5萬(wàn)個(gè)其他細胞相互連結,比目前全球電話(huà)網(wǎng)還要復雜1500倍。據前蘇聯(lián)學(xué)者阿諾克欣測算,一個(gè)普通的大腦擁有的神經(jīng)突觸連接和沖動(dòng)傳遞途徑的數目, 是在1后面加上1000萬(wàn)公里長(cháng)的、用標準打字機打出的那么多個(gè)零!但是,由如此龐大數目元件構成的大腦,平均重量不足1400克,平均體積約為1.5立方分米, 消耗的總功率只有10瓦。若采用半導體器件組裝成相應的電腦裝置,則必須做成一座高達40層的摩天大樓,所需功率要以百萬(wàn)千瓦計。
腦細胞儲存信息的密度極高,每立方厘米可存放1000億以上比特的信息量,腦科學(xué)家估計,一個(gè)人一生中存儲的信息總量可超過(guò)1000萬(wàn)億比特。有人推算出全世界圖書(shū)館大約藏書(shū)7.7億冊, 積累的信息總量約為4600萬(wàn)億比特,與人腦能夠儲存的信息總量屬于同一數量級。對于電腦來(lái)說(shuō),只要某一個(gè)小部件出了毛病,就會(huì )導致整個(gè)機器癱瘓。但是,人的大腦細胞具有自行組合和分裂的活性,構成了高度可靠的“自適應系統”。在人的一生中, 腦神經(jīng)元大約每小時(shí)就有1000個(gè)發(fā)生故障,一年之內累計為800多萬(wàn)個(gè)。如果人活到100歲,將會(huì )有10億個(gè)神經(jīng)細胞功能失效,約占總數的1/10。即使在這種嚴重的故障面前,大腦仍然可以正常地運作。
從以上這些數字看,人類(lèi)的大腦不啻于世界上最復雜、最高級、最有效、儲存容量最大的超級計算機。除了運算速度比電腦略遜一籌外,人腦在結構、尺寸、性能、能耗等各方面都令最先進(jìn)的電腦望塵莫及。只可惜人類(lèi)對自己擁有的這臺“超級電腦”尚未完全弄清楚,對它的記憶機理、思維過(guò)程、信息儲存和傳輸方式等等知之甚少。大腦究竟如何工作,至今依然是當代科學(xué)面臨的最大奧秘之一。
為此,許許多多的科幻作家幻想著(zhù)有那么一天,我們能夠實(shí)現電腦與大腦對接,直接復制和傳送大腦儲存的信息。
50年代,一位科幻小說(shuō)家寫(xiě)到:“儲存信息的方式并不重要,重要的是信息本身,既然大自然能夠把信息濃縮到肉眼看不到的細胞中,人就一定能把它讀出來(lái)。”60年代,另一位作家則說(shuō):“從本質(zhì)上講,‘你‘不是肉體,而是你的記憶。這個(gè)本質(zhì)上的‘你‘可以在計算機里保存,變成IBM電腦里的磁性脈沖收集品。”到了70年代,IBM公司的一位研究人員也回應道: “ 也許我們能夠把某人頭腦中的想法、記憶和意識讀出,再把它輸送給另外一個(gè)人。”他甚至認為,科學(xué)家掌握這一方法只是時(shí)間問(wèn)題。
科幻作家的議論不足為憑,偏偏有位著(zhù)名的電腦專(zhuān)家也加入到鼓噪的行列,在科學(xué)界引起了一場(chǎng)不大不小的風(fēng)波。1988年,美國最負盛名的學(xué)術(shù)出版機構哈佛大學(xué)出版社,出版了一本《思維兒童》的專(zhuān)著(zhù)(有人譯作《換腦兒童》),作者是卡內基—梅隆大學(xué)活動(dòng)機器人實(shí)驗室主任漢斯·莫拉維克。
莫拉維克在書(shū)中生動(dòng)地描述了人怎樣把思維輸入電腦,以及這一切怎樣在未來(lái)50年之內變成現實(shí)。他甚至想象出各種轉換的過(guò)程。例如,一種可能會(huì )較早實(shí)現的方法是由機器人“主刀”的腦外科手術(shù)。在人清醒的狀態(tài)下,由機器人打開(kāi)你的頭蓋骨,然后用某種讀出裝置將大腦存儲的信息,就象CT斷層掃描那樣,一層一層地讀出來(lái),你還可以直接看到屏幕顯示的你的記憶,并親自指揮機器人校正錯誤。這一過(guò)程將一直進(jìn)行到你的思維、記憶和意識統統儲存到電腦里。另一種方式更加先進(jìn),莫拉維克寫(xiě)道:“高分辨率大腦掃描法可以一下子創(chuàng )造出一個(gè)新的你,不用動(dòng)手術(shù),而且立等可取。”
按照莫拉維克等人的設想,一旦我們能夠把思維轉移到計算機或者儲存介質(zhì)中,既使原件(大腦)受到損傷或者衰老,仍然可以把它拷貝到新克隆出的大腦中,先FORMAT(格式化),再COPY(拷貝),人不就可以永生不死嗎?如果能把愛(ài)因斯坦或托爾斯泰的思想直接復制,誰(shuí)都可以成為科學(xué)大師或文學(xué)巨匠,人類(lèi)的文化、教育、醫學(xué)等等都將從根本上發(fā)生嬗變。
我們人類(lèi)的將來(lái),就要“數字化生存”甚至于“虛擬生存”于磁盤(pán)的同心圈圈,或者光盤(pán)的凸凹坑坑里,這簡(jiǎn)直不可思議!目瞪口呆的書(shū)評家把莫拉維克列為“又一個(gè)發(fā)瘋的科學(xué)家”,美國報刊評論說(shuō)這是“哈佛大學(xué)出版社出版的最可怕的一本書(shū)。”連斯坦福大學(xué)許多科學(xué)家也認為莫拉維克的“思維轉換”是“無(wú)法容忍的謬誤”。
科學(xué)家也愛(ài)做科幻之夢(mèng)。至少在相當長(cháng)的時(shí)間內,復制大腦的幻想幾乎不可能實(shí)現。既使實(shí)現了對人腦記憶的簡(jiǎn)單拷貝,對人類(lèi)的思想,以及情感、個(gè)性、氣質(zhì)、人格等非智力因素,又如何能簡(jiǎn)單地復制出副本?
八、走進(jìn)人類(lèi)的心靈
也有一些人工智能學(xué)者對大腦復制采取了寬容和支持的態(tài)度,人工智能的泰斗明斯基教授就是其中的一位。他想用另外的辦法,即把微電腦嵌入人的大腦,以便使“我們能設計出我們的‘思維兒童‘ ,他們思考問(wèn)題的速度比我們現在快100萬(wàn)倍。”
將電腦植入人腦,用微型芯片配合腦神經(jīng)細胞工作,只要求解決兩者之間的接口問(wèn)題。目前的技術(shù)已經(jīng)可以把《大不列顛百科全書(shū)》的全部?jì)热菀苑肿哟笮〉淖煮w刻在一枚針尖上,因此完全可以利用同樣的技術(shù)開(kāi)發(fā)出植入大腦的芯片。據報道,德國科學(xué)家已經(jīng)在硅芯片上培植成功一種與人類(lèi)神經(jīng)細胞極為相似的老鼠神經(jīng)細胞,并且可以把神經(jīng)細胞發(fā)出的電子脈沖信號傳送到特制傳感器上。由此看來(lái),人機連“腦”不是夢(mèng),人腦與電腦相連能優(yōu)勢互補,可以彌補人類(lèi)記憶和運算能力的不足,大大增強人腦的功能。
1987年6月, 在美國加州召開(kāi)了首屆國際神經(jīng)網(wǎng)絡(luò )學(xué)術(shù)會(huì )議,到會(huì )代表有1600人,宣告成立國際神經(jīng)網(wǎng)絡(luò )學(xué)會(huì )(INNS)。一時(shí)間,有關(guān)神經(jīng)網(wǎng)絡(luò )機理、模型、算法、特征分析,以及在各方面應用的學(xué)術(shù)論文,象雨后春筍般涌現。建立在神經(jīng)網(wǎng)絡(luò )原理基礎上的神經(jīng)計算機,成為當代高科技領(lǐng)域方興未艾的競爭熱點(diǎn),代表著(zhù)從本世紀末到21世紀電腦技術(shù)的最新研究方向。1990年11月,日本宣稱(chēng)已經(jīng)建成了由1152個(gè)神經(jīng)元組成、每秒執行23億次學(xué)習動(dòng)作的神經(jīng)網(wǎng)絡(luò )電腦。據INNS學(xué)會(huì )主席介紹:“神經(jīng)網(wǎng)絡(luò )的研究是借鑒人腦的結構與工作原理以設計和建造具有一定智慧的機器。這種神經(jīng)網(wǎng)絡(luò )不同于通常的人工智能機,我們稱(chēng)之為第六代計算機。”
人類(lèi)已經(jīng)在地球上生存了數百萬(wàn)年。在創(chuàng )建文明的歷史進(jìn)程中,人類(lèi)不僅對周?chē)目陀^(guān)世界進(jìn)行著(zhù)始終不愈的思考和改造,而且也對自身的生理現象和心理活動(dòng)進(jìn)行了逐步深入的研究和探索。“形而下”的自然現象與“形而上”的思維活動(dòng),相互影響,相互撞擊,相互交融,科學(xué)研究的焦點(diǎn)終于從機器與思維聚集到人腦與電腦的關(guān)系層面上。人工智能學(xué)科(Artificial intelligence) 的實(shí)質(zhì)是用電腦模擬人類(lèi)的智能;生物學(xué)從神經(jīng)解剖的角度, 試圖建立腦模型 (Brain model) 揭示大腦的機制; 認知心理學(xué)(Cogritivescience) 則從思維、記憶、聯(lián)想功能特征來(lái)概括人的精神活動(dòng)機理。三種不同的學(xué)科已經(jīng)攜起手, 形成了所謂“ABC理論”,進(jìn)而構成統一的智能科學(xué),人工智能和智能電腦也將因此在21世紀再創(chuàng )輝煌。
1958年紐厄爾和赫伯特·西蒙在預言“電腦將在10內戰勝?lài)H象棋世界冠軍”的同時(shí),還大膽地預言說(shuō):
──不出10年,電腦便能找到并證明到那時(shí)還未被證明的重要數學(xué)定理。
──不出10年,大部分心理學(xué)理論將采取電腦的程序形式。
1970年,明斯基所作的預言卻有些離譜:
“在三年到八年的時(shí)間里,我們將研制出具有普通人一般智力的計算機。這樣的機器能讀懂莎士比亞的著(zhù)作,會(huì )給汽車(chē)上潤滑油,會(huì )玩弄政治權術(shù),能講笑話(huà),會(huì )爭吵。到了這個(gè)程度后,計算機將以驚人的速度進(jìn)行自我教育。幾個(gè)月之后,它將具有天才的智力,再過(guò)幾個(gè)月,它的智力將無(wú)以倫比。”
人工智能先驅這些充滿(mǎn)樂(lè )觀(guān)的預言,除了40年后電腦戰勝了卡斯帕洛夫之外,其余的直到現在依然遠沒(méi)有被實(shí)現,甚至引發(fā)長(cháng)時(shí)期無(wú)休無(wú)止的爭論和哲學(xué)意義上的思辯。人工智能雖然作出了許多令人鼓舞的工作,但在前進(jìn)的道路上,還面臨著(zhù)相當難以克服的障礙。
或許, 21 世紀的到來(lái)真的昭示著(zhù)“人工智能熱”的再度興起。 2001 年 6 月 ,對于全球的“科幻迷”來(lái)講,不啻是一段令人興奮激動(dòng)的日子。以好萊塢著(zhù)名導演斯皮爾伯格和已故斯坦利 ·庫布里克合作推出的大片《人工智能》,先后在日本、美國及其他國家上演,票房?jì)r(jià)值迅速打破了《星球前傳》的紀錄,直逼《泰坦尼克號》。這部影片講述的是公元2142年,一個(gè)裝著(zhù)人工智能軟件的機器小孩大衛渴望成為真人、渴望得到愛(ài)的故事。在影片中,"AI兒童"大衛不但擁有可以亂真的人類(lèi)外表,而且還像人類(lèi)一樣有思想,有感情,能感知自己的存在。面對茫茫人海和變幻莫測的人心,他寂寞地離開(kāi)家門(mén),踏上漫長(cháng)的心路歷程,希望自己有一天能脫胎換骨成為真正的人類(lèi)……
就像“深藍”電腦擊敗棋王卡斯帕洛夫那樣, 斯皮爾伯格 《人工智能》影片的上演,無(wú)異于給新世紀的人工智能科學(xué)作了一次絕妙的宣傳廣告,使億萬(wàn)公眾的目光聚焦在這一前沿科學(xué)領(lǐng)域上。歷史進(jìn)入知識經(jīng)濟時(shí)代后,人類(lèi)社會(huì )下一次生產(chǎn)力飛躍的突破口將在哪里?越來(lái)越多的科學(xué)家把希望寄托于人工智能上。他們認為,人工智能將帶來(lái)又一次史無(wú)前例的技術(shù)革命?,F有的計算機技術(shù)已充分實(shí)現了人類(lèi)左腦的邏輯推理功能,人工智能的下一步是模仿人類(lèi)右腦的模糊處理能力,以及模擬整個(gè)大腦并行處理大量信息的功能, 把人類(lèi)從那些繁瑣的重復性的腦力勞動(dòng)中解放出來(lái),去從事那些具有高創(chuàng )造性的腦力勞動(dòng),如科學(xué)發(fā)明和藝術(shù)創(chuàng )作等等,生產(chǎn)效率也將得到大幅度提高。
“路漫漫兮其修遠乎,吾將上下以求索。”
人工智能研究既然已經(jīng)踏上了艱難跋涉的征途,那么,“堅持而不懈的努力必將導致成功”──這正是第六屆人工智能?chē)H會(huì )議向全世界提出的口號。人類(lèi)的思維,被恩格斯譽(yù)為“地球上最美的花朵”;會(huì )思維的電腦必將使得機器最終走進(jìn)人類(lèi)的心靈,在我們這個(gè)星球上綻開(kāi)又一朵“最美麗的花朵”。
本站僅提供存儲服務(wù),所有內容均由用戶(hù)發(fā)布,如發(fā)現有害或侵權內容,請
點(diǎn)擊舉報。