這幾天我一直在圍觀(guān)人們的反應,最想不明白的一點(diǎn),其實(shí)是人們究竟怎么開(kāi)始把機器與人類(lèi)放到對立的兩面?
圍棋是藝術(shù),阿爾法狗是技術(shù),它如何就會(huì )毀了圍棋呢?棋手們自己不是也說(shuō)“(現在下棋)或多或少都會(huì )受到阿老師的影響吧,下棋會(huì )讓人感到更自由一些,沒(méi)有什么招法是完全不能下的”(周睿羊,DeepMind博客視頻),“阿爾法狗帶給我們很多的新東西?,F在呢,大家更多地去嘗試以前都沒(méi)有下過(guò)的各種下法”(時(shí)越,DeepMind博客視頻)
棋手們的意思難道不是說(shuō),AI促使人類(lèi)棋手更加強大,更樂(lè )于創(chuàng )新嗎?

而對于人工智能科學(xué)家而言,阿爾法狗的使命,更不是要在圍棋賽中打敗人類(lèi)。他們之所以讓機器與頂尖的人類(lèi)棋手互動(dòng),意在為“狗”提供一個(gè)不能用其他方式替代的學(xué)習環(huán)境。DeepMind創(chuàng )始人哈薩比斯自己在很多公開(kāi)場(chǎng)合就不止一次地說(shuō)過(guò),是為了發(fā)現潛藏的通用知識(general knowledge)?!肮贰?,其實(shí)是一個(gè)通用智能體。
把DM的使命說(shuō)得更冠冕堂皇些,何嘗不是人類(lèi)對自身的進(jìn)一步探索?
正如物理學(xué)家費曼教授那句留在黑板上的著(zhù)名遺言,“我所不能創(chuàng )造的,都是我沒(méi)有真正懂得的”(What I cannot create, I do not understand),如果世界在人們眼里是由外部世界和內心世界兩部分組成的話(huà),也許“內心”世界更加根本,因為外部世界的存在狀態(tài),根本還是取決于我們大腦對它的解釋。這便是人工智能最引人入勝的地方:借助于建造它來(lái)更好地了解我們自己,理解這個(gè)世界。
DeepMind所致力建造的這一類(lèi)AI,有個(gè)名字,叫“受神經(jīng)學(xué)啟發(fā)的AI”(neuralscience-inspired AI)。別忘了哈薩比斯本人就是倫敦大學(xué)學(xué)院的認知神經(jīng)學(xué)博士,DM對人類(lèi)身上最感興趣的部位叫做海馬體(Hippocampus)。按維基的說(shuō)法:海馬體是人類(lèi)及脊椎動(dòng)物腦中的重要部分,位于大腦皮質(zhì)下方,擔當著(zhù)關(guān)于短期記憶、長(cháng)期記憶,以及空間定位的作用。在阿茲海默病中,海馬體是首先受到損傷的區域:表現癥狀為記憶力衰退以及方向知覺(jué)的喪失。大腦缺氧(缺氧癥)以及腦炎等也可導致海馬損傷。平常我們開(kāi)玩笑時(shí)愛(ài)說(shuō)的“老癡”或“腦殘”都跟這個(gè)海馬體相關(guān)。
我們需要記住,DM的AI有兩個(gè)關(guān)鍵詞,一是通用,一是學(xué)習。他們所有的算法都從元數據開(kāi)始進(jìn)行自主學(xué)習,從而掌握某項任務(wù),這與預編程的人工智能有本質(zhì)的不一樣。此外,DM還強調,他們希望所有的系統能夠通用,也就是說(shuō),希望同一個(gè)系統,或同一套算法可以有跨領(lǐng)域的廣泛應用。公眾所熟知的贏(yíng)了國際象棋的IBM傳奇深藍,以及近年來(lái)的沃森系統,它們都仍然屬于窄AI范疇,也就是說(shuō),它們是為了解決某個(gè)特定問(wèn)題量身打造的AI,因而只能解決那一類(lèi)問(wèn)題。
而阿爾法狗這一類(lèi)DM的AI,事實(shí)上則可以被叫做“通用人工智能”AGI(Artificial General Intelligence),目標既不針對特定任務(wù),也無(wú)涉預編程。這就引出了眼下被熱議的“強化學(xué)習”技術(shù)(reinforcement learning)。

描述強化學(xué)習其實(shí)非常簡(jiǎn)單,它有個(gè)一目了然的框架,框架內有兩個(gè)內容:系統和環(huán)境。這里的“系統”就是我們說(shuō)的AI,而它會(huì )發(fā)現自己處于某個(gè)“環(huán)境”當中,要達成某項目標。
“系統”與“環(huán)境”之間進(jìn)行雙向交流:首先,它通過(guò)其感知儀器來(lái)對“環(huán)境”進(jìn)行觀(guān)察,在DM的學(xué)習過(guò)程中,通常使用的是視覺(jué),也就是說(shuō),“系統”觀(guān)察到的就是像素。這些觀(guān)察結果往往有很多“噪音”,并且信息不完整,因為現實(shí)世界本身就十分混亂,充滿(mǎn)干擾,而且永遠不可能對一件事獲得真正完整的信息?!跋到y”的任務(wù),便是要在這樣的混亂條件下,創(chuàng )建一個(gè)可能的、最好的統計模型;這個(gè)最好的模型一旦建立,第二項任務(wù),便是在當前的時(shí)間點(diǎn)上可供選擇的一系列行為中,選出最好的一個(gè),向目標靠近。而一旦“系統”確定了某一個(gè)行為是最佳之后,“系統”隨即將這個(gè)行為作為輸出,并得以執行。其結果,有可能會(huì ),也有可能不會(huì ),對當前的“環(huán)境”帶來(lái)任何改變。但無(wú)論如何,它都成為新一輪觀(guān)察的驅動(dòng)。所以這個(gè)“系統”盡管表面上看,可以通過(guò)這樣一個(gè)簡(jiǎn)單的框架圖形來(lái)描述,但它事實(shí)上隱藏了很多的復雜性。
解決了隱藏其后的復雜性,其實(shí)就擁有了足夠的智能來(lái)進(jìn)行幾乎一切學(xué)習。我們認同這個(gè)觀(guān)點(diǎn),因為我們知道,包括人在內的所有脊椎動(dòng)物,都是這樣來(lái)學(xué)習的。人類(lèi)大腦中,完成這一“強化學(xué)習”過(guò)程的是多巴胺系統。
了解了創(chuàng )造出阿爾法狗的DM公司的通用智能使命,以及這一通用智能的學(xué)習原理之后,不難看出,各類(lèi)游戲其實(shí)都是其算法的絕佳測試平臺。一兩年前連線(xiàn)雜志 “Wired” 就有過(guò)長(cháng)文報道,DM最初使用經(jīng)典的80年代雅達利游戲(Atari )來(lái)測試他們的算法。當AI在玩雅達利時(shí),它所獲得的輸入沒(méi)有別的,就是純粹的像素,完全就像人在看著(zhù)屏幕學(xué),屏幕尺寸大概是200*150,所以它所得到的就是每幀3萬(wàn)個(gè)點(diǎn),目的也很簡(jiǎn)單,一切從頭琢磨自學(xué),為了拿高分。
在基本的學(xué)習能力具備后,再通過(guò)模擬海馬體的工作原理,來(lái)為智能體增加能力,例如學(xué)習抽象概念,以及增進(jìn)長(cháng)期記憶。
如果說(shuō)AI是在利用包括棋類(lèi)在內的游戲來(lái)作為測試平臺,達到提升功力的目的的話(huà),它真正的目標可能更多地在于幫助人類(lèi)完成更加關(guān)鍵的工作,例如與預測相關(guān)的醫療、氣候、能源、宏觀(guān)經(jīng)濟等應用。這樣一來(lái),人工智能技術(shù)可以毫無(wú)疑問(wèn)地被認為是眼下最重要的技術(shù)之一,更可能正是潛在的“元解決方案”(meta-solution),可以協(xié)助人類(lèi)解決所有的其它問(wèn)題。

提到“元解決方案”,不可避免的是與之相伴的倫理討論。在科幻作品、斷章取義的名人演說(shuō)、雞毛令箭的媒體報道的共同作用下,AI所獲得的倫理關(guān)注尤其熱鬧。但是它與任何強大的新技術(shù)無(wú)異,技術(shù)本身是中立的,決定它是否符合倫理的,永遠是掌握技術(shù)的人。在此過(guò)程中,公眾、媒體、研究機構(企業(yè))以及政府幾方的透明,對每一步的監管都因此變得至關(guān)重要。
阿爾法狗的創(chuàng )造者的使命是要將世界的信息組織起來(lái),讓它更好地為全世界共享,換句話(huà)說(shuō),就是利用 AI或者AGI 來(lái)自動(dòng)將無(wú)序的信息轉化為知識,從而利用這些知識使人類(lèi)更加強大。因此,與世界最優(yōu)秀的人工智能專(zhuān)家一起,挖掘出暗藏在圍棋這一古老游戲后面的智慧,促成技術(shù)的進(jìn)步,這應當是烏鎮比武會(huì )上所有人的勝利吧。
原標題:DeepMind的使命不是要下贏(yíng)圍棋
聯(lián)系客服