新智元編譯
來(lái)源:quantamagazine
編譯:大明
【新智元導讀】預測編碼理論認為,大腦的感知、運動(dòng)控制、記憶及其他高級功能,取決于真實(shí)經(jīng)歷和大腦對未來(lái)的預測之間的差異。DeepMind新推出的“生成查詢(xún)網(wǎng)絡(luò )”模仿了大腦的預測編碼機制,明顯提升了預測系統的智能化水平。
上個(gè)月,人工智能公司DeepMind推出了一款新軟件,可以在虛擬房間內拍攝一些物體的單個(gè)圖像,并且能夠在沒(méi)有真人指導的情況下,從全新的有利視角推斷出三維場(chǎng)景的樣貌。這一系統名為生成查詢(xún)網(wǎng)絡(luò )(GQN),它可以成功模擬簡(jiǎn)單的視頻游戲式迷宮的布局。
GQN有很典型的技術(shù)上的應用,不過(guò)它同樣引發(fā)了神經(jīng)科學(xué)家的關(guān)注,他們對用于學(xué)習如何執行任務(wù)的訓練算法特別感興趣。GQN能夠由給定的圖像生成關(guān)于場(chǎng)景樣貌的預測,比如定位目標的位置,陰影在平面上的投射樣式,在某些視角下,哪些區域是應該可見(jiàn)還是隱藏,并利用預測結果與真實(shí)觀(guān)察結果之間的差異,來(lái)提高其未來(lái)預測的準確性?!罢乾F實(shí)與預測之間的差異,使得模型能夠不斷更新?!痹擁椖控撠熑酥籄li Eslami說(shuō)。
Eslami在該研究上的合作者、也是他在DeepMind的同事Danilo Rezende表示,“算法會(huì )改變預測模型的參數,所以下次遇到相同的情況時(shí),它就不會(huì )顯得那么驚訝了?!?/span>
長(cháng)期以來(lái),神經(jīng)科學(xué)家一直懷疑大腦的運行方式也遵循與此類(lèi)似的機制。(這些推測確實(shí)是啟發(fā)GQN團隊探尋這種方法的一部分原因。)根據這種“預測編碼”(predictive coding)理論,在認知過(guò)程的每個(gè)層面,大腦都會(huì )產(chǎn)生一些關(guān)于應該自其下面的層級接收到哪些信息的模型和觀(guān)點(diǎn)。這些觀(guān)點(diǎn)被轉化為關(guān)于在特定情況下的經(jīng)歷的預測,提供令這些經(jīng)歷說(shuō)得通的最佳解釋。然后將預測結果作為反饋發(fā)送到大腦的較低級的感覺(jué)區域。大腦將自己的預測結果與收到的實(shí)際感官輸入內容進(jìn)行比較,并“搪塞掉”任何差異或預測錯誤,并可以通過(guò)使用其內部模型來(lái)確定出現這種差異的可能的原因。(例如,我們可能根據某個(gè)內部模型將一張桌子視為一個(gè)由四條腿支撐的平面,但即使桌子被其他東西遮住了一半,我們仍然可以認得出這是一張桌子。)
對于給定的一張色塊樣式的二維圖像(左),GQN人工智能能夠推斷出色塊在空間中的三維排列(右)。該系統依賴(lài)于作為預測編碼的神經(jīng)科學(xué)理論的一些基本見(jiàn)解。圖/DeepMind
無(wú)法解釋的預測誤差會(huì )通過(guò)更高級別的連接(作為“前饋”信號,而不是反饋)傳遞,這里,預測誤差被認為是值得注意的現象,系統需要注意并做出相應處理。倫敦大學(xué)學(xué)院的Karl Friston說(shuō):“現在的關(guān)注點(diǎn)在于內部模型的調節,關(guān)注大腦動(dòng)力學(xué),來(lái)抑制預測中的錯誤?!?Friston是著(zhù)名神經(jīng)科學(xué)家,也是預測編碼假設的先驅之一。
在過(guò)去的十年中,認知科學(xué)家、哲學(xué)家和心理學(xué)家將預測編碼作為一個(gè)令人信服的想法,尤其是用于描述感知的運行機制,而且將其作為一個(gè)關(guān)于整個(gè)大腦運行機制的更具雄心、包羅萬(wàn)象的理論。直到最近才有實(shí)驗工具開(kāi)始直接測試這一假設的具體機制,過(guò)去兩年內發(fā)表的一些論文為該理論提供了驚人的證據。盡管如此,該理論仍然存在爭議,最近,關(guān)于一些具有里程碑意義的實(shí)驗結果是否可重復的爭論,可能該理論存在爭議的最好的證明。
“我喝咖啡喜歡加奶油和____?!边@個(gè)句子用“糖”來(lái)填空似乎是很自然的。這也是加州大學(xué)圣迭戈分校的認知科學(xué)家Marta Kutas和Steven Hillyard的本意,他們在1980年進(jìn)行了一系列的實(shí)驗,他們在實(shí)驗中將這句話(huà)逐詞放到大屏幕上給人看,并記錄下觀(guān)眾的大腦活動(dòng)。只不過(guò),出現的最后一個(gè)詞并不是“糖”,而是“狗”。整個(gè)句子變成了:“我喝咖啡喜歡加奶油和狗?!?/span>
研究人員注意到,當研究對象看到“狗”這個(gè)出乎意料的詞時(shí),會(huì )出現更激烈的大腦反應,這些反應的具體特點(diǎn)為“特定模式的電活動(dòng)”,稱(chēng)為“N400效應”(N400 effect),在“狗”一詞出現大約400毫秒后達到峰值。但研究人員仍不清楚應如何解釋這一現象。大腦作出反應,是因為這個(gè)詞的意思在本句背景下是不合常理的?還是因為大腦沒(méi)預料到這個(gè)詞的出現,它違背了大腦對預期出現內容的預測?
2005年,Kutas和她的團隊進(jìn)行了另一項研究,表明后一種假設是對的。實(shí)驗對象再次要求讀屏幕上逐詞出現的一句話(huà):“這天微風(fēng)陣陣,所以男孩子們出去放____?!币驗椤帮L(fēng)箏”(a kite)似乎是最有可能用來(lái)補完句子的詞,所以接下來(lái)實(shí)驗對象的期望是冠詞“a”,它沒(méi)有內在意義,但表示接下來(lái)還會(huì )有一個(gè)詞。而當參與者看到接下來(lái)的詞是“an”時(shí),他們就經(jīng)歷了N400效應,這似乎是因為大腦必須處理其期望與現實(shí)之間的不符。顯然,這一效應與該詞的含義以及處理出現的刺激本身的困難程度無(wú)關(guān)。
2005年的這一發(fā)現似乎非常適合預測編碼框架理論。但今年4月,eLife發(fā)表的一篇論文稱(chēng),有幾個(gè)實(shí)驗室無(wú)法重復這一實(shí)驗結果?,F在,也有研究人員開(kāi)始做出回應,一些人聲稱(chēng)重復實(shí)驗的微妙結果仍然有利于基于預測的解釋。
這種搖擺不定反映出關(guān)于預測編碼理論的大部分爭論。像Kusta這樣的實(shí)驗可以有許多種解釋。比如可以通過(guò)除預測編碼之外的模型來(lái)解釋?zhuān)⑶疫@些實(shí)驗缺乏足以證明假設的確實(shí)證據,因為它們沒(méi)有深入研究實(shí)際的機制。雖然大腦會(huì )不斷做出推論(并將這些推論與現實(shí)進(jìn)行比較)的想法已構建得相當完善,但預測編碼的支持者一直在設法證明,他們所主張的理論才是正確的,而且可以延伸到所有的認知領(lǐng)域。
大腦一直建立和評估自己對持續的實(shí)際經(jīng)歷的預測,這一基本觀(guān)點(diǎn)并不總是被視為理所當然的。20世紀的主流神經(jīng)科學(xué)觀(guān)點(diǎn)將大腦的功能描述為一個(gè)特征探測器:大腦記錄刺激的存在,對其加以處理,然后發(fā)送信號來(lái)產(chǎn)生行為反應。通過(guò)特定細胞的活動(dòng)來(lái)反映真實(shí)世界中刺激是否存在。例如,視覺(jué)皮層中的一些神經(jīng)元會(huì )對視野中物體的邊緣作出反應,還有的神經(jīng)元的放電則會(huì )指示物體的方向、著(zhù)色或陰影。
但事實(shí)證明,這個(gè)過(guò)程遠非看上去那么簡(jiǎn)單。進(jìn)一步的試驗發(fā)現,比如,當大腦感知到一條越來(lái)越長(cháng)的線(xiàn)時(shí),即使線(xiàn)沒(méi)有消失,針對線(xiàn)的探測神經(jīng)元也會(huì )停止放電。事實(shí)上,有如此多的信息似乎通過(guò)神秘的自上而下的反饋連接來(lái)傳遞的,這表明實(shí)際上還有其他機制在發(fā)揮作用。
“如果大腦是一個(gè)推理機器、一個(gè)統計機構,那么,大腦也會(huì )犯下和統計學(xué)家同樣的錯誤?!?/span>
倫敦大學(xué)學(xué)院 Karl Friston
這就是“貝葉斯大腦”(Bayesian brain)發(fā)揮作用的地方了,其總體框架可追溯到19世紀60年代。該理論提出,大腦會(huì )基于內部模型對現實(shí)世界進(jìn)行概率性推斷,主要是計算關(guān)于如何解釋其感知的“最佳猜測”(這個(gè)說(shuō)法符合貝葉斯統計規則,該規則對基于先驗信息得出的事件概率進(jìn)行了量化)。大腦并不是等待感官信息來(lái)推動(dòng)認知,而是始終積極地構建關(guān)于世界運行方式的假設,并用這些假設來(lái)解釋經(jīng)驗并填補缺失的數據。根據一些專(zhuān)家的說(shuō)法,這就是為什么我們可能會(huì )認為感知是一種“受控制的幻覺(jué)”。
沿著(zhù)這個(gè)理論,貝葉斯大腦也解釋了為什么視幻覺(jué)會(huì )起作用:例如,兩個(gè)點(diǎn)在屏幕上快速交替閃爍,看起來(lái)就像一個(gè)點(diǎn)來(lái)回移動(dòng),所以我們的大腦無(wú)意識地開(kāi)始像對待一個(gè)目標一樣對待它們。理解對象如何移動(dòng)是一種更高層次的知識,但它從根本上影響了我們的感知方式。大腦只是填補某些信息的空白,來(lái)繪制一幅不完全準確的圖片。在本例中,就是關(guān)于運動(dòng)的信息,
圖示為一個(gè)著(zhù)名的視幻覺(jué),棋盤(pán)上的格子A看上去比格子B暗得多。但是,其實(shí)二者的灰度是完全相同的。大腦會(huì )根據附近格子的顏色和圓柱體投下的陰影位置,對棋盤(pán)的顏色做出推測。在本例中,這種推測會(huì )產(chǎn)生格子A和B的顏色不同的觀(guān)點(diǎn),而實(shí)際上,二者的顏色是完全相同的。(參考右圖,將A和B連在一起即可,若將圓柱體隱藏,看上去還會(huì )更明顯。)
但是,盡管生成模型和期望在大腦功能中發(fā)揮了明確的作用,科學(xué)家還沒(méi)有確切地確定這些機制在神經(jīng)回路級別上是如何發(fā)揮作用的。蘇格蘭愛(ài)丁堡大學(xué)的心理哲學(xué)教授Mark Sprevak說(shuō):“貝葉斯大腦理論對于根本性的機制是相對不可知的?!?/span>
輸入預測編碼理論提供了大腦如何成為“貝葉斯大腦”的特定公式?!邦A測編碼”這個(gè)名字源于一種更有效地傳輸電信信號的技術(shù):由于視頻文件從當前幀到下一幀的過(guò)程中包含大量冗余,因此在壓縮數據時(shí),對每個(gè)圖像中的每個(gè)像素進(jìn)行編碼是效率低下的。反之,對相鄰幀之間的差異進(jìn)行編碼,然后進(jìn)行反向處理來(lái)解釋整個(gè)視頻,這樣就更合理。
1982年,科學(xué)家發(fā)現這一理念在神經(jīng)科學(xué)中有一個(gè)很好的應用,因為它似乎可以解釋視網(wǎng)膜中的神經(jīng)元如何編碼關(guān)于視覺(jué)刺激的信息,并將這些信息沿著(zhù)視神經(jīng)進(jìn)行傳播。該理論也被作為解釋大腦獎勵系統運作方式的原理:即多巴胺神經(jīng)元會(huì )對預期獎勵與實(shí)際獎勵之間的不匹配度進(jìn)行編碼。研究人員表示,這些預測錯誤可以幫助動(dòng)物對未來(lái)期望進(jìn)行修正,并推動(dòng)其決策過(guò)程。
盡管如此,科學(xué)家們大多仍將預測編碼視為特定網(wǎng)絡(luò )的特定過(guò)程。不過(guò),功能磁共振成像測試和其他類(lèi)型的實(shí)驗已經(jīng)開(kāi)始改變這一觀(guān)點(diǎn)。
預測編碼假設如此引人注目,部分原因在于它具備令人難以置信的解釋力?!拔矣X(jué)得令人信服的是,在這個(gè)理論框架中,有不少事情都得到了解釋?zhuān)睈?ài)丁堡大學(xué)邏輯和形而上學(xué)教授兼理論專(zhuān)家 Andy Clark說(shuō)。
首先,該框架在單一計算過(guò)程中統一了感知和運動(dòng)控制。這兩者基本上相當于同一枚硬幣的兩面:無(wú)論是感知還是運動(dòng)控制,大腦都以不同的方式將預測誤差降到了最低。對于感知來(lái)說(shuō),就是校正了內部模型。對于運動(dòng)控制來(lái)說(shuō),就是實(shí)際的環(huán)境。(對于后者,可以想象一下,比如你現在想要舉手,如果這時(shí)你的手還沒(méi)有舉起來(lái),那么這種差異就會(huì )產(chǎn)生很大的預測錯誤。而你只要把手移動(dòng)一下,就把預測錯誤降到了最低。)

迄今為止,在感知和運動(dòng)控制方面的實(shí)驗為預測編碼理論提供了最有力的證據。例如,在上個(gè)月出版的《神經(jīng)科學(xué)期刊》上發(fā)表的一篇論文中,實(shí)驗者讓受試者在屏幕上讀“kick”這個(gè)詞,然后再讓他們聽(tīng)失真的錄音朗讀“pick”。許多人將后者聽(tīng)成了“kick”,功能性核磁共振掃描顯示,大腦對最初的“k”或“p”音表現出最強烈的反應 ,而這是與預測錯誤相關(guān)的音。如果大腦只是表現出其感知體驗,那么最強的信號應該與“ick”相對應(因為它在屏幕上和音頻中都有出現)。
不過(guò),有很多人在努力擴大預測編碼的應用范圍,將其擴展至感知和動(dòng)作領(lǐng)域之外,視為大腦中正在發(fā)生的一切的統一衡量標準?!斑@就像擁有可以構建不同策略的構建模塊一樣,”Clark說(shuō)。不同的大腦區域只是對不同類(lèi)型的預測進(jìn)行交易。
Friston等人聲稱(chēng),這個(gè)理論也適用于更高級的認知過(guò)程,包括注意力和決策。最近關(guān)于前額皮質(zhì)的計算工作表明,工作記憶和目標導向行為中也存在預測編碼機制。一些研究人員推測,情感和情緒也可以用預測編碼的術(shù)語(yǔ)來(lái)表達:情緒可能是大腦所表現出的用以實(shí)現內部信號(如體溫,心率或血壓)的預測誤差最小化的狀態(tài)。比如,如果大腦認識到自身的情緒激動(dòng),那么也就知道了所有這些因素都在上升。也許這也就是“自我”的概念得以出現的原因。

幾十年來(lái),倫敦大學(xué)學(xué)院的神經(jīng)科學(xué)家Karl Friston一直在完善預測編碼假設的關(guān)鍵原則。他認為,理論不僅可以解釋感知,還可以解釋更高層次的認知過(guò)程。
以這種思路取得的大部分成果都集中在預測編碼對神經(jīng)精神系統和發(fā)育障礙的解釋上。Friston說(shuō):“我認為,如果大腦是一臺推理機器,一個(gè)統計機構的話(huà),那么它就會(huì )犯下和統計學(xué)家們相同的錯誤?!币簿褪钦f(shuō),大腦也可能會(huì )因為過(guò)于重視或過(guò)于輕視預測和預測錯誤,導致得出錯誤的推論。
比如自閉癥的特征可能就是,無(wú)法忽略與大腦的最低處理層級上的感覺(jué)信號相關(guān)的預測誤差。這可能導致對感覺(jué)的關(guān)注,對重復和可預測性的需求,對某些幻想的敏感以及其他諸多影響。而對于與精神分裂癥等幻覺(jué)相關(guān)的疾病來(lái)說(shuō),情況可能正好相反:大腦可能會(huì )過(guò)多關(guān)注自身對正在發(fā)生的事情的預測,而對與這些預測相矛盾的感官信息關(guān)注不足。(專(zhuān)家們很快就要提醒你,自閉癥和精神分裂癥太復雜了,不能簡(jiǎn)化為一種解釋或機制。)
耶魯大學(xué)醫學(xué)院的臨床神經(jīng)科學(xué)家Philip Corlett說(shuō):“其中最重要的部分是向我們展示了我們的心理功能是多么脆弱?!?Corlett實(shí)驗室的實(shí)驗在健康受試者中建立了新的“信念”,鼓勵他們對之前經(jīng)歷的刺激產(chǎn)生幻覺(jué)。 (例如,在一項實(shí)驗中,科學(xué)家們讓參與者將某個(gè)聲音與某個(gè)視覺(jué)圖像聯(lián)系起來(lái)。當他們看到圖像時(shí),即使實(shí)際上根本沒(méi)有聲音,受試者也會(huì )繼續聽(tīng)到聲音。)研究人員正試圖解開(kāi)這些看法是如何轉化為感知的。通過(guò)這些研究,“我們認為有證據表明感知和認知并不是那么涇渭分明,”Corlett說(shuō)。 “新的看法可以通過(guò)教學(xué)獲得,可以改變你原來(lái)的看法?!?/span>
但當時(shí)的證據還沒(méi)能證明他的結論,而現在可以了。
“實(shí)驗結果經(jīng)常表明某個(gè)特定結果與預測處理理論兼容,但該理論并不是對結果的最佳解釋?zhuān)盨prevak說(shuō)。預測處理理論在認知科學(xué)中被廣泛接受,但“在系統神經(jīng)科學(xué)領(lǐng)域,它仍然是個(gè)弱者?!比鹗扛ダ锏吕锵!み~瑟生物醫學(xué)研究所的神經(jīng)科學(xué)家Georg Keller說(shuō)。他的實(shí)驗室正試圖用更確鑿的證據改變這一現狀。

弗里德里?!っ仔獱柹镝t學(xué)研究所的神經(jīng)科學(xué)家Georg Keller一直致力于揭示預測編碼假設的機制性證據。
在去年在《神經(jīng)元》期刊上發(fā)表的一項研究中,Keller和他的同事觀(guān)察到小鼠視覺(jué)系統中神經(jīng)元隨著(zhù)時(shí)間的推移會(huì )變得具有預測性。這個(gè)發(fā)現始于一場(chǎng)意外,當時(shí)他們在視頻游戲中訓練老鼠,卻發(fā)現在虛擬世界的方向已經(jīng)亂了。通常在實(shí)驗時(shí), 老鼠左轉時(shí)的視野都會(huì )向右側移動(dòng),反之亦然。但有人無(wú)意中顛倒了研究人員在研究中使用的虛擬世界的方向,左和右翻轉過(guò)來(lái)了,因此小鼠左轉時(shí)的視野也向左移動(dòng)了。研究人員意識到他們可以利用這次事故。他們監測了表現出這種視覺(jué)流動(dòng)的大腦信號,結果發(fā)現隨著(zhù)小鼠學(xué)習倒置環(huán)境的規則,大腦信號也慢慢出現了變化。Keller說(shuō):“這些信號看起來(lái)像是對向左方向視覺(jué)流的預測?!?/span>
如果信號只是小鼠視覺(jué)體驗的感官表現,那么這些信號就會(huì )立即在虛擬世界中出現翻轉。而如果是運動(dòng)信號,則根本不會(huì )翻轉?!皩?shí)際上是識別預測,” Keller說(shuō)。 “是對給定運動(dòng)下視覺(jué)流的預測?!?/span>
“這項研究提供了一種以前未發(fā)現的證據,”克拉克說(shuō)。 “這是一個(gè)非常局部的,逐單元、逐層的演示,說(shuō)明預測編碼模型是目前最合適的模型?!?/span>
“在該系統中發(fā)現預測錯誤,并找到預測的具體內容是很令人興奮的,”該論文的第一作者、德國哥廷根歐洲神經(jīng)科學(xué)研究所的神經(jīng)科學(xué)家Caspar Schwiedrzik說(shuō)。
德國馬普經(jīng)驗美學(xué)研究所的研究員Lucia Melloni表示,她的團隊逐步發(fā)現,這類(lèi)實(shí)驗結果與目前從人類(lèi)收集的神經(jīng)元數據中的預測誤差的解釋一致。
不是每個(gè)人都認為大腦預測編碼的理論正越來(lái)越強大。一些科學(xué)家同意這個(gè)理論可以解釋認知的某些方面,但不同意用它來(lái)解釋一切想法。也有人甚至連前者都不同意。對于紐約大學(xué)心理學(xué)教授David Heeger來(lái)說(shuō),重要的是要區分“預測編碼”和“預測處理”,他認為前者關(guān)乎信息傳輸的效率,他將后者定義為隨時(shí)間的推移而做出的預測。他說(shuō):“目前的文獻中存在很多混淆之處,因為這些東西都被認為是同一種湯的一部分。其實(shí)并不一定如此,現在的方式也不一定是最佳研究方式?!北热?,其他類(lèi)型的貝葉斯模型可能在某些情況下可以提供更準確的大腦功能描述。
然而,該領(lǐng)域的許多專(zhuān)家都認為,這項研究有可能激發(fā)機器學(xué)習的應用。目前,絕大多數人工智能研究都不涉及預測編碼,而是關(guān)注其他類(lèi)型的算法。
但弗里斯頓認為,在深度學(xué)習環(huán)境中制定預測編碼架構可以使機器更接近智能。
DeepMind的GQN就是發(fā)揮這種潛力的一個(gè)很好的例子。去年,蘇塞克斯大學(xué)的研究人員甚至使用虛擬現實(shí)和人工智能技術(shù)(其中包括預測編碼特征),打造了一臺所謂的“幻覺(jué)機器”,這種工具能夠模仿通常由迷幻藥物導致的幻覺(jué)狀態(tài)。
通過(guò)比較預測編碼模型與其他技術(shù)的表現,機器學(xué)習的進(jìn)步可用于提供關(guān)于大腦中發(fā)生的事情的新見(jiàn)解。至少,將預測編碼引入人工智能系統可以明顯提高這些機器的智能水平。
但在此之前,我們還有很多工作要做??茖W(xué)家需要繼續進(jìn)行像Keller、Schwiedrzik等人正在進(jìn)行的研究,格拉斯哥大學(xué)的神經(jīng)生理學(xué)家Lars Muckli表示,預測性編碼“對于神經(jīng)科學(xué)來(lái)說(shuō)就像是進(jìn)化對生物學(xué)一樣重要”,他對完善該理論做了大量工作。但就目前而言,Sprevak指出,“現有證據仍然不足以讓我們下定論?!?/span>
原文地址:
https://www.quantamagazine.org/to-make-sense-of-the-present-brains-may-predict-the-future-20180710/
聯(lián)系客服