核心提示:AlphaGo與李世石對戰已經(jīng)到了第五局,面對“人造吳清源”江鑄久分析了這場(chǎng)人機對弈的實(shí)質(zhì)是人人大戰,早期的人機大戰由于沒(méi)有足夠數據的支持都是人贏(yíng)。這次AlphaGo的表現確實(shí)超出職業(yè)界圍棋手的成長(cháng)思維
鳳凰衛視3月15日《鏘鏘三人行》,以下為文字實(shí)錄:
竇文濤:《鏘鏘三人行》,今天的兩位嘉賓絕對體現了業(yè)余了18年的《鏘鏘三人行》正在向專(zhuān)業(yè)化挺進(jìn),一位是咱們來(lái)過(guò)的,咱們圍棋的國手,江鑄久九段老師。感覺(jué)剛從武當山上下來(lái),江鑄久九段老師,上次您來(lái)我們這兒,您記得聊的還是棋圣吳清源老師,這回您來(lái)是因為出了個(gè)人造吳清源。
江鑄久:人機大戰事實(shí)是人人大戰
江鑄久:對,真的是可以這么說(shuō)。
竇文濤:是吧,雖然偶爾出點(diǎn)葷招,但是感覺(jué)也是大智若愚。
江鑄久:是,而且它能下出很多創(chuàng )造性的棋來(lái),其中一招我們待會(huì )兒會(huì )講到。我當時(shí)就是說(shuō)很少有這種時(shí)候,就是看到這步的時(shí)候,就覺(jué)得有點(diǎn)熱淚盈眶的感覺(jué)。
竇文濤:好,現在韓國那邊有李世石,我們這邊有江鑄久,韓國那邊有阿爾法狗,我們這邊也得來(lái)個(gè)人機大戰。您算人,您只能算機,不好意思,計算機,因為這位是咱們香港科技大學(xué)計算機系的系主任楊強老師。不過(guò),我覺(jué)著(zhù)楊強老師長(cháng)的像下圍棋的,你覺(jué)著(zhù)嗎,他有點(diǎn)像李世石那模樣,是嗎?
江鑄久:對對對。其實(shí)我們也一直說(shuō)這次媒體寫(xiě)的人機大戰事實(shí)上是人人大戰。因為是人跟職業(yè)棋手,就是說(shuō)比較好的至今為止,職業(yè)棋手是人類(lèi)最好的下棋的一些代表。跟人類(lèi)智慧、科技,人類(lèi)創(chuàng )造出來(lái)的智慧,從高科技那代來(lái)跟棋對決。
楊強:對,不僅如此,其實(shí)這次很重要的特點(diǎn)是大數據,那些數據是什么呢,就是以前人和人之間對弈的那些數據。從六段到九段收集了很多很多的數據,最后產(chǎn)生了,這是具有多大呢,三千萬(wàn)個(gè)盤(pán)來(lái)訓練這只阿爾法狗。所以,有個(gè)笑話(huà),說(shuō)第一局完了,把計算機蓋一打開(kāi),柯潔爬出來(lái)了。其實(shí)更恰當的應該是里邊爬出了一萬(wàn)多人。
竇文濤:怎么說(shuō)?
楊強:都是下圍棋的。因為他們提供了數據,對吧?
竇文濤:就是前三局輸了,我看見(jiàn)韓國人非常有民族自尊心,在這寫(xiě)文章說(shuō)谷歌應該向全世界道歉,對吧?它侮辱我們李世石,因為他說(shuō),但是我就覺(jué)得韓國人是氣的,我覺(jué)得有點(diǎn)不知道他在說(shuō)什么了。他說(shuō)他這個(gè)玩意兒是運用了幾百臺還是上千臺的電腦,然后他不是利用他已有的信息來(lái)跟我們打,他是看到李世石下的招之后,然后他怎么著(zhù)認真運算之后,他再下招。后來(lái)有的網(wǎng)友就說(shuō)那怎么意思,那還讓阿爾法下盲棋不成,是吧?
江鑄久:早期人機大戰 大數據上面支持不了
江鑄久:這也是我覺(jué)得我感興趣的地方,因為我跟著(zhù)人工智能下圍棋也二十多年了。
竇文濤:你也下過(guò)?
江鑄久:最早的一批90年代,1991年、1992年那些研究,人工智能就是電腦下棋的在硅谷的時(shí)候,我就跟他們有對話(huà)。他們那會(huì )兒把我請去的時(shí)候。
竇文濤:是跟人對話(huà),還是跟狗對話(huà)?
江鑄久:跟機器。
竇文濤:你跟狗早就下過(guò)?
江鑄久:跟電腦,這樣二十多年來(lái)就是有一些我們說(shuō)的電腦專(zhuān)家們像風(fēng)一樣,利用個(gè)人的智慧和能力,不停地在研究電腦跟人對局會(huì )怎么樣。但那個(gè)時(shí)候,就是在數據方面,它就支持不了。最明顯的例子就是,最早我跟他們下的是讓十幾個(gè),一般人讓九個(gè)我們就說(shuō)很業(yè)余了。讓十幾個(gè),我們怎么能夠對付得了他呢。就是很快摸著(zhù)他規律,你下幾個(gè)死子在那兒,機器就會(huì )不停地開(kāi)心地吃你,而下圍棋。
竇文濤:真是個(gè)鼠目寸光的家伙。
江鑄久:對,而下圍棋最重要的一點(diǎn)就是講效率,所以我們就利用他這弱點(diǎn),你丟幾個(gè)棄子我們說(shuō),他會(huì )多花一倍的兵力,1.5倍、1.4倍,你就從那里邊占到便宜了。
打劫使AlphaGo需要大量搜索 李世石這局贏(yíng)得機會(huì )非常大
竇文濤:這樣江老師,咱們先找點(diǎn)直播的感覺(jué)。我們是今天晚上播這個(gè)節目,但是現在是我們下午錄像,現在的時(shí)間是下午的兩點(diǎn)50分,這最后一局正在人機大戰。你看著(zhù)這個(gè)直播的這個(gè)棋盤(pán),我想知道您對現在的形勢怎么分析?這一局,李世石能贏(yíng)得下來(lái)嗎?
江鑄久:我覺(jué)著(zhù)這局李世石的機會(huì )非常大,如果現在要讓我投的話(huà),我覺(jué)得李世石贏(yíng)的贏(yíng)面非常非常大,如果李世石不出現重大失誤的話(huà)。而且,我們看周?chē)?,我想李世石也一定想到了,有機會(huì )就給你造成比較復雜的打劫,打劫看樣子對計算機來(lái)說(shuō)它的搜索的東西要多得多。
楊強:非常多。
竇文濤:你覺(jué)得他打劫嗎?
楊強:我來(lái)解釋一下這個(gè)原理。這個(gè)阿爾法狗它的原理實(shí)際上就是在搜索一個(gè)很大的空間。咱們打個(gè)比方吧,就好像是一個(gè)人在一個(gè)很大的迷宮里面,他想走出去,他怎么走出去呢?他只能搜索,他看看往這邊行不行,往那邊走行不行。那搜索的空間如果大的話(huà),如果問(wèn)題復雜的話(huà),那么他在一定時(shí)間之內只能搜索很小的一部分的空間,所以犯錯誤的機會(huì )就會(huì )大。所以,如果這個(gè)打劫發(fā)生的越早,那么這個(gè)混亂度就會(huì )越大。
江鑄久:而且最好這個(gè)打劫是發(fā)生在不止一塊棋,發(fā)生在兩塊棋、三塊棋,關(guān)聯(lián)五六塊的時(shí)候,事實(shí)上我們看李世石很明顯地這盤(pán)棋,現在正在進(jìn)行的,就是在各種變化里面有機會(huì )就給你搞個(gè)打劫出來(lái),或者嚇唬它,下一步你要這么來(lái)的話(huà),我就要跟你玩打劫了。那電腦如果是它的弱點(diǎn)的話(huà),原來(lái)說(shuō)它不會(huì )打劫,其實(shí)它是會(huì )的,那可能是我們猜測是它的后一個(gè)選項,第一個(gè)選項不是跟打劫。
楊強:不喜歡打劫。
江鑄久:對,不喜歡打劫。
竇文濤:這個(gè)為什么?從人工智能來(lái)講。
楊強:這是為什么呢?這個(gè)阿爾法狗里面有兩塊最重要的軟件,一塊是給你一個(gè)棋盤(pán),它來(lái)評估這個(gè)棋盤(pán)對我多有利;另外一個(gè)是說(shuō)給你一個(gè)棋盤(pán),下面這個(gè)子應該走到哪兒。
竇文濤:說(shuō)一個(gè)叫策略網(wǎng)絡(luò ),一個(gè)叫價(jià)值網(wǎng)絡(luò )。
楊強:對,說(shuō)的太對了,那么這兩個(gè)網(wǎng)絡(luò )在什么時(shí)候會(huì )犯怵呢?就是在打劫這種情況,我們叫非確定現象出現了,可能這樣,可能那樣;也許這樣,也許那樣。那么它把這些情況都放到那兒的時(shí)候,它發(fā)現一個(gè)現象出現了,數據不夠,訓練的不夠。所以,這個(gè)時(shí)候。
竇文濤:訓練還不夠?
楊強:還不夠,對,還不夠,因為那個(gè)數實(shí)在是太大了,那個(gè)數有多大呢,就是那個(gè)搜索數。有人估算過(guò),它的那個(gè)總數,那個(gè)棋盤(pán)的總數比這個(gè)全宇宙的原子還要多。
竇文濤:還多得多。
楊強:還多得多。
竇文濤:全宇宙的原子才十的八次方,大家聽(tīng)著(zhù)好像不多,其實(shí)這就是那個(gè)數學(xué)那個(gè)效應,十乘十乘80次,那就無(wú)限大了。
江鑄久:反正對人類(lèi)來(lái)說(shuō),對職業(yè)棋手來(lái)說(shuō),他看打劫他是這樣看的。一,這個(gè)打劫對我有沒(méi)有利;二,我打劫下去的劫財對我有利不有利,不有利我就不玩,有利,只要有利的時(shí)候我開(kāi)始給你打。不確定的時(shí)候,他就靠我們說(shuō)靠邏輯性來(lái)推兩下,這個(gè)打劫這個(gè)局面對我有利,我跟你打,對我沒(méi)利,我不跟你打。有利的情況就是我看看劫財對我有不有利。
江鑄久:計算機很難趕上人類(lèi)“虛”的方面
竇文濤:所以我請教您一個(gè)哲學(xué)問(wèn)題,也可以說(shuō)人類(lèi)學(xué)的問(wèn)題了。感性、直覺(jué)它最終是不是無(wú)限大的計算和無(wú)限大的邏輯?只不過(guò)人腦不能進(jìn)行那么精確的計算,所以培養出一種。實(shí)際上還是一種模糊的理性,基本上是這么回事嗎?
江鑄久:這我就不知道,但是我知道下棋對于虛的東西,原來(lái)我們一直覺(jué)得計算機很難趕上我們的一點(diǎn)就是在虛的方面表現。比方說(shuō)什么是虛呢?如果這個(gè)地方拆解,計算機很難計算出來(lái),如果這個(gè)地方死活,它都是局部空間,而一上來(lái)的布局,考慮到戰略的時(shí)候,那是需要你的經(jīng)驗,你可能有好幾條路要走,可以走,似乎都不錯。而這個(gè)時(shí)候,人的直覺(jué)、經(jīng)驗加上你的邏輯訓練出來(lái),你就會(huì )選一個(gè),我可以選一個(gè)大概方向不錯。而計算機如果這個(gè)時(shí)候,不要說(shuō)計算機,就只說(shuō)人,我們往前面推一推讓我聯(lián)想到的就是當時(shí)在上世紀一九三幾年的時(shí)候,日本理論比較厲害的就是,代表是木谷實(shí),他就是盡可能地把圍棋上的變化我都算變,來(lái)克制了很多對手。擂臺賽九連勝這些新的,但是緊跟著(zhù)從中國我們都知道,中國去了吳清源老師,而后來(lái)吳清源老師大家知道,他的理論是我無(wú)法窮盡,我的計算無(wú)法窮盡,而且也很花時(shí)間,那么我就是憑著(zhù)我的經(jīng)驗我來(lái)選出五六條路,然后我把旁邊的兩條路先去掉,剩下三個(gè)了,我把最弱的一條再去掉。
竇文濤:這不就是阿爾法狗的思路嗎?
楊強:完全是阿爾法狗的思路。
江鑄久:是。
楊強:西方的叫法叫蒙特卡洛搜索樹(shù),這個(gè)也差不多。
竇文濤:為什么,因為你們愛(ài)賭博,是嗎?
楊強:這跟賭博有關(guān),因為你是選擇在這么多里面你選擇幾個(gè),然后你就拿它來(lái)計算了,是一個(gè)我們叫抽樣,所以這個(gè)抽樣如果你抽的夠多,如果你的數據夠多,你可以非常準的。所以,這個(gè)也就是完全是您剛才說(shuō)的吳清源老師的這個(gè)直覺(jué)。
掃描屏幕下方的二維碼關(guān)注鳳凰衛視官方微信平臺,更多精彩盡在鳳凰私享會(huì )!

點(diǎn)擊關(guān)注@鳳凰私享會(huì ),更多精彩內容實(shí)時(shí)掌握
《鏘鏘三人行》鳳凰衛視中文臺播出[節目專(zhuān)區]
主持人:竇文濤[主持人專(zhuān)區]
首播時(shí)間:周一到周五 23:00-23:35
重播時(shí)間:周一至周五 13:00-13:35
聯(lián)系客服