亚洲精品久荜中文字幕_ 走出人機大戰五個(gè)誤區：人類(lèi)沒(méi)那么差，阿爾法狗不會(huì )故意輸棋

曾在線(xiàn)上快棋中取得對人類(lèi)圍棋職業(yè)高手60:0戰績(jì)的新版“阿爾法狗”，昨天又在慢棋比賽中戰勝了當今世界圍棋“第一人”柯潔。人工智能到底有多強大？圍棋已經(jīng)被“攻克”了嗎？人類(lèi)還有希望嗎？

5月24日，特約撰稿人、人工智能和大數據專(zhuān)家鄭宇就上述問(wèn)題展開(kāi)講解：

原標題：走出人機大戰五個(gè)誤區：人類(lèi)沒(méi)那么差，阿爾法狗不會(huì )故意輸棋

行至這一局面，柯潔連續抓頭發(fā)25秒，引現場(chǎng)講解一陣吐槽

5月23日，AlphaGo2.0版本在人機圍棋比賽中以四分之一子的微弱優(yōu)勢戰勝了柯潔，一方面繼續彰顯了人工智能的強大，但也讓人們對AlphaGo和人工智能有了新的認識。

先說(shuō)出結論，再看分析：

1．在圍棋這個(gè)項目上AlphaGo目前走在了人類(lèi)的前面，但并沒(méi)有完全攻克圍棋這項運動(dòng)。它只是通過(guò)深度學(xué)習找到了一個(gè)比人類(lèi)認識更優(yōu)的解，但不是最優(yōu)解。最優(yōu)解無(wú)法找到，即便用盡地球上所有的資源。從專(zhuān)業(yè)的角度來(lái)講，就是用深度學(xué)習去逼近了一個(gè)強化學(xué)習中的價(jià)值判斷函數，然后再跟蒙特卡洛搜索樹(shù)結合的方法（具體詳解可參看《鄭宇：一張圖解ALphaGo原理及弱點(diǎn)》，不再重復）。既然人工智能和人類(lèi)都不能找到最優(yōu)解，現在說(shuō)哪一方已經(jīng)完全徹底的失敗還早。

2. 人類(lèi)也是在進(jìn)步的，我們也不要低估了人類(lèi)后天的快速（小樣本）學(xué)習能力，這點(diǎn)AlphaGo基于現在的學(xué)習方法還做不到。短期來(lái)看人獲勝概率小，但長(cháng)遠來(lái)看（未來(lái)5-10年）人還有機會(huì )，因為人也有很強的學(xué)習能力，可以從少量跟AlphaGo的對弈的棋局中快速學(xué)習。而即便再給AlphaGo1億副棋譜，再添加一萬(wàn)塊GPU，如果還是基于現有的學(xué)習體系，它進(jìn)步的速度也終將放緩，因為新增的棋譜和計算資源相對于2x10171這個(gè)搜索空間來(lái)說(shuō)只是滄海一粟。我們對人腦的了解還遠不如對圍棋的認識，這里面還有很大的未知數。

柯潔開(kāi)局下出兩手“三·3”，已然顛覆至少二十年來(lái)的圍棋棋理（截自圍棋社交App“弈客”）

（但實(shí)際上，柯潔這樣下并不是心血來(lái)潮，他在各種職業(yè)比賽中已多次用這樣的招數與其他職業(yè)高手“過(guò)招”。最近的中國“圍甲”職業(yè)比賽中，各種“狗招”<阿爾法狗的招數>也已層出不窮，大家都在以自己的理解嘗試人工智能下出的招數。而柯潔等職業(yè)棋手的“喂招拆招”，也是中國自己的圍棋人工智能“絕藝”快速成長(cháng)的重要因素。）

事實(shí)上，這一招柯潔已在對人類(lèi)的對局中嘗試多次（截自圍棋社交App“弈客”）

現就讀北大哲學(xué)系的“學(xué)者型棋手”李喆，也嘗試多種新招（截自圍棋社交App“弈客”）

3. 目前人類(lèi)職業(yè)棋手跟AlphaGo的差距也就在一個(gè)貼目的水平，沒(méi)有大家想象的那么大。其實(shí)這個(gè)貼目的差距（按中國標準7目半），在職業(yè)棋手看來(lái)，已經(jīng)是非常大的差距了。很多職業(yè)高手，進(jìn)入官子階段后發(fā)現自己還落后對方7-8目，就會(huì )主動(dòng)投子認輸了。很多通過(guò)數子來(lái)決定勝負的比賽，輸贏(yíng)往往都在1-2目之間（比如柯潔就輸給AlphaGo半目）。否則會(huì )被其他專(zhuān)業(yè)棋手笑話(huà)，自己落后那么多都不知道，點(diǎn)空能力太弱了。

要能真正客觀(guān)、準確的看待這個(gè)問(wèn)題急需要較強的人工智能專(zhuān)業(yè)知識，也需要一定的圍棋功底。下面先糾正網(wǎng)上認知的一些誤區：

誤區一：AlphaGo可以讓人類(lèi)頂尖棋手4個(gè)子，AlphaGo2.0可以讓上一個(gè)版本4-5個(gè)子。

要消除這個(gè)誤解，首先要跟大家普及一下圍棋知識：在圍棋里“讓對方兩個(gè)子”和“贏(yíng)對方2個(gè)子”有著(zhù)天壤之別。這點(diǎn)對于下圍棋的人不用多說(shuō)，但我今天才意識到，很多吃瓜群眾一直以為這就是一回事。難怪網(wǎng)上會(huì )流傳以上的錯誤言論。

讓對方兩個(gè)子: 在圍棋里讓2子是說(shuō)讓一方先在棋盤(pán)上放上2個(gè)棋子（棋子只能放在星位），然后對方才開(kāi)始走。這兩個(gè)子在對弈之初的價(jià)值巨大，對于專(zhuān)業(yè)棋手來(lái)講，每個(gè)棋子價(jià)值至少在10目以上（這是最保守估計了）。讓兩子相當于至少先讓出去對方20多目的地盤(pán)。由于棋盤(pán)是有限的，如果不能在后面的比賽中，在有限的空間里贏(yíng)回這20多目，那就是讓子失敗了。而且讓子數越多，被讓方獲得的價(jià)值不單是線(xiàn)性增長(cháng)的，因為子力之間會(huì )形成配合，獲取更大的利益。比如說(shuō)，讓子，其價(jià)值就可能遠不止40目了。

贏(yíng)對方2個(gè)子：是指雙方下完后，贏(yíng)的一方比輸的一方多出2個(gè)子。如果按照吃住對方一個(gè)子算兩目的方法來(lái)算，那2個(gè)子只相當于4目。AlphaGo贏(yíng)了柯潔1/4子，就相當于半目棋子而已。

所以“讓對方兩個(gè)子”和“贏(yíng)對方2個(gè)子”不可同年而語(yǔ)。如果真的有圍棋之神存在（既他一定能找到最優(yōu)解，我們人是沒(méi)有希望下過(guò)他的），一般頂尖專(zhuān)業(yè)棋手認為他們跟這個(gè)神的差距在讓2-3子之間。由于A(yíng)lphaGo可以被證明不能保證找到最優(yōu)解，所以他離神還有一定的距離。因此，說(shuō)AlphaGo可以讓人類(lèi)頂尖棋手4個(gè)子，這簡(jiǎn)直就是天方夜談。

誤區二：AlphaGo也會(huì )下出一些明顯不好的招數，是因為他自我判斷形式占優(yōu)，而放松了自身的要求。

AlphaGo的搜索策略就是優(yōu)先對獲勝概率比較大的分支進(jìn)行更多的深度搜索，這個(gè)策略在任何時(shí)候都不會(huì )改變，也不能改變。他不會(huì )覺(jué)得自己優(yōu)勢了就下出緩手。下得不好的時(shí)候是因為其價(jià)值判斷本來(lái)就是一個(gè)近似，而且搜索空間也不能窮盡，得不到最優(yōu)解，因此，有時(shí)估計還不錯的棋，其實(shí)不一定是真的最好的下法，AlphaGo出現這種不穩定狀況是正常的。這也是人類(lèi)善存的希望所在。當然人類(lèi)也有自身的弱點(diǎn)，如疲勞、情緒波動(dòng)等，人也會(huì )判斷失誤。而且棋局很長(cháng)，有些之前不太好的棋，經(jīng)過(guò)后面的變化（包括不是預料中的變化）有可能會(huì )變成好棋。所以，不是所有的錯誤，都會(huì )直接影響到比賽的結果。而且現在大家似乎有點(diǎn)怕AlphaGo了，即便是AlphaGo下出一招不好的棋，大家更多的是懷疑自己的水平（是不是我們沒(méi)看懂??？），而選擇相信AlphaGo的“深謀遠慮“。

誤區三：AlphaGo可以不斷自學(xué)習，從新的棋局里獲取經(jīng)驗，快速提升自己。

AlphaGo的系統由于參數非常多，需要大量的數據來(lái)訓練，新增的幾幅棋譜對提高它的棋力起不到任何作用。而且AlphaGo在做參數調整時(shí)是針對一大批數據的整體優(yōu)化，也必須對很多棋譜做批量處理，訓練時(shí)間非常長(cháng)，不可能在很短時(shí)間內大幅提升自身的水平。即便是同一組訓練棋譜，參數調整方法不一樣也會(huì )訓練出棋力水平差異較大的系統。其實(shí)AlphaGo是通過(guò)自我對弈來(lái)生成很多棋譜，然后利用棋譜中的（兩個(gè)連續的）盤(pán)面跟最后的勝負對應關(guān)系訓練出價(jià)值網(wǎng)絡(luò )來(lái)。這里只是借用了一下強化學(xué)習的框架來(lái)訓練深度神經(jīng)網(wǎng)絡(luò )的參數而已，主要貢獻還是深度學(xué)習的近似能力帶來(lái)的（解決了傳統強化學(xué)習針對復雜環(huán)境和動(dòng)作狀態(tài)無(wú)法求解的難題）。因此，AlphaGo并沒(méi)有大家想象的那種自我博弈就能自己不斷進(jìn)步的能力。

誤區四：AlphaGo會(huì )故意放水輸掉一局比賽。

這個(gè)沒(méi)有可能。要想輸還不能輸的那么難看和明顯，是一件非常難辦的事情，可能比贏(yíng)棋還要難。在模型訓練好之后，AlphaGo能夠臨時(shí)改動(dòng)的只有在搜索部分投入的資源多少（搜索多大的空間）可以改動(dòng)?？s減的太小，幾乎不會(huì )有太大變化，但如果縮減太多，就會(huì )下出一些非常低級的棋來(lái)。這點(diǎn)從技術(shù)角度來(lái)講很難把握。

誤區五：計算機的計算能力一定比人強，所以不要去跟AlphaGo比計算，應該把局面簡(jiǎn)單化，避免復雜的戰斗。

AlphaGo依靠的是一種基于樹(shù)的搜索算法，遇到復雜局面搜索空間變大，對未來(lái)輸贏(yíng)的價(jià)值判斷也會(huì )變難。因此，人算不過(guò)來(lái)的復雜局面，對AlphaGo來(lái)說(shuō)也很困難。如果局面太簡(jiǎn)單，機器可以非常好的計算出比較優(yōu)的解，人類(lèi)棋手更加沒(méi)有希望。因此，把局面弄復雜，人類(lèi)棋手才有希望獲勝，雖然這個(gè)對人類(lèi)也提出了更大的挑戰。

總結

基于人類(lèi)目前對圍棋的認識和理解，現階段仍然會(huì )輸給人工智能。我并不是覺(jué)得柯潔有希望能夠贏(yíng)得后面的比賽，但人類(lèi)也在進(jìn)步，通過(guò)跟AlphaGo的對弈，人類(lèi)也在重新認識圍棋。只要人類(lèi)的思想和文明在不斷進(jìn)步，人就有可能在未來(lái)5-10年里通過(guò)不斷的學(xué)習趕上當前的AlphaGo。當然，AlphaGo也會(huì )進(jìn)步，但它還不是圍棋之神，也沒(méi)有攻克圍棋這個(gè)難題。如果現有的學(xué)習方法沒(méi)有全面的革新，其進(jìn)步的速度也會(huì )慢慢放緩?；诖丝紤]，人類(lèi)還會(huì )有機會(huì )。當人們對圍棋有了更深入的了解之后，又會(huì )設計出更好的人工智能算法。兩者其實(shí)并不矛盾，相輔相成，互相促進(jìn)，不管誰(shuí)輸誰(shuí)贏(yíng)都是人類(lèi)文明進(jìn)步的體現。人類(lèi)的智能也將始終走在機器的前面，而不會(huì )被機器取代。

看到阿爾法狗下出這手極富創(chuàng )造力的“大飛”，柯潔一邊不住撓頭，一邊不停微笑。真正熱愛(ài)圍棋的人，看到這種“天才”的招式，都是既興奮又好奇的吧。

（作者：鄭宇，CCF杰出會(huì )員、CCCF編委、CCF ADL工作組組長(cháng)，微軟亞洲研究院資深研究員、“城市計算”領(lǐng)域負責人、上海交通大學(xué)講座教授、香港科技大學(xué)客座教授；擔任人工智能?chē)H權威期刊（SCI一區刊物）ACM TIST主編、ACM數據挖掘中國分會(huì )（KDD China）秘書(shū)長(cháng)；擔任國際知名會(huì )議ICDE2014和CIKM2017程序委員會(huì )主席（Industrial Track）；在頂尖國際會(huì )議和期刊上發(fā)表論文百余篇（其中以主作者身份發(fā)表論文50余篇），論文被引用13000余次，Google Scholar H-Index 53（截至2017-5-23）， 2016年論文單年被引用3400余次。他主持開(kāi)發(fā)了多個(gè)城市大數據系統，其中Urban Air首次利用大數據來(lái)監測和預報細粒度空氣質(zhì)量，該服務(wù)覆蓋了中國的300多個(gè)城市，并被中國環(huán)境保護部采用。他主持了城市大數據平臺的設計和實(shí)施，并成功在中國大數據示范基地貴陽(yáng)市部署。2013年他被MIT科技評論評為“全球杰出青年創(chuàng )新者”（TR35），并作為現代創(chuàng )新者代表登上了美國《時(shí)代》周刊。2014年，由于他主導的城市計算具有巨大的商業(yè)前景和改變行業(yè)格局的潛力，他被美國《財富》評選為中國40位40歲以下商界精英。2016年他被評為美國計算機學(xué)會(huì )杰出科學(xué)家。)

http://www.guancha.cn/industry-science/2017_05_24_409891.shtml

本站僅提供存儲服務(wù)，所有內容均由用戶(hù)發(fā)布，如發(fā)現有害或侵權內容，請點(diǎn)擊舉報。

欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久