柯潔輸了！人不是那個(gè)人，「狗」更不是那個(gè)「狗」

圓角望 2017-05-23

展開全文

??柯潔還是輸了！

2017 年 5 月 23 日，在舉行于中國烏鎮(zhèn)的“人機(jī)終極對(duì)決”第一局中，當(dāng)今世界排名第一的中國圍棋選手柯潔，輸給了 Google 旗下的人工智能程序 AlphaGo。

按照比賽規(guī)則，柯潔和 AlphaGo 各有三個(gè)小時(shí)的時(shí)間；但在現(xiàn)場(chǎng)的比賽中，整體的節(jié)奏比預(yù)想中的要快很多。尤其是 AlphaGo，它的平均出子時(shí)間為 30 秒左右，現(xiàn)場(chǎng)解說的職業(yè)八段棋手張璇和職業(yè)九段棋手常昊多次用“高效、果斷”來評(píng)價(jià)它的表現(xiàn)。而柯潔的應(yīng)對(duì)狀況比較多變，有時(shí)會(huì)立刻下子，有時(shí)也會(huì)思考很長(zhǎng)時(shí)間。

愛范兒（微信 ID：ifanr）在現(xiàn)場(chǎng)注意到，當(dāng)柯潔用時(shí)一個(gè)小時(shí)的時(shí)候，AlphaGo 所用的時(shí)間不到二十分鐘。

最終比賽的結(jié)果也并不十分出人意料，在比賽進(jìn)行了四個(gè)多小時(shí)之后，柯潔九段執(zhí)黑負(fù)于 AlphaGo，AlphaGo 贏四分之一子。

不過，關(guān)于這場(chǎng)“人機(jī)終結(jié)對(duì)決”的最終結(jié)果，目前還存在一定的變數(shù)；今天只是這場(chǎng)對(duì)決的第一局，第二局和第三局將分別在 5 月 25 日和 5 月 27 日舉行，愛范兒（微信 ID：ifanr）將保持關(guān)注。

關(guān)注微信公眾號(hào)愛范兒（微信號(hào)：ifanr），回復(fù)關(guān)鍵詞「阿爾法狗」，獲取 AlphaGo 下圍棋的干貨，了解機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的區(qū)別。

這次的狗，亦敵亦友

就在昨天晚上，柯潔在新浪微博發(fā)表了題為《最后的對(duì)決》的賽前宣言，不無傷感地提到：

決戰(zhàn)前夕，感慨萬千…
在這個(gè)特殊的時(shí)間，我有些話想和熱愛圍棋、關(guān)注圍棋、關(guān)注我的朋友們說:
無論輸贏，這都將是我與人工智能最后的三盤對(duì)局

這種離別的氣氛，反而給了這次比賽更多“且看且珍惜”的意義。

今天的比賽之后，柯潔還將在 25 日和 27 日進(jìn)行對(duì) AlphaGo 的后兩盤對(duì)決，無論第二局輸贏，三盤比賽都將完成，與之前 1 月份化身 Master 的 AlphaGo 要求下快棋不同，本次比賽采用傳統(tǒng)規(guī)則，雙方各有三小時(shí)的時(shí)間。

直到本次“中國烏鎮(zhèn)·圍棋峰會(huì)”，已是 AlphaGo 第三次刷屏，前兩次人機(jī)對(duì)決的場(chǎng)景還歷歷在目，但整個(gè)人類世界對(duì)于兩方選手的感情卻發(fā)生了顛覆性的變化。

2016 年 3 月，AlphaGo 首次挑戰(zhàn)韓國棋手李世石時(shí)，整個(gè)世界都希望 AI 獲勝，就像柯潔當(dāng)時(shí)所說，“就算阿法狗贏了李世石，它也贏不了我”，大家以看熱鬧的心態(tài)打量著新生者 AI。

而當(dāng) 2017 年 1 月，化身 Master 的 AlphaGo 在互聯(lián)網(wǎng)上連掃世界第一柯潔、韓國冠軍樸廷桓、日本冠軍井山裕太時(shí)，AI 似乎已經(jīng)不可戰(zhàn)勝，柯潔也在微博深夜感慨“人類千年的實(shí)戰(zhàn)演練進(jìn)化，計(jì)算機(jī)卻告訴我們，人類全都是錯(cuò)的……”

直到今天，當(dāng)柯潔在賽前說到“能夠代表人類出戰(zhàn)，是我以前不敢想象的事情，這次選擇我作為主角，我也會(huì)竭盡全力去一爭(zhēng)勝負(fù)”時(shí)，世界的選擇已經(jīng)變成了希望人類贏一盤。

這種心態(tài)在賽制上也有所體現(xiàn)，除了代表中國選手最高水平的柯潔個(gè)人之外，新加入的配對(duì)賽和團(tuán)體賽也非常值得關(guān)注。

配對(duì)賽將由古力、連笑兩位九段當(dāng)中的一人分別與 AlphaGo 組隊(duì)，再與剩下的一人進(jìn)行對(duì)決，每方只有 1 小時(shí)時(shí)間，比賽在 26 日上午打響

團(tuán)隊(duì)賽則是時(shí)越、羋昱廷、唐韋星、陳耀燁和周睿羊 5 位世界冠軍組成人類聯(lián)隊(duì)，合力對(duì)抗 AlphaGo，每方 2 小時(shí) 30 分鐘，這將在 26 日下午進(jìn)行。

當(dāng) 1 對(duì) 1 的對(duì)決已經(jīng)過于殘酷，人機(jī)組隊(duì)又會(huì)擦出怎樣的火花，人類聯(lián)合組成的“神經(jīng)網(wǎng)絡(luò)”面對(duì) AI 又是否還有勝算呢？

人不是那個(gè)人，狗不是那條狗

千萬別以為“坐”在場(chǎng)上對(duì)弈的雙方一年來都沒有變過，用很哲學(xué)的說法來說，他們都已經(jīng)不再是當(dāng)年那個(gè)存在。

自從今年 4 月確定了本次人機(jī)對(duì)決之后，柯潔已經(jīng)有意識(shí)地在尋找對(duì)抗 AlphaGo 的“神之一手”，在先前進(jìn)行的新奧杯世界賽和中國圍甲聯(lián)賽中，柯潔在 8 盤比賽中輸?shù)袅藘杀P，而這兩盤中出現(xiàn)了一些之前并不常見的運(yùn)子方法，有觀察者表示這是柯潔在嘗試以傳統(tǒng)套路之外的方法尋找 AlphaGo 的軟肋。

從這個(gè)角度講，這三盤比賽中的柯潔的策略或許將與之前完全不同。

（那一年，柯潔的世界排名還在 AlphaGo 前面）

但 AlphaGo，恐怕在以令人絕望的迭代速度進(jìn)化著。同樣在今年 4 月，AlphaGo 之父哈薩比斯在英國劍橋大學(xué)進(jìn)行了演講，專門提到為了幫助 AlphaGo 提升，他們還開發(fā)了名為 Anti-AlphaGo 的防止過擬合的擾亂工具，之前 AlphaGo 提升一個(gè)版本需要 3 個(gè)月，現(xiàn)在只需要 1 周。

AlphaGo 對(duì)陣?yán)钍朗瘯r(shí)的版本號(hào)是 V18，而當(dāng)下的版本估計(jì)已經(jīng)到了 V60，在邏輯上和棋局策略上已經(jīng)今非昔比。

這種進(jìn)化的力量源泉與意義，是蒙特卡洛搜索算法和深度學(xué)習(xí)模式的不斷進(jìn)化。

為了解釋上面這兩個(gè)似乎每個(gè)字都能看懂，但其實(shí)都看不懂的詞，我們先來看兩組數(shù)字。

如果讀過人工智能的科普文章的話，一定知道 20 年前的 1996 年 5 月，IBM 的?“深藍(lán)”計(jì)算機(jī)在國際象棋中戰(zhàn)勝了世界排名第一的卡斯帕羅夫。

從數(shù)學(xué)上考慮，國際象棋棋盤上能夠發(fā)生的不同可能大約是 10 的 46 次方，也就是 10000000000000000000000000000000000000000000000。

但這在圍棋面前就是小巫見大巫了，圍棋共有 19X19 個(gè)落棋點(diǎn)，加上不同的落字方式，全部可能大約是 10 的 170 次方左右，根據(jù)荷蘭科學(xué)家 John Tromp 的計(jì)算，大約是 208168199381979984699478633344862770286522453884530548425639456820927419612738015378525648451698519643907259916015628128546089888314427129715319317557736620397247064840935。

大家知道，困擾人類很多問題的原因在于算力，比如一個(gè)密碼鎖，如果只有兩位，那么如果忘了密碼很多人都會(huì)嘗試去從 00 試驗(yàn)到 99，但 4 位數(shù)的手機(jī)密碼就沒幾個(gè)人去試了，因?yàn)樵嚦鰜砘ǖ臅r(shí)間太長(zhǎng)，這就是算力不夠。

對(duì)于現(xiàn)在的 AI 來說，對(duì)弈國際象棋所需的算力已經(jīng)基本達(dá)到，但是妄圖用窮舉法算出來圍棋的各種可能的算力還沒達(dá)到，這種情況下，就要考慮算法了。

而 AlphaGo，就采取了一種“大智若愚”的辦法，讓算力不足的計(jì)算機(jī)“大愚若智”起來。

這就是蒙特卡洛搜索算法，我們明白，很多時(shí)候兩人對(duì)決，其實(shí)不需要每一步都走當(dāng)時(shí)最好的那一招，只要出的招是妙招，或者比對(duì)方能想象的好就行。這時(shí)候，就是一個(gè)概率問題。

舉個(gè)非常簡(jiǎn)單的例子，從你家到火車站共有 ABCDE 五條路，或許你不知道每條路具體的長(zhǎng)度和用時(shí)，但此時(shí)，如果從你家同時(shí)出發(fā) 500 人，每條路 100 人，然后你到火車站去觀察，假設(shè)半小時(shí)內(nèi)到達(dá)的人里，走 B 的最多，你就可以斷定走 B 是條好路。

當(dāng)然，路越多，路口越多，這種情況的分析會(huì)越復(fù)雜，但是放出的人越多，結(jié)果也會(huì)越精確，雖然沒有人能打包票說某條路一定是最對(duì)的，但是分析結(jié)果足夠做決策了。

這是用最最不嚴(yán)謹(jǐn)?shù)姆椒ń忉屃诉@種概率學(xué)的取樣方法，但這相比逐項(xiàng)窮舉的辦法，大大前進(jìn)了一步。

而深度學(xué)習(xí)，指的是 AlphaGo 會(huì)根據(jù)之前人類棋手的大量歷史棋局，記錄下每個(gè)棋局當(dāng)中的分步局面，并把當(dāng)前的棋局按照進(jìn)行視覺分析，跟以往的數(shù)據(jù)進(jìn)行比較，找到最類似的局面，再在當(dāng)前最高質(zhì)量的點(diǎn)上去下子，不至于把所有的位置都考慮一遍。

而當(dāng)下版本 AlphaGo 最駭人之處，在于它已經(jīng)跳出了學(xué)習(xí)人類棋盤的方法，而進(jìn)入了自己左右手互搏，自己學(xué)習(xí)各種情況的局面，一方面它所學(xué)習(xí)到的棋局廣度非人類可想象，另一方面它的出招可能越來越?jīng)]有“套路”可言。

更別提 AlphaGo 只要有電就可以無休止學(xué)習(xí)這件事了，由于圍棋本身有明確的規(guī)則判斷勝負(fù)，所以 AlphaGo 可以在無需人類標(biāo)注的情況下就能判斷自己出招的好壞，更是強(qiáng)化學(xué)習(xí)的一大優(yōu)勢(shì)。

現(xiàn)在的狗，是人類智慧和機(jī)器智慧的結(jié)合體了。

明知不可為而為之，是為了費(fèi)電么

我預(yù)測(cè)結(jié)果是 0 比 3，AlphaGo 勝出——聶衛(wèi)平
人類的勝算為 0 ——李開復(fù)

既然在比賽層面，已經(jīng)如此的沒有看點(diǎn)，為什么人機(jī)對(duì)抗還要繼續(xù)進(jìn)行呢？

賽前有媒體認(rèn)為，這是為了向社會(huì)繼續(xù)推廣 AI 的概念，為行業(yè)的發(fā)展做宣傳，這種說法雖然都有一定的合理性，但格局未免太小。

就像在手機(jī)應(yīng)用商店中會(huì)在“益智游戲”中找到圍棋一樣，進(jìn)行這種游戲的目的還是為了益智。

而進(jìn)行 AI 于人類的對(duì)抗，根本目的還是檢驗(yàn)和優(yōu)化算法，并且力爭(zhēng)在其他更有價(jià)值的行業(yè)中進(jìn)行應(yīng)用。

就像在《智能革命》一書中，李彥宏說的那樣，“2017 年初，AlphaGo 的變身 Master 橫掃中韓頂級(jí)高手，一時(shí)間人們分化為悲觀派、降臨派、冷靜派、腦洞派……我們希望有更多人是默默學(xué)習(xí)派”。

從最初的 AlphaGo，到 Master，再到今天的 AlphaGo，三代產(chǎn)品，三段歷程，對(duì)應(yīng)的恰好是“理論，實(shí)驗(yàn)，再創(chuàng)新”的三段論。

而這種基于互聯(lián)網(wǎng)大數(shù)據(jù)的深度學(xué)習(xí)和決策支持系統(tǒng)，將在很多人類算力不可及的領(lǐng)域提供支撐。

Google 大中華區(qū)總裁石博盟就透露，AlphaGo 的第一個(gè)結(jié)合點(diǎn)會(huì)是醫(yī)療領(lǐng)域，AI 將在一定準(zhǔn)確率的情況下，給予醫(yī)生診療判定方面的輔助，對(duì)于糖尿病、癌癥等疾病的治療和研究大有裨益。

而未來在更大的深度和廣度上，AlphaGo 積累的決策模型，將逐漸把人力從需要反復(fù)的勞動(dòng)中解放出來，同時(shí)對(duì)腦力勞動(dòng)進(jìn)行反哺，對(duì)絕大多數(shù)社會(huì)元素進(jìn)行快速解構(gòu)并解讀，再反饋給人類。

如同去年大熱的科幻片《降臨》一樣，人工智能與人類本體，終將會(huì)找到一條智慧結(jié)合的發(fā)展大路。

最后，我想以暢銷書《深澤直人》中文譯者路意今早創(chuàng)作的《最后一局人機(jī)對(duì)弈》當(dāng)中的一段話做結(jié)：

在今年閱讀到 Jacob Bronowski 的 The Ascent of Man 的時(shí)候，被他所寫到的生物界中，只有人可以遠(yuǎn)離他所誕生的環(huán)境，甚至在極端不適合生存的地方生活所啟示，人之所以能夠具備現(xiàn)在的能力，必然是與其敢于離開自己的舒適區(qū)有關(guān)。而藝術(shù)，愛，智商，想象力，創(chuàng)造力…這些似乎都不能是必要條件，而更像是在數(shù)十萬年中，人類在不斷抗?fàn)幒妥穼?mèng)想的過程中所進(jìn)化出的特質(zhì)。

智能是人可以步入今日之成就的必要條件，但非充分條件。機(jī)器智能想必也會(huì)如此，大多數(shù)是不會(huì)具備人的意識(shí)的，但是不可排除的是，隨著時(shí)間的推移，其中有些會(huì)開始覺醒，擁有自我意識(shí)，開始抗?fàn)?，和追尋?mèng)想，也會(huì)有貪嗔癡，真善美。

那時(shí)，它們自然也可稱之為人。人也不再只限一個(gè)血肉之軀。

文章評(píng)論(-)正在加載中

說說你的看法????

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：圓角望 > 《雜聞》

舉報(bào)/認(rèn)領(lǐng)