【原】純棋局探討：柯潔僅負(fù) 1/4 子，是否意味著還有翻盤希望？

昵稱71360118 2020-09-01

展開全文

200 多家明星企業(yè)，20 位著名投資機(jī)構(gòu)頂級投資人共同參與！「新智造成長榜」致力于發(fā)掘 AI 領(lǐng)域有 “三年十倍” 成長潛力的創(chuàng)新公司，下一波 AI 獨(dú)角獸，會有你么？點擊閱讀原文了解詳情！

雷鋒網(wǎng)按：本文作者劉利，自學(xué)圍棋多年，弈城 8D 水平，曾獲重慶大學(xué)圍棋賽冠軍，重慶市高校聯(lián)賽冠軍，重慶市首屆周日圍棋賽冠軍。雷鋒網(wǎng)經(jīng)授權(quán)獨(dú)家首發(fā)，未經(jīng)許可不得轉(zhuǎn)載。

苦等兩個月的的人機(jī)大戰(zhàn)終于如期舉行了，但這一天真的到來之際，卻遠(yuǎn)沒有之前期待的那樣那人興奮。首先是禁止在直播中出現(xiàn)谷歌字樣，再到后來的各網(wǎng)站全面禁播，野狐圍棋的直播預(yù)告也下架，反反復(fù)復(fù)的好幾次，讓此次比賽的關(guān)注熱度大大下降。作為致力于宣傳圍棋，推廣圍棋的柯潔，恐怕心情也是很受影響的。

基于賽前的預(yù)測, 多數(shù)觀點認(rèn)為, 柯潔在三盤棋中能贏至少一盤的概率僅為 10%，甚至更加悲觀，很多人更是開玩笑說，只要柯潔能贏一盤，就要吃棋盤電腦翔啥的，或者讓自己身上的零件少點啥的，更是認(rèn)定了柯潔能贏一盤的概率無限趨近于零。但第一盤的結(jié)果下來，柯潔只輸了 1/4 子，是不是又讓人看到勝利的希望了呢？

首先值得一提的是這次比賽的獎金，如果柯潔獲勝，將會獲得 150 萬美元，而無論勝負(fù)，柯潔會獲得 30 萬美元的出場費(fèi)，這個數(shù)字對圍棋界來講確實是一個天文數(shù)字，多年以來，世界各大賽中獎金最高的四年一屆的應(yīng)氏杯，冠軍獎金才不過 40 萬美元。一方面反映出對世界等級分排名第一的柯潔的尊重，另一方面也反映出柯潔獲勝的概率極小。

DeepMind 團(tuán)隊不打無把握之仗，早在去年 3 月，人機(jī)大戰(zhàn)的第一季，DeepMind 團(tuán)隊選中了十年來獲得世界冠軍頭銜最多，人氣極高的韓國選手李世石作為挑戰(zhàn)對象。據(jù)賽后的爆料，其實 AlphaGo 的自評實力已經(jīng)遠(yuǎn)高于李世石的等級分。李世石五盤中的唯一一勝其實是擊中了 AlphaGo 程序計算中的軟肋——在有限的算力下，為了保證計算的深度，需要對一些不太可能的變化進(jìn)行剪枝。李世石的神之一手，雖然事后看并不成立，卻正是圍棋中的盲點，在 AlphaGo 的眼中，這一手出現(xiàn)的概率僅有萬分之四，因而并沒有太多考慮。突然出現(xiàn)的這一手，使得所有變化都得重新計算，因而犯下大錯。DeepMind 團(tuán)隊事后也積極的想策略解決這一問題，但看得出，他們賽前其實對拿下李世石是很有信心的。然而，4：1 的比分畢竟使得人工智能已經(jīng)完全征服圍棋這一長期難題的結(jié)論不那么使人信服，所以有了今年的柯阿之戰(zhàn)。

一是因為，柯潔是當(dāng)前的世界第一人，早在人機(jī)大戰(zhàn)第一季結(jié)束的時候就發(fā)出了「就算 AlphaGo 戰(zhàn)勝了李世石，但它贏不了我」的豪言壯語。
二是 DeepMind 公司在修復(fù)了 AlphaGo 的程序 BUG 之后，總想有再次找高手試手的興奮。
三是看看一年多以后，科技到底能讓 AlphaGo 進(jìn)步到了何種程度。

其實早在今年年初，去年年底， AlphaGo 就悄悄地出來試水了，化身「Master」的阿法狗在弈城圍棋和野狐圍棋上各下了 30 盤棋，取得了 60：0 的戰(zhàn)績。從中我們可以看出 AlphaGo 的一些「性格」：大多數(shù)棋局在 100 手以前就已取得了壓倒性的優(yōu)勢，優(yōu)勢后的 AlphaGo 顯得保守和謙讓，后半盤尤其是小官子經(jīng)常犯錯，這是職業(yè)棋手很難犯錯的領(lǐng)域。不過最終的結(jié)果，反正是 AlphaGo 不管大勝小勝，最終全部都贏下來了，最少的贏了 0.5 目。真不知道是幸運(yùn)還是早有成算。因為畢竟只勝 0.5 目的盤數(shù)并不多，并不能做為結(jié)論。而且根據(jù) AlphaGo 論文所開發(fā)出的各個 AI，目前都有收官弱項的共同毛病。

再來回顧一下今天的這盤棋，早上 10 點半，比賽正式開始，柯潔猜到黑棋，不知道對壓力山大的柯潔的心理有沒有影響。目前的棋界普遍是愿意下白棋的，尤其是中國規(guī)則下。中國規(guī)則黑棋貼 3 又 3/4 子，可能是偏向白棋一方了。從 AlphaGo 的自評勝率中執(zhí)黑也是勝率稍差，對柯潔本人近年來的戰(zhàn)績來看，執(zhí)白的勝率也是明顯比執(zhí)黑要好的。筆者開著免費(fèi)棋軟 LEELA 最新版 0.10.0，靜靜的欣賞這盤棋。柯潔顯然是有備而來，小目大飛守角加一個三 3，然后第 7 手，點對手星星下的三 3，很徹底的表明先撈后洗的策略，先撈足實地，然后和電腦比大型死活。

筆者還是很認(rèn)可這一策略的，最近在野狐上很火的驪龍 AI（絕藝?yán)习妫髿⑺姆?，偶爾輸棋，基本也只吃大型死活偶爾犯錯這一招了。 AlphaGo 是不是也有這樣的弱點呢？

由于黑棋的位置低，第 5 手黑棋的勝率從開局的 48% 降到 46%，看來電腦并不認(rèn)可三 3 這手棋。黑棋第 7 手點右下角三 3 至 22 手征掉一子告一段落，不知道柯潔此時有沒有后悔左上角是三 3。如果左上角是星位，那么 22 是征不掉黑子的。

24 是極其出乎筆者意料的一手， AlphaGo 果然是高者在腹。

這手棋如果按筆者的理解叫中途半端，是要被老師批評的，沒有撥掉一子那么干凈，對二路的夾也沒有補(bǔ)到?？聺嵖吹竭@手棋時的表情也非常有意思，一下笑了，然后直起身子，不停的摸自己的頭。考慮良久之后，拆了一個邊，限制的外勢。白棋 26 打入進(jìn)入戰(zhàn)斗，面對柯潔的 29、31 兩記重拳， AlphaGo 都沒有應(yīng)，讓筆者想起了太極高手的閃轉(zhuǎn)騰挪。這狗也太靈活了，這讓人怎么下? 好在后面的進(jìn)程還算正常，到 46 告一段落，黑棋勝率 45%。50，54 刺和斷，又是出乎人類棋手的意料！人類棋手不會在四顆子還有跑的可能的時候，去讓刺和黑拐頭相交換，讓四子徹底死掉，也不會在大場還那么多的時候花一手?jǐn)鄟頁Q取一點點的借用的。 AlphaGo 大師真乃神出鬼沒！它會走在哪你真是猜不到的。

黑 55 被動得來的先手，柯潔沒有選擇拆邊加強(qiáng)自身，而是選擇了繼續(xù)打入破空，堅決貫徹自己的戰(zhàn)略意圖。

至 65，黑棋在左下又成功掏掉一個角，不過勝率下降到 39%。

后面便是 AlphaGo 穩(wěn)如泰山的表演了，先攻擊兩子，再洗掉上邊。局面的差距越拉越小，黑勝的機(jī)率卻越來越小，真是一個怪圈！其中不乏 AlphaGo 有一些勸降的招數(shù)，比如第 200 手的提，最終黑棋輸了 1/4 子。

回顧整盤棋，進(jìn)程和年初的 MASTER 贏棋的過程非常類似。如果說年初下快棋，人類棋手來不及思考，犯了很多低級錯誤導(dǎo)致輸棋，那么今天這盤棋，時間很充裕，可以說沒有什么低級錯誤了。筆者很難確定究竟哪幾步是壞棋，導(dǎo)致了棋局的落后，只能說是 AlphaGo 憑借神經(jīng)網(wǎng)絡(luò)技術(shù)訓(xùn)練出的棋感確實比人類選點更精確。

如果說輸?shù)亩嗌俨荒苷J(rèn)為是實力的差距，那么從 ELO GO-RATINGS 等級分的差距可以大致的預(yù)測一下。等級分比對手高 300 分的話，每盤棋勝率在 85% 左右，比對手高 600 的話，勝率在 97% 左右?？聺嵉牡燃壏执蠹s在 3600-3700 之間，去年戰(zhàn)勝李世石版本的 AlphaGo 自評等級分在 4500 左右。而經(jīng)過了一年多之后， AlphaGo 的等級分進(jìn)步到多少我們不得而知，但至少不會比去年的版本低。所以，如果找不到 AlphaGo 一些未知弱點的話，人類幾乎可以說是一勝難求。

柯潔認(rèn)為，Alphago 的棋與去年完全是兩個人。第一次時它很接近人的，但現(xiàn)在越來越像「上帝」。所以，雖然只是 1/4 子，其實是人類棋手無法逾越的一條鴻溝。在冰冷的數(shù)據(jù)面前，再如何說讓柯潔繼續(xù)努力的話，都顯得蒼白無力，接下來的比賽，讓我們就期待精彩的過程吧。