200 多家明星企業(yè),20 位著名投資機(jī)構(gòu)頂級投資人共同參與!「新智造成長榜」致力于發(fā)掘 AI 領(lǐng)域有 “三年十倍” 成長潛力的創(chuàng)新公司,下一波 AI 獨(dú)角獸,會有你么?點擊閱讀原文了解詳情! 雷鋒網(wǎng)按:本文作者劉利,自學(xué)圍棋多年,弈城 8D 水平,曾獲重慶大學(xué)圍棋賽冠軍,重慶市高校聯(lián)賽冠軍,重慶市首屆周日圍棋賽冠軍。雷鋒網(wǎng)經(jīng)授權(quán)獨(dú)家首發(fā),未經(jīng)許可不得轉(zhuǎn)載。 苦等兩個月的的人機(jī)大戰(zhàn)終于如期舉行了,但這一天真的到來之際,卻遠(yuǎn)沒有之前期待的那樣那人興奮。首先是禁止在直播中出現(xiàn)谷歌字樣,再到后來的各網(wǎng)站全面禁播,野狐圍棋的直播預(yù)告也下架,反反復(fù)復(fù)的好幾次,讓此次比賽的關(guān)注熱度大大下降。作為致力于宣傳圍棋,推廣圍棋的柯潔,恐怕心情也是很受影響的。 基于賽前的預(yù)測, 多數(shù)觀點認(rèn)為, 柯潔在三盤棋中能贏至少一盤的概率僅為 10%,甚至更加悲觀,很多人更是開玩笑說,只要柯潔能贏一盤,就要吃棋盤電腦翔啥的,或者讓自己身上的零件少點啥的,更是認(rèn)定了柯潔能贏一盤的概率無限趨近于零。但第一盤的結(jié)果下來,柯潔只輸了 1/4 子,是不是又讓人看到勝利的希望了呢? 首先值得一提的是這次比賽的獎金,如果柯潔獲勝,將會獲得 150 萬美元,而無論勝負(fù),柯潔會獲得 30 萬美元的出場費(fèi),這個數(shù)字對圍棋界來講確實是一個天文數(shù)字,多年以來,世界各大賽中獎金最高的四年一屆的應(yīng)氏杯,冠軍獎金才不過 40 萬美元。一方面反映出對世界等級分排名第一的柯潔的尊重,另一方面也反映出柯潔獲勝的概率極小。 DeepMind 團(tuán)隊不打無把握之仗,早在去年 3 月,人機(jī)大戰(zhàn)的第一季,DeepMind 團(tuán)隊選中了十年來獲得世界冠軍頭銜最多,人氣極高的韓國選手李世石作為挑戰(zhàn)對象。據(jù)賽后的爆料,其實 AlphaGo 的自評實力已經(jīng)遠(yuǎn)高于李世石的等級分。李世石五盤中的唯一一勝其實是擊中了 AlphaGo 程序計算中的軟肋——在有限的算力下,為了保證計算的深度,需要對一些不太可能的變化進(jìn)行剪枝。李世石的神之一手,雖然事后看并不成立,卻正是圍棋中的盲點,在 AlphaGo 的眼中,這一手出現(xiàn)的概率僅有萬分之四,因而并沒有太多考慮。突然出現(xiàn)的這一手,使得所有變化都得重新計算,因而犯下大錯。DeepMind 團(tuán)隊事后也積極的想策略解決這一問題,但看得出,他們賽前其實對拿下李世石是很有信心的。然而,4:1 的比分畢竟使得人工智能已經(jīng)完全征服圍棋這一長期難題的結(jié)論不那么使人信服,所以有了今年的柯阿之戰(zhàn)。
其實早在今年年初,去年年底, AlphaGo 就悄悄地出來試水了,化身「Master」 的阿法狗在弈城圍棋和野狐圍棋上各下了 30 盤棋,取得了 60:0 的戰(zhàn)績。從中我們可以看出 AlphaGo 的一些「性格」:大多數(shù)棋局在 100 手以前就已取得了壓倒性的優(yōu)勢,優(yōu)勢后的 AlphaGo 顯得保守和謙讓,后半盤尤其是小官子經(jīng)常犯錯,這是職業(yè)棋手很難犯錯的領(lǐng)域。不過最終的結(jié)果,反正是 AlphaGo 不管大勝小勝,最終全部都贏下來了,最少的贏了 0.5 目。真不知道是幸運(yùn)還是早有成算。因為畢竟只勝 0.5 目的盤數(shù)并不多,并不能做為結(jié)論。而且根據(jù) AlphaGo 論文所開發(fā)出的各個 AI,目前都有收官弱項的共同毛病。 再來回顧一下今天的這盤棋,早上 10 點半,比賽正式開始,柯潔猜到黑棋,不知道對壓力山大的柯潔的心理有沒有影響。目前的棋界普遍是愿意下白棋的,尤其是中國規(guī)則下。中國規(guī)則黑棋貼 3 又 3/4 子,可能是偏向白棋一方了。從 AlphaGo 的自評勝率中執(zhí)黑也是勝率稍差,對柯潔本人近年來的戰(zhàn)績來看,執(zhí)白的勝率也是明顯比執(zhí)黑要好的。筆者開著免費(fèi)棋軟 LEELA 最新版 0.10.0,靜靜的欣賞這盤棋。柯潔顯然是有備而來,小目大飛守角加一個三 3,然后第 7 手,點對手星星下的三 3,很徹底的表明先撈后洗的策略,先撈足實地,然后和電腦比大型死活。 筆者還是很認(rèn)可這一策略的,最近在野狐上很火的驪龍 AI(絕藝?yán)习妫髿⑺姆?,偶爾輸棋,基本也只吃大型死活偶爾犯錯這一招了。 AlphaGo 是不是也有這樣的弱點呢? 由于黑棋的位置低,第 5 手黑棋的勝率從開局的 48% 降到 46%,看來電腦并不認(rèn)可三 3 這手棋。黑棋第 7 手點右下角三 3 至 22 手征掉一子告一段落,不知道柯潔此時有沒有后悔左上角是三 3。如果左上角是星位,那么 22 是征不掉黑子的。 24 是極其出乎筆者意料的一手, AlphaGo 果然是高者在腹。 這手棋如果按筆者的理解叫中途半端,是要被老師批評的,沒有撥掉一子那么干凈,對二路的夾也沒有補(bǔ)到??聺嵖吹竭@手棋時的表情也非常有意思,一下笑了,然后直起身子,不停的摸自己的頭。考慮良久之后,拆了一個邊,限制的外勢。白棋 26 打入進(jìn)入戰(zhàn)斗,面對柯潔的 29、31 兩記重拳, AlphaGo 都沒有應(yīng),讓筆者想起了太極高手的閃轉(zhuǎn)騰挪。這狗也太靈活了,這讓人怎么下? 好在后面的進(jìn)程還算正常,到 46 告一段落,黑棋勝率 45%。50,54 刺和斷,又是出乎人類棋手的意料!人類棋手不會在四顆子還有跑的可能的時候,去讓刺和黑拐頭相交換,讓四子徹底死掉,也不會在大場還那么多的時候花一手?jǐn)鄟頁Q取一點點的借用的。 AlphaGo 大師真乃神出鬼沒!它會走在哪你真是猜不到的。 黑 55 被動得來的先手,柯潔沒有選擇拆邊加強(qiáng)自身,而是選擇了繼續(xù)打入破空,堅決貫徹自己的戰(zhàn)略意圖。 至 65,黑棋在左下又成功掏掉一個角,不過勝率下降到 39%。 后面便是 AlphaGo 穩(wěn)如泰山的表演了,先攻擊兩子,再洗掉上邊。局面的差距越拉越小,黑勝的機(jī)率卻越來越小,真是一個怪圈!其中不乏 AlphaGo 有一些勸降的招數(shù),比如第 200 手的提,最終黑棋輸了 1/4 子。 回顧整盤棋,進(jìn)程和年初的 MASTER 贏棋的過程非常類似。如果說年初下快棋,人類棋手來不及思考,犯了很多低級錯誤導(dǎo)致輸棋,那么今天這盤棋,時間很充裕,可以說沒有什么低級錯誤了。筆者很難確定究竟哪幾步是壞棋,導(dǎo)致了棋局的落后,只能說是 AlphaGo 憑借神經(jīng)網(wǎng)絡(luò)技術(shù)訓(xùn)練出的棋感確實比人類選點更精確。 如果說輸?shù)亩嗌俨荒苷J(rèn)為是實力的差距,那么從 ELO GO-RATINGS 等級分的差距可以大致的預(yù)測一下。等級分比對手高 300 分的話,每盤棋勝率在 85% 左右,比對手高 600 的話,勝率在 97% 左右??聺嵉牡燃壏执蠹s在 3600-3700 之間,去年戰(zhàn)勝李世石版本的 AlphaGo 自評等級分在 4500 左右。而經(jīng)過了一年多之后, AlphaGo 的等級分進(jìn)步到多少我們不得而知,但至少不會比去年的版本低。所以,如果找不到 AlphaGo 一些未知弱點的話,人類幾乎可以說是一勝難求。 柯潔認(rèn)為,Alphago 的棋與去年完全是兩個人。第一次時它很接近人的,但現(xiàn)在越來越像「上帝」。所以,雖然只是 1/4 子,其實是人類棋手無法逾越的一條鴻溝。在冰冷的數(shù)據(jù)面前,再如何說讓柯潔繼續(xù)努力的話,都顯得蒼白無力,接下來的比賽,讓我們就期待精彩的過程吧。
|
|
來自: 昵稱71360118 > 《待分類》