陳經(jīng):人機(jī)大戰(zhàn)首局柯潔“憾負(fù)”AlphaGo的看點(diǎn) 2017年5月23日上午10:30,廣大棋迷與人工智能愛好者非常關(guān)注的柯潔與AlphaGo的三番棋首局終于開打。經(jīng)過4個小時的戰(zhàn)斗,柯潔執(zhí)黑以1/4子的最小差距負(fù)于AlphaGo,三番棋暫時以0:1落后。這盤棋有哪些看點(diǎn)?AlphaGo又展示了哪些新東西?
一個很受觀眾關(guān)注的問題是,與柯潔對弈的AlphaGo是不是從零開始訓(xùn)練,沒有受人類棋譜“污染”的“純凈”版本?賽后發(fā)布會,Deepmind負(fù)責(zé)人哈薩比斯回答說,并不是!它是在年初快棋60:0戰(zhàn)勝人類高手的Master基礎(chǔ)上的升級版。而且,這次用的只是單機(jī)版,而非與李世石對戰(zhàn)的分布式版本。這個單機(jī)版由于有10塊黑科技TPU(據(jù)說一個TPU相當(dāng)于15-30個GPU),所以這個“單機(jī)版”算力并不差。騰訊開發(fā)的絕藝,實(shí)力排圍棋AI第二,用的只是GPU,在硬件技術(shù)上和AlphaGo有差距。這次AlphaGo雖然是單機(jī)版,但以每步一分鐘的節(jié)奏下棋,比Master的思考時間要多十倍,計(jì)算力是足夠的??偟膩碚f, 這次的AlphaGo從軟件硬架構(gòu)上來說,應(yīng)該就類似于Master,并沒有再次創(chuàng)新,但自我訓(xùn)練實(shí)力有小的提升。但相對于去年與李世石對戰(zhàn)的版本,無論是算法還是硬件都有巨大的創(chuàng)新,實(shí)力要強(qiáng)得多。 對局中AlphaGo的表現(xiàn)也確實(shí)和Master差不多,在局面領(lǐng)先后,它慢慢將差距送成了最小差距的1/4子(相當(dāng)于1.5目 勝)。我在對局中看到AlphaGo的著法,就提前預(yù)測最后會是1-2目的差距,其實(shí)當(dāng)時領(lǐng)先優(yōu)勢應(yīng)該是一個貼目(7目左右)。雖然最后柯潔顯得是以最小差距“憾負(fù)”,但職業(yè)棋手們認(rèn)為,AlphaGo本局展現(xiàn)的實(shí)力,領(lǐng)先柯潔是有一先的(也就是一個貼目)。但這并不是說柯潔發(fā)揮不好,他發(fā)揮得其實(shí)不錯。對比去年李世石,面對實(shí)力要差得多的AlphaGo版本,本局柯潔的表現(xiàn)要好得多。 下面介紹本局的一些關(guān)鍵點(diǎn)。 一.開局 柯潔在與人類對手的實(shí)戰(zhàn)中,連續(xù)七八局試用了開局占三三、點(diǎn)三三的手法,有相當(dāng)?shù)男牡谩1揪治揖桶l(fā)微博預(yù)測他會開局點(diǎn)三三,果然他在第3手占三三,第7手對白星位點(diǎn)三三。 這幾手說明柯潔是有精心的準(zhǔn)備的,而且提前演練了。以下是柯潔的預(yù)想圖: 柯潔的預(yù)想圖 這個變化實(shí)際是Master下出來的,黑棋奪掉了白星位一子的根據(jù)地,還能夠利用8位點(diǎn)的弱點(diǎn),對白一串進(jìn)行攻擊。面對柯潔的“以其人之道還治其人之身”,AlphaGo會如何應(yīng)對呢?AlphaGo給出了答案。 AlphaGo針鋒相對的預(yù)想圖 AlphaGo沒有下在R5位扳,而是下在三角位,這是AlphaGo的預(yù)想圖,黑1位托3位頂這樣定型。與柯潔的理想圖相比,白棋的外勢更為完整,P6位很難說是弱點(diǎn)了??梢灶A(yù)期,以后碰到開局點(diǎn)三三,棋手都會用這招應(yīng)對??聺嵲谶@個局部變了個次序,但并沒有得到好結(jié)果。 實(shí)戰(zhàn)結(jié)果 實(shí)戰(zhàn)柯潔11位先頂,再13位扳,遭到了白R2位(后來被吃)的反擊。最后19位的黑子被白22征掉了!碰巧的是,左上角黑三三一子,沒有引到征,而如果這個子在星位上,白就征不掉黑棋了。黑棋兩個三三的組合手段,換來這個局面,應(yīng)該說沒有實(shí)現(xiàn)戰(zhàn)略意圖。黑占的角并不大,而白吃掉19這個子后外勢很厚,特別是24這手很有想法,注重中央的戰(zhàn)斗。AlphaGo相對于人的優(yōu)勢就是利用厚勢的能力,應(yīng)該說開局黑的三三戰(zhàn)術(shù)落空了。 二.左上角的戰(zhàn)斗AlphaGo可能虧了?
AlphaGo26位打入,28跳起再30位罩,這個手法人類棋手不太能想到。而白34粘,讓黑35位挺出,這個感覺相當(dāng)異常。應(yīng)該會有相當(dāng)多的職業(yè)棋手不贊同AlphaGo的選擇,白兩塊被完全分?jǐn)?,感覺黑棋主動。 AlphaGo選擇了吃角,中間四子基本被吃。這個局面白這四子是不敢跑的,因?yàn)楹谟蠪18位左右的借用,白跑會被黑追殺得特別慘。行棋到此感覺黑應(yīng)該是不落下風(fēng)的,一些圍棋AI對此局面的勝率評估也認(rèn)為此時黑并不落后,開局吃虧后,黑挽回了局勢。但是柯潔局后說,他本來是想“先撈后洗”(先搶占實(shí)地,讓白做模樣,黑沖進(jìn)去搗亂找機(jī)會),占兩個三三就說明這個意圖非常明顯。但是這個局部下來,白棋反而吃掉了黑左上角??紤]到左上角本是黑的三三,三三被吃掉的局面極其罕見。所以這個局面白棋反而撈了實(shí)地,柯潔需要利用厚勢作戰(zhàn),不是他的意圖。這就是Master的典型棋風(fēng),看著它是厚勢作戰(zhàn),但一有機(jī)會它就變現(xiàn)轉(zhuǎn)實(shí)地,不會搞看不太清的寵大模樣。 三.柯潔非??赡艿臄≌信cAlphaGo的勝招
AlphaGo沒有盲目動出四子,而是搶了48位大棋,黑49打入是眼見的好手。這時白下了50位騷擾??聺嵾@時可能心理上稍有一點(diǎn)松勁,選擇了51位吃死消除不安定因素,而不是54位粘繼續(xù)緊繃局面。AlphaGo在52位尖頂后,下出了令柯潔本人在內(nèi)的不少職業(yè)棋手佩服的好棋,54位斷! 這招棋本身是后手。白從F13扳動出跑不了,在B12跑也會被黑A12扳快一氣吃死。那這招的好處是什么?讓柯潔局后非常佩服的是,這招棋韻味深長,雖然是后手,但是以靜制動,能發(fā)揮極大作用。有了54這手切斷,白在B9是先手能在左中部做一排厚勢支援左下部。另一方面,白也可以選擇在G10位跳,在靠近中央的地方做出一排厚勢。對白這四個死子的利用非常靈活。 柯潔意識到局面不利,怕白棋左下角實(shí)空太大(黑實(shí)空本來就不領(lǐng)先,中間的厚味又被白54限制住了),就急躁恨空地在55位打入了。白56位立,這一手就決定了白棋的優(yōu)勢,其它AI的判斷也是白優(yōu)勢了。因?yàn)榘子兄虚g的借用,黑活左下角以后,49、53兩子會被攻擊,很難有生路了。白棋仿佛所有子力都配合起來,讓黑這兩子異常困難。 四.AlphaGo優(yōu)勢下的穩(wěn)健運(yùn)轉(zhuǎn)
面對難局,應(yīng)該說柯潔表現(xiàn)不錯,使出了69靠、71扳的靈活手段。結(jié)果黑棄掉兩子,中間大塊通過83斷回家,維持住了局面。行棋至此,不少棋手和觀眾感覺局面還早,勝負(fù)在后面。 但是AlphaGo可能對局面評估更為準(zhǔn)確。白下方與左上角的空是比較實(shí)在的,而黑右上角三子虛虛的形勢價值多少卻不好說。實(shí)際上,白84手的打入正擊中了黑棋的弱點(diǎn),在白下面厚勢的影響下,黑棋在此圍不到多少空,落后的局面迅速就要明朗化。 左上角的結(jié)果,白棋又撈了十余目實(shí)地?cái)U(kuò)大了實(shí)地優(yōu)勢,黑只收獲了一道有缺陷的外勢。白84子在P15打后有余味??聺?7位令不少人感到奇怪,但其實(shí)是沒有辦法。不下在中間,白吊這里,利用84的余味以及白N5切斷黑三子的手段,黑中間會很慘。這時白悠然拆在98位,職業(yè)棋手應(yīng)該基本看清了白必勝的局面。 98這手進(jìn)得不深,黑如果L17拆二互圍,白左上能多圍不少,黑右上中間圍不到多少,白盤面都要好一些。實(shí)戰(zhàn)黑只好攻擊白98這一子。 黑99攻擊,白100拆一幾乎是勝利宣言,似乎在說吃不掉我就勝了。而且這兩個子活力很好確實(shí)吃不了,下到110逼黑111吃,這時白做眼與出逃都不難,應(yīng)該說已經(jīng)解決了問題。 行棋至此,從子效上來說,黑左邊一團(tuán)當(dāng)初以為的厚勢,雖然吃了五子,但全是干目沒圍到多少目。而白下面的厚勢吃三子卻圍得效率高不少。黑右上的厚勢其實(shí)也圍不了多少空。因此白棋盤面領(lǐng)先是可能的,后面收官白明顯手段多,黑到處欠目。 柯潔后面沒有放棄,收官撐得很厲害。但AlphaGo領(lǐng)先優(yōu)勢夠多,早早進(jìn)入了安全運(yùn)轉(zhuǎn)模式,時不時地送出1目半目,送出去了6、7目,最后1/4子獲勝。如果熟悉Master的棋路就會知道,白不斷地送目,正是必勝的證明。所以后面柯潔雖然收官有收獲,其實(shí)早已心知肚明必?cái)×?,表情痛苦。本局并非雙方差距微小,在官子爭奪中柯潔最小差距落敗,而是差距大到了一先。 五.全局綜述與展望 本局柯潔黑棋并沒有領(lǐng)先的時候,沒有勝機(jī)。黑棋開局兩個三三先撈后洗的戰(zhàn)術(shù)準(zhǔn)備不算成功。白棋領(lǐng)先的局面出現(xiàn)在50多手,雖然優(yōu)勢并不是太大。但是柯潔一直沒有崩潰,不斷地出招試圖化解困境或者翻盤,也逼出了白棋的一些好招,雙方的對戰(zhàn)招法頗有看點(diǎn)。柯潔的狀態(tài)應(yīng)該說還不錯,但是一點(diǎn)點(diǎn)的松勁就導(dǎo)致局面落后無法挽回??聺嵄救藢ψ约旱陌l(fā)揮并不太滿意,應(yīng)該是意識到了自己的問題。 AlphaGo本局的表現(xiàn)非常穩(wěn)定,能夠領(lǐng)先發(fā)揮不差的柯潔一先,展示了強(qiáng)大的實(shí)力。AlphaGo本局的招法相對Master給人的震驚來說,容易理解多了。這個對局顯得很有邏輯,不象Master的某些棋局,人類莫明其妙就大大落后,輸了還不知道怎么回事。本局AlphaGo也有一些令人驚艷的招法,但下出來棋手們能品出妙味,不致于茫然不知所措。這說明,人類棋手的水平也在進(jìn)步。 柯潔說,想要贏AlphaGo,必須逼出它的bug。從本局來看,確實(shí)如此。如果只是局面選擇、打入、圍空、攻擊這些較為常規(guī)的局面,AlphaGo的局面判斷能力比人類棋手明顯要強(qiáng)。在雙方上百手的進(jìn)程中,人類總是容易出錯。一旦進(jìn)入AlphaGo小有優(yōu)勢的控制流局面,它總是能簡化局面,找到簡明獲勝的分枝。 想要逼出AlphaGo的bug,柯潔必須把局面撐得很滿,讓雙方都不能退,不進(jìn)入復(fù)雜變化就吃虧。從本局的局面來看,柯潔如果發(fā)揮得再好一些,可能會有這樣的機(jī)會。如逼使AlphaGo大吃柯潔一塊棋,而不是吃下面兩子就夠了?;蛘弑频肁lphaGo進(jìn)柯潔的模樣里艱難找生路,而不是象98與100兩子一樣一眼看去就能輕松做活。從AlphaGo的棋路選擇來看,它明顯在避免算不清的開放型復(fù)雜死活變化,因?yàn)槟菢铀胁簧俜种κ菚怀裕蛘弑豢聺嵳w活出,不如控制流勝率高。 希望柯潔后兩局能將局勢引導(dǎo)得更為復(fù)雜、更為緊張,讓棋迷們看到更精彩的棋局。哈薩比斯也說要繼續(xù)開發(fā)提升,例如以后真的開發(fā)出“純凈”版的AlphaGo,與職業(yè)棋手們共同探索圍棋更多的奧秘。 |
|