中國(guó)圍棋九段柯潔與圍棋人工智能程序AlphaGo的人機(jī)大戰(zhàn)昨天結(jié)束了首番棋的較量,執(zhí)黑的柯潔戰(zhàn)至收官,以四分之一子告負(fù)。
柯潔 vs AlphaGo 2.0:一場(chǎng)頂尖高手的精彩較量
雖然我們對(duì)于輸贏早已心中有數(shù),但如果我們盡情欣賞這局比賽,一定會(huì)為其精彩之處贊嘆不已?,F(xiàn)年19歲的柯潔是目前世界排名第一的職業(yè)圍棋選手,5歲開(kāi)始學(xué)棋,10歲的時(shí)候成為職業(yè)選手,曾先后四次獲得國(guó)際大賽冠軍,可以說(shuō),他本身就代表了人類在圍棋上的最高智力。而AlphaGo 2.0經(jīng)過(guò)進(jìn)化,學(xué)會(huì)了的自我博弈,幾乎是滿血+升級(jí)。雙方的比賽,在圍棋界就是一場(chǎng)值得載入歷史的空前決賽。
在第一局的比賽中,柯潔對(duì)AlphaGo早已有所防備,使用了傳奇圍棋大師吳清源和木谷實(shí)在上世紀(jì)30年代創(chuàng)立的三·3開(kāi)局。此開(kāi)局曾經(jīng)流行數(shù)十年,此后在現(xiàn)代圍棋中漸漸淡出。然而,AlphaGo(曾化名Master)在今年1月的一系列比賽中再次啟用此開(kāi)局,此后柯潔和其他棋手一起在最近的棋賽中令其活力再現(xiàn)。在今天的對(duì)局中,AlphaGo還使用了它擅長(zhǎng)的二間守角,而柯潔則在左上角祭出了三·3點(diǎn)角。
14:50分左右,經(jīng)過(guò)4個(gè)多小時(shí)的時(shí)間,AlphaGo執(zhí)白以1/4子獲勝。
賽后,柯潔表示,“我對(duì)布局有過(guò)備戰(zhàn)和研究,所以一開(kāi)局下了三·3占角,三·3點(diǎn)角,這都是對(duì)手特別喜歡下的,所以我想看看它怎么應(yīng)對(duì),但它應(yīng)對(duì)得非常好。那手?jǐn)嘧屛液苷痼@,這手棋在人類對(duì)局中幾乎是不可能的,因?yàn)槭呛笫?。后?lái)冷靜下來(lái)分析確實(shí)是好棋,制造了很多劫材,同時(shí)讓角部實(shí)地化,一石二鳥(niǎo)。AlphaGo實(shí)在下得太出色,我輸?shù)脹](méi)什么脾氣,很厲害?!?/span>
一句“輸?shù)脹](méi)脾氣”,讓我們覺(jué)得作為人類圍棋冠軍的柯潔,第一次對(duì)于打敗自己的人心服口服。
而另一方面,DeepMind創(chuàng)始人Demis Hassabis(哈薩比斯)在賽后新聞發(fā)布會(huì)上表示:“我要向柯潔表示祝賀,這是一場(chǎng)精彩絕倫的比賽,雙方勢(shì)均力敵,難分高下,對(duì)在座的每一個(gè)人來(lái)說(shuō),都是一次令人激動(dòng)的體驗(yàn)。”
哈薩比斯認(rèn)為,柯潔將AlphaGo推向了極限。
AlphaGo有哪些蛻變,2.0之后何去何從?
哈薩比斯今日透露,目前的AlphaGo是在云端由單TPU運(yùn)行,這與Goolge上周在I/O大會(huì)上剛公布的芯片版本一致。TPU是專門為機(jī)器學(xué)習(xí)而設(shè)計(jì)的處理器。與去年3月與李世石的比賽時(shí)相比,當(dāng)前的版本在處理計(jì)算時(shí)所消耗的能量?jī)H為過(guò)去的十分之一。
360研究院院長(zhǎng)顏水成點(diǎn)評(píng)說(shuō),過(guò)去一年多,AlphaGo在學(xué)習(xí)方式和模型上有很大的變化和提升,實(shí)時(shí)比賽計(jì)算已經(jīng)用一個(gè)TPU就足夠。對(duì)于算法上的貢獻(xiàn),三角獸科技首席科學(xué)家王寶勛說(shuō),毫無(wú)疑問(wèn)的AlphaGo基于深度學(xué)習(xí)的搜索算法得到了進(jìn)一步的優(yōu)化,走棋的效率更高,強(qiáng)化學(xué)習(xí)勢(shì)必比之前發(fā)揮的作用更大。但是Deepmind對(duì)于硬件和模型細(xì)節(jié)的把握同樣是不可忽視的因素。
對(duì)于AlphaGo 2.0的技術(shù)進(jìn)步,地平線機(jī)器人技術(shù)CEO余凱稱,這次AlphaGo 2.0的重要進(jìn)展是,系統(tǒng)完全從零狀態(tài)開(kāi)始通過(guò)自我博弈來(lái)學(xué)習(xí)和提升棋力的。而以前的1.0版本是有學(xué)習(xí)人類棋手歷史數(shù)據(jù)的。這種完全不需要外界數(shù)據(jù)的自我學(xué)習(xí),是人工智能很激動(dòng)人心的一個(gè)進(jìn)展。
涂威威重點(diǎn)提到,DeepMind已經(jīng)在嘗試讓AlphaGo有“舉一反三”的能力,這種觸類旁通的能力才是人類更為擅長(zhǎng)的,這里就要用到遷移學(xué)習(xí)領(lǐng)域的技術(shù)。
對(duì)于AlphaGo在比賽之后的發(fā)展,創(chuàng)始人哈薩比斯表示,我們?cè)诒局軆?nèi)會(huì)告訴大家,并披露更多的技術(shù)細(xì)節(jié)。
人工智能能給人類帶來(lái)什么?
雖然哈薩比斯沒(méi)有透露AlphaGo的去向,但是他在現(xiàn)場(chǎng)曾表示,我們利用人工智能可以解決目前的很多難題,比如醫(yī)療。我們希望AlphaGo與人類的合作可以找到更多的方式,我們希望AlphaGo在其他領(lǐng)域也能取得矚目的成就。
也許就是因?yàn)檫@種進(jìn)步,DeepMind將開(kāi)始探索人工智能在醫(yī)療等各個(gè)行業(yè)領(lǐng)域的應(yīng)用。
海知智能(ruyi.ai)創(chuàng)始人兼CEO謝殿俠評(píng)點(diǎn)說(shuō),以AlphaGo為代表的人工智能應(yīng)用,在這場(chǎng)認(rèn)知革命里只是一個(gè)小小里程碑。工業(yè)革命實(shí)現(xiàn)了體力工作自動(dòng)化解放了體力勞動(dòng)者,認(rèn)知革命將知識(shí)工作自動(dòng)化解放腦力勞動(dòng)者。
對(duì)首盤的表現(xiàn),柯潔坦言有點(diǎn)不滿,“自己雖然很拼,但還是出現(xiàn)了人類的遺憾。后面兩盤,我希望不留遺憾,哪怕讓AlphaGo的主機(jī)稍微發(fā)燙一下也好啊?!?/span>
比賽尚未結(jié)束,精彩還在繼續(xù),雖然變化打法仍沒(méi)有找到AlphaGo的弱點(diǎn),但柯潔仍表示會(huì)盡全力去拼每一盤棋,作為觀眾我們何嘗不需要這種認(rèn)真的精神呢?