當(dāng) AI 稱霸國際象棋時(shí)我保持沉默,因?yàn)槲也皇窍笃迨?;?dāng) AI 稱霸圍棋時(shí)我保持沉默,因?yàn)槲也皇菄迨郑划?dāng) AI 進(jìn)入《星際爭霸》時(shí)我保持沉默,因?yàn)槲也皇切请H玩家;當(dāng) AI 戰(zhàn)勝 DotA2 世界冠軍 Dendi 時(shí),作為一個(gè) DotA 玩家,我終于跪下了。 DotA2 年度最重要的賽事 The International DOTA2 Championships(簡稱 Ti)每年都會(huì)有彩蛋使全球玩家眼前一亮,這兩年尤其貼近最新科技。比如去年的 Ti 6 上,DotA2 官方 V 社就在比賽現(xiàn)場采用了類AR的全息投影,至少從轉(zhuǎn)播畫面來看,可以說是非??褡Э犰诺跽ㄌ炝?。 而到了今年,全世界都在談?wù)?、研究時(shí)下最流行的人工智能,Google 用 AlphaGo 這個(gè)科技概念普及到了幾乎所有領(lǐng)域。DotA2 今年的比賽彩蛋也與人工智能(AI)直接相關(guān)。 在美西時(shí)間 8 月 11 日的正式比賽結(jié)束后,表演項(xiàng)目開始了。 首先,在現(xiàn)場一片歡呼聲中,DotA2 的第一個(gè)戰(zhàn)隊(duì)和 Solo 雙料世界冠軍獲得者,傳奇中單 Dendi 身著拳擊手的服裝入場。當(dāng) Dendi 走到賽場中央,所有人都在好奇 Dendi 的對手將會(huì)是誰時(shí),主持人突然出人意料地宣布,Dendi 的對手是一段程序,來自 OpenAI。 中央被高高舉起的U盤里就是 OpenAI 的程序,身著白色拳擊手袍的就是 Dendi。 OpenAI是一家不以盈利為目的的人工智能研究公司,由“鋼鐵俠”Elon Musk 聯(lián)合 Y Combinator 的 CEO Sam Altman、LinkedIn 創(chuàng)始人 Reid Hoffman、暢銷書《從零到一》的作者 Peter Thiel 等硅谷科技界的大佬們發(fā)起,背景即使在人工智能界也是“又紅又專”。 盡管 Dendi 獲得世界冠軍已經(jīng)是 6 年前的事,并且今年也沒有進(jìn)入正賽圈,但作為烏克蘭老司機(jī),Dendi 的個(gè)人實(shí)力仍然毋庸置疑,任何職業(yè)中單選手在面對 Dendi 時(shí)必須要全力以赴。 但是,另一邊的 OpenAI 也絲毫不弱。在賽場播放的宣傳片中可以看到,OpenAI 在此之前已經(jīng)戰(zhàn)勝了現(xiàn)役的 Arteezy、SumaiL 等多個(gè)世界冠軍級的 Solo 選手,它與我們在 DotA2 里常見的電腦 Bot 機(jī)器人按程序按部就班地供玩家凌虐完全不同。包括 OpenAI CTO Greg Brockman 在內(nèi)的核心團(tuán)隊(duì)成員也來到了現(xiàn)場。 被 OpenAI 擊敗時(shí)不敢相信的 SumaiL(右)。 比賽的規(guī)則設(shè)定是,不能出瓶子、不能出凝魂之淚、不能出靈魂之戒、不能使用神壇,并且沒有中立生物、沒有神符,雙方選手都使用同一個(gè)英雄影魔(Shadow Fiend)。這些規(guī)則減少了游戲中的隨機(jī)性,選手實(shí)力的因素將更加重要。 比賽開始,Dendi(天輝方,綠色)與 OpenAI(夜魘方,紅色) 的出門裝備完全一樣,這倒沒什么。開始出兵了,DotA2 的 Solo 比賽第一項(xiàng)要考驗(yàn)的就是雙方對己方小兵的卡位能力,卡兵卡得位置好,對線期的補(bǔ)刀就會(huì)比較順手。但是,在這一項(xiàng)技能中,OpenAI 就小勝一籌。 因?yàn)榭ū映錾?,OpenAI 能夠在己方高地補(bǔ)刀。 隨后,雙方開始你來我往的補(bǔ)刀。但基本上很明顯地,Dendi 一直被 OpenAI 按在地上摩擦,OpenAI 的補(bǔ)刀數(shù)一直領(lǐng)先于 Dendi。每次對點(diǎn),OpenAI 也總能消耗掉 Dendi 更多生命值。并且,OpenAI 總能占據(jù)最有利的位置,讓 Dendi 很難受。 Dendi 被消耗掉了更多生命值,吃下了第一個(gè)大藥,但剛回復(fù)了四分之一左右,恢復(fù)效果就被 OpenAI 技能打斷了。 OpenAI 對距離和時(shí)機(jī)的把控非常精準(zhǔn),總能以極限距離消耗或攻擊到 Dendi,這也正是電腦程序的優(yōu)勢所在。但實(shí)際上根據(jù) Brockman 的說法,OpenAI 在 DotA2 里的每分鐘操作數(shù)僅相當(dāng)于人類玩家的平均水平。 但同時(shí)令人沒想到的是,OpenAI 會(huì)像人類高手一樣,使用一些唬騙的假動(dòng)作(釋放技能,在技能前搖的短時(shí)間內(nèi)按 S 鍵停止釋放),干擾對手的判斷力。這種欺騙性的“花招”技能一直被認(rèn)為是人類面對人工智能時(shí)最大的優(yōu)勢,不過顯然,OpenAI 至少在 DotA2 里也已經(jīng)學(xué)會(huì)了。 “在 Dota 中取勝需要玩家基于對對手的直覺而采取相應(yīng)操作。在上面的視頻中你可以看到我們的 bot 已經(jīng)學(xué)會(huì)了——完全通過自我對弈——預(yù)測其他玩家的下一步操作,在陌生的環(huán)境中隨機(jī)應(yīng)變,以及通過對其他玩家的友軍施加影響而幫助前者成功?!盉rockman 在 OpenAI 官方博客里寫道。 隨著細(xì)微的優(yōu)勢積累越來越大,OpenAI 最終戰(zhàn)勝了 Dendi。 OpenAI 拿下了第一滴血,隨后的比賽也失去了懸念。此時(shí),OpenAI 的補(bǔ)刀數(shù)是 27/10,Dendi 則只有11/2。 此前,AlphaGo 戰(zhàn)勝李世乭、柯杰稱霸圍棋項(xiàng)目時(shí),還有相當(dāng)多的電競玩家認(rèn)為,DotA2 或 LOL 這類游戲,即時(shí)性、隨機(jī)性、策略性的特點(diǎn),仍然是 AI 程序無法輕易模擬的。而圍棋那種回合制的模式,拼計(jì)算可能性的時(shí)間快慢,人類當(dāng)然會(huì)比不上 AI。幾個(gè)月之前,開發(fā) AlphaGo 的人工智能公司 DeepMind 選擇了《星際爭霸 2》作為圍棋之后的下一個(gè)測試對象。 但事實(shí)證明,至少在 DotA2 的 1 對 1 的比賽上,OpenAI 可以說已經(jīng)不輸人類選手。 Brockman 說,OpenAI 下一步是明年將在 DotA2 的 5 對 5 團(tuán)隊(duì)模式中作戰(zhàn)。屆時(shí),OpenAI 將會(huì)發(fā)布該 bot,從而人人可以與其對決,并且 V 社將為擊敗該 bot 的第一個(gè)人類玩家提供游戲幣獎(jiǎng)勵(lì)。 賽后,Elon Musk 在推特上發(fā)布了這條消息,“OpenAI 第一次打敗了世界上最好的電競選手。電競比象棋、圍棋這樣的傳統(tǒng)棋盤游戲要復(fù)雜得多?!?/p> 中國電競選手們不知道認(rèn)不認(rèn)可這個(gè)說法。然而,如果 OpenAI 明年真的做出了可以參加 5 VS 5 比賽的 AI,并且規(guī)則與人類比賽規(guī)則相同,AI 可以與人類作對手,也可以與人類作隊(duì)友…那我真的不知道這個(gè)游戲該怎么玩了。 |
|