AI稱霸圍棋時(shí)我保持沉默，因?yàn)槲沂荄otA玩家…然而現(xiàn)在DotA也陷落了

王天神 2017-08-14

展開全文

當(dāng) AI 稱霸國際象棋時(shí)我保持沉默，因?yàn)槲也皇窍笃迨?；?dāng) AI 稱霸圍棋時(shí)我保持沉默，因?yàn)槲也皇菄迨郑划?dāng) AI 進(jìn)入《星際爭霸》時(shí)我保持沉默，因?yàn)槲也皇切请H玩家；當(dāng) AI 戰(zhàn)勝 DotA2 世界冠軍 Dendi 時(shí)，作為一個(gè) DotA 玩家，我終于跪下了。

DotA2 年度最重要的賽事 The International DOTA2 Championships（簡稱 Ti）每年都會(huì)有彩蛋使全球玩家眼前一亮，這兩年尤其貼近最新科技。比如去年的 Ti 6 上，DotA2 官方 V 社就在比賽現(xiàn)場采用了類AR的全息投影，至少從轉(zhuǎn)播畫面來看，可以說是非?？褡Э犰诺跽ㄌ炝?。

而到了今年，全世界都在談?wù)?、研究時(shí)下最流行的人工智能，Google 用 AlphaGo 這個(gè)科技概念普及到了幾乎所有領(lǐng)域。DotA2 今年的比賽彩蛋也與人工智能（AI）直接相關(guān)。

在美西時(shí)間 8 月 11 日的正式比賽結(jié)束后，表演項(xiàng)目開始了。

首先，在現(xiàn)場一片歡呼聲中，DotA2 的第一個(gè)戰(zhàn)隊(duì)和 Solo 雙料世界冠軍獲得者，傳奇中單 Dendi 身著拳擊手的服裝入場。當(dāng) Dendi 走到賽場中央，所有人都在好奇 Dendi 的對手將會(huì)是誰時(shí)，主持人突然出人意料地宣布，Dendi 的對手是一段程序，來自 OpenAI。

中央被高高舉起的U盤里就是 OpenAI 的程序，身著白色拳擊手袍的就是 Dendi。

OpenAI是一家不以盈利為目的的人工智能研究公司，由“鋼鐵俠”Elon Musk 聯(lián)合 Y Combinator 的 CEO Sam Altman、LinkedIn 創(chuàng)始人 Reid Hoffman、暢銷書《從零到一》的作者 Peter Thiel 等硅谷科技界的大佬們發(fā)起，背景即使在人工智能界也是“又紅又專”。

盡管 Dendi 獲得世界冠軍已經(jīng)是 6 年前的事，并且今年也沒有進(jìn)入正賽圈，但作為烏克蘭老司機(jī)，Dendi 的個(gè)人實(shí)力仍然毋庸置疑，任何職業(yè)中單選手在面對 Dendi 時(shí)必須要全力以赴。

但是，另一邊的 OpenAI 也絲毫不弱。在賽場播放的宣傳片中可以看到，OpenAI 在此之前已經(jīng)戰(zhàn)勝了現(xiàn)役的 Arteezy、SumaiL 等多個(gè)世界冠軍級的 Solo 選手，它與我們在 DotA2 里常見的電腦 Bot 機(jī)器人按程序按部就班地供玩家凌虐完全不同。包括 OpenAI CTO Greg Brockman 在內(nèi)的核心團(tuán)隊(duì)成員也來到了現(xiàn)場。

被 OpenAI 擊敗時(shí)不敢相信的 SumaiL（右）。

比賽的規(guī)則設(shè)定是，不能出瓶子、不能出凝魂之淚、不能出靈魂之戒、不能使用神壇，并且沒有中立生物、沒有神符，雙方選手都使用同一個(gè)英雄影魔（Shadow Fiend）。這些規(guī)則減少了游戲中的隨機(jī)性，選手實(shí)力的因素將更加重要。

比賽開始，Dendi（天輝方，綠色）與 OpenAI（夜魘方，紅色）的出門裝備完全一樣，這倒沒什么。開始出兵了，DotA2 的 Solo 比賽第一項(xiàng)要考驗(yàn)的就是雙方對己方小兵的卡位能力，卡兵卡得位置好，對線期的補(bǔ)刀就會(huì)比較順手。但是，在這一項(xiàng)技能中，OpenAI 就小勝一籌。

因?yàn)榭ū映錾?，OpenAI 能夠在己方高地補(bǔ)刀。

隨后，雙方開始你來我往的補(bǔ)刀。但基本上很明顯地，Dendi 一直被 OpenAI 按在地上摩擦，OpenAI 的補(bǔ)刀數(shù)一直領(lǐng)先于 Dendi。每次對點(diǎn)，OpenAI 也總能消耗掉 Dendi 更多生命值。并且，OpenAI 總能占據(jù)最有利的位置，讓 Dendi 很難受。

Dendi 被消耗掉了更多生命值，吃下了第一個(gè)大藥，但剛回復(fù)了四分之一左右，恢復(fù)效果就被 OpenAI 技能打斷了。

OpenAI 對距離和時(shí)機(jī)的把控非常精準(zhǔn)，總能以極限距離消耗或攻擊到 Dendi，這也正是電腦程序的優(yōu)勢所在。但實(shí)際上根據(jù) Brockman 的說法，OpenAI 在 DotA2 里的每分鐘操作數(shù)僅相當(dāng)于人類玩家的平均水平。

但同時(shí)令人沒想到的是，OpenAI 會(huì)像人類高手一樣，使用一些唬騙的假動(dòng)作（釋放技能，在技能前搖的短時(shí)間內(nèi)按 S 鍵停止釋放），干擾對手的判斷力。這種欺騙性的“花招”技能一直被認(rèn)為是人類面對人工智能時(shí)最大的優(yōu)勢，不過顯然，OpenAI 至少在 DotA2 里也已經(jīng)學(xué)會(huì)了。

“在 Dota 中取勝需要玩家基于對對手的直覺而采取相應(yīng)操作。在上面的視頻中你可以看到我們的 bot 已經(jīng)學(xué)會(huì)了——完全通過自我對弈——預(yù)測其他玩家的下一步操作，在陌生的環(huán)境中隨機(jī)應(yīng)變，以及通過對其他玩家的友軍施加影響而幫助前者成功?！盉rockman 在 OpenAI 官方博客里寫道。

隨著細(xì)微的優(yōu)勢積累越來越大，OpenAI 最終戰(zhàn)勝了 Dendi。

OpenAI 拿下了第一滴血，隨后的比賽也失去了懸念。此時(shí)，OpenAI 的補(bǔ)刀數(shù)是 27/10，Dendi 則只有11/2。

此前，AlphaGo 戰(zhàn)勝李世乭、柯杰稱霸圍棋項(xiàng)目時(shí)，還有相當(dāng)多的電競玩家認(rèn)為，DotA2 或 LOL 這類游戲，即時(shí)性、隨機(jī)性、策略性的特點(diǎn)，仍然是 AI 程序無法輕易模擬的。而圍棋那種回合制的模式，拼計(jì)算可能性的時(shí)間快慢，人類當(dāng)然會(huì)比不上 AI。幾個(gè)月之前，開發(fā) AlphaGo 的人工智能公司 DeepMind 選擇了《星際爭霸 2》作為圍棋之后的下一個(gè)測試對象。

但事實(shí)證明，至少在 DotA2 的 1 對 1 的比賽上，OpenAI 可以說已經(jīng)不輸人類選手。

Brockman 說，OpenAI 下一步是明年將在 DotA2 的 5 對 5 團(tuán)隊(duì)模式中作戰(zhàn)。屆時(shí)，OpenAI 將會(huì)發(fā)布該 bot，從而人人可以與其對決，并且 V 社將為擊敗該 bot 的第一個(gè)人類玩家提供游戲幣獎(jiǎng)勵(lì)。

賽后，Elon Musk 在推特上發(fā)布了這條消息，“OpenAI 第一次打敗了世界上最好的電競選手。電競比象棋、圍棋這樣的傳統(tǒng)棋盤游戲要復(fù)雜得多?！?/p>

中國電競選手們不知道認(rèn)不認(rèn)可這個(gè)說法。然而，如果 OpenAI 明年真的做出了可以參加 5 VS 5 比賽的 AI，并且規(guī)則與人類比賽規(guī)則相同，AI 可以與人類作對手，也可以與人類作隊(duì)友…那我真的不知道這個(gè)游戲該怎么玩了。

本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間，所有內(nèi)容均由用戶發(fā)布，不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息，謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點(diǎn)擊一鍵舉報(bào)。

轉(zhuǎn)藏 分享

QQ空間 QQ好友新浪微博微信

獻(xiàn)花（0） +1

來自：王天神 > 《科.雜學(xué)》

舉報(bào)/認(rèn)領(lǐng)