文/Totti 人工智能進(jìn)軍電競領(lǐng)域,能為電競帶來哪些發(fā)展? 昨晚,暴雪聯(lián)合DeepMind宣布,“AlphaStar”將會登錄《星際爭霸》歐洲服務(wù)器,玩家與AlphaStar 的勝負(fù)會直接影響比賽匹配分級(MMR)。 AlphaStar是谷歌DeepMind項(xiàng)目專為《星際爭霸2》設(shè)計的人工智能,將以多個種族進(jìn)行1v1的比賽,使用“類似攝像頭的視野”來感知地圖。 理論上,計算機(jī)的操作速度遠(yuǎn)超人類,我們普通人一般一分鐘進(jìn)行30到300次操作,職業(yè)選手可以做到每分鐘500次操作。如果不限定操作速度的話,基本上沒有意義了。所以,在DeepMind發(fā)布的AlphaStar之時,操作速度被限制為每分鐘180次。 即便如此,今年1月AlphaStar以10-1輕松戰(zhàn)勝2018WCS Circuit排名13、神族最強(qiáng)10人之一的MaNa。AlphaStar可以輕松戰(zhàn)勝職業(yè)選手,與它的訓(xùn)練方法有著直接關(guān)系。Deepmind研發(fā)的AI由多個模塊構(gòu)成深度網(wǎng)絡(luò),由Transformer和LSTM的網(wǎng)絡(luò)結(jié)構(gòu)構(gòu)建。這類網(wǎng)絡(luò)最大的特點(diǎn)就是有驚人的記憶能力,可以在很長的序列下自動找到數(shù)據(jù)間的關(guān)聯(lián)。 一方面,AlphaStar的訓(xùn)練是在暴雪提供的數(shù)據(jù)集上進(jìn)行的有監(jiān)督學(xué)習(xí)。據(jù)DeepMind稱,經(jīng)過有監(jiān)督學(xué)習(xí)的AlphaStar進(jìn)行聯(lián)賽,相互對打,在這個過程中使用強(qiáng)化學(xué)習(xí)不斷提升能力。有監(jiān)督學(xué)習(xí)使得AlphaStar達(dá)到人類中的金牌水平(Gold Level),在進(jìn)行了8天強(qiáng)化學(xué)習(xí)之后,AlphaStar最終超過人類選手TLO。14天之后超過了人類選手MaNa。值得一提的是,在 14 天的強(qiáng)化學(xué)習(xí)訓(xùn)練期間,每個AlphaStar相當(dāng)于完成了200年的游戲經(jīng)驗(yàn)。 另一方面,為了加快計算速度DeepMind使用了Google's v3 TPU開發(fā)了一個分布式訓(xùn)練系統(tǒng)。TPU (Tensor processing unit)是 Google開發(fā)的專門用于人工智能的處理器,從 2016 年推出,至今已經(jīng)演進(jìn)到第三代。每一個AlphaStar智能體使用了16塊三代TPU,TPU 可以為神經(jīng)網(wǎng)絡(luò)處理大量的乘法和加法運(yùn)算,而且在大量計算和數(shù)據(jù)傳遞的整個過程中,不需要執(zhí)行任何的內(nèi)存訪問。這也是TPU計算速度驚人的原因。 人工智能和競技類游戲有著千絲萬縷的聯(lián)系,代表就是AlphaGo(阿爾法狗)。圍棋狀態(tài)空間復(fù)雜,每一步可以選擇的落點(diǎn)有大約300個。這一數(shù)字看上去已經(jīng)十分巨大,但還是遠(yuǎn)不及即時戰(zhàn)略游戲。 AI對即時戰(zhàn)略游戲的研究也分出了兩大主要陣營:《星際爭霸》和《Dota2》,兩者有著一樣的共同點(diǎn),需要在收集資源與打架之間尋找平衡點(diǎn)。同時,也有著很多區(qū)別,《星際爭霸》需要一名玩家控制多種不同類型的單位,這些單位有各自的運(yùn)動和攻擊特點(diǎn),而《Dota2》中是由五名玩家從頭到尾只控制自己的英雄。 《Dota2》項(xiàng)目組的AI——OpenAI,是最早出現(xiàn)在比賽場的人工智能。2017年8月,OpenAI人工智能機(jī)器人與Dendi進(jìn)行了三局比賽。在第一局的對決中,游戲一開始OpenAI人工智能機(jī)器人就占據(jù)了主導(dǎo)地位,僅僅10分鐘就擊敗了Dendi,而第二局還未開始很長時間,Dendi就率先認(rèn)輸,他還直接放棄了第三局的比拼。 2019 年 4 月,OpenAI FIVE橫空出世,五個號稱訓(xùn)練了四萬五千年的人工智能,輕松以2:0的比分戰(zhàn)勝TI8冠軍OG戰(zhàn)隊。兩局比賽加在一起,人類只推掉了AI兩座外塔。最慘烈的第二局,人類直到最后擊殺人頭數(shù)還是個位數(shù)。 隨后,OpenAI FIVE開發(fā)團(tuán)隊宣布面向全球開放,在有限的規(guī)則限制下接受所有玩家的5v5挑戰(zhàn)。經(jīng)過長達(dá)七個小時的努力,由YYF、Longdd、Hao、Zhou、Zippo組成的OB五熊最終過45分鐘的鏖戰(zhàn),以人頭48-42戰(zhàn)勝了OpenAI。比賽中OpenAI也暴露了許多問題,AI會在自己的泉水或者其他奇怪的地方反復(fù)插眼,而隊中的萊恩甚至還掛機(jī)了一會兒。 就目前AI在電競比賽上的表現(xiàn)可以看出,在《星際爭霸》這種1V1的項(xiàng)目上,因?yàn)橛嬎隳芰Τ?、?zhàn)術(shù)多樣化等特點(diǎn),在與人進(jìn)行對抗時占據(jù)優(yōu)勢。而《Dota2》這種團(tuán)隊向的游戲中,AI會因?yàn)槿鄙賾?yīng)對還有很大的上升空間。 根據(jù)中國報告網(wǎng)發(fā)布《2018-2023年中國人工智能產(chǎn)業(yè)市場運(yùn)營現(xiàn)狀分析及未來前景商機(jī)預(yù)測報告》顯示,人工智能發(fā)展至今,還不到一個世紀(jì),其發(fā)展前景有著無限可能。 雖然這次AI模型用在《星際爭霸》上,但DeepMind表示這次是個足夠復(fù)雜、具有代表性的任務(wù),用來解決這個任務(wù)的技術(shù)也可以用在更多其他的復(fù)雜問題上。比如AI可以在多個領(lǐng)域中大展拳腳,比如天氣預(yù)測、氣候建模、語言理解等等。 在每次的的“人機(jī)大戰(zhàn)”中,人類都充當(dāng)著挑戰(zhàn)者的角色,但到底AI能夠?yàn)殡姼傂袠I(yè)帶來什么呢?我們認(rèn)為有以下幾個方面: 1.現(xiàn)今職業(yè)聯(lián)賽發(fā)展迅速,各大戰(zhàn)隊在技戰(zhàn)術(shù)上依賴于電競分析師的努力。但人的精力畢竟是有限的,大量的比賽數(shù)據(jù)通過人腦總結(jié)必定耗時過長,并且復(fù)雜的工作量容易出現(xiàn)紕漏。而AI擁有大數(shù)據(jù)的優(yōu)勢,使得它能幫助選手解析戰(zhàn)術(shù)策略,做出成百上千種不同的訓(xùn)練套路,可以幫助選手豐富技戰(zhàn)術(shù)打法。 2.AI利用敵方選手為模型完美演繹其在賽場上的表現(xiàn),能夠幫助己方隊伍研究出致勝套路,幫助團(tuán)隊在賽場上獲得勝利。經(jīng)過長時間的訓(xùn)練,賽事會愈加精彩,關(guān)注度也會大大提高。甚至對于一些剛成立的俱樂部而言,在約不到訓(xùn)練賽的情況下能夠輔助戰(zhàn)隊訓(xùn)練,提升自身實(shí)力。 當(dāng)然,這些都是常規(guī)操作。在今年的騰訊電競年度發(fā)布會上,騰訊 AI Lab 則在大會上正式發(fā)布了首個“電競虛擬人”。騰訊AI Lab副主任及西雅圖實(shí)驗(yàn)室負(fù)責(zé)人俞棟在闡述它的功能時說;“對普通人,電競虛擬人能教你如何應(yīng)戰(zhàn),磨練電競技巧;對賽事觀眾,電競虛擬人虛擬人能提供個性化解說,定制解說,陪你看比賽,為你解讀情境;對職業(yè)選手,電競虛擬人虛擬人能成為教練、數(shù)據(jù)分析師、閑聊好朋友,通過專業(yè)分析讓選手能走得更遠(yuǎn);期待虛擬人能從電競進(jìn)入更多行業(yè),創(chuàng)造無限可能”。 或許很多人會擔(dān)憂隨著AI的發(fā)展人會變得多余。其實(shí)大可不必,雖然如今人工智能在許多地方取得了不俗的成就,但其本質(zhì)仍然是人類的工具。 我要找陀螺電競 商務(wù)合作/采訪/約稿: KF(微信號:u-1003) |
|