“某種程度上說,Dota 2成就了今天的OpenAI。”2009年,一位ID名叫“IceFrog”的游戲開發(fā)者收到了一封郵件,而沒人能想到,如同一只蝴蝶在太平洋上扇動(dòng)翅膀,這封郵件竟然也和12年后發(fā)生在人工智能領(lǐng)域的浪潮有關(guān)。 當(dāng)時(shí)的IceFrog是電子游戲 Dota: Allstars(下簡(jiǎn)稱Dota)的主要開發(fā)者。作為主創(chuàng)團(tuán)隊(duì)里唯一技術(shù)科班出身的人,他的加入,讓原先Bug泛濫、體驗(yàn)破碎的Dota變得穩(wěn)定,從而名噪一時(shí)。盡管作為當(dāng)時(shí)世界最爆紅游戲之一的主創(chuàng),IceFrog卻一直為人低調(diào),從不公開自己的個(gè)人信息,也不接受采訪。他與外界的連通渠道,只有他公開在游戲加載界面的郵箱,用來收集玩家反饋。每一天,IceFrog的郵箱,都會(huì)被幾百封郵件填滿,而他本人也盡量單獨(dú)做出回復(fù)。而上面提到的,那封與計(jì)算機(jī)歷史發(fā)展有些千絲萬縷聯(lián)系的郵件也混雜在其中。這封郵件的發(fā)件人,正是當(dāng)時(shí)憑借著《半條命》、《反恐精英》而廣為玩家所知的游戲廠商——Valve。而郵件的內(nèi)容,也簡(jiǎn)單明快:希望IceFrog可以來到Valve,主導(dǎo)自研游戲Dota的開發(fā)。彼時(shí),IceFrog正深陷“私自出售游戲創(chuàng)意”的風(fēng)波。而Valve發(fā)來的郵件卻讓IceFrog感受到,對(duì)方也是Dota的忠實(shí)粉絲,和他有著相同的游戲哲學(xué)。但最重要的是,在Valve可以讓IceFrog獨(dú)領(lǐng)大權(quán),執(zhí)掌游戲的開發(fā)。于是他與Valve一拍即合,組建團(tuán)隊(duì)完成了游戲《Dota2》的開發(fā),而這款游戲至今仍然是全世界同時(shí)在線人數(shù)最多的游戲之一。游戲《Dota2》 幾乎可以肯定的是,IceFrog曾不止一次坐在辦公室里,想象著這個(gè)自己開發(fā)的項(xiàng)目能夠成為全世界最叫好又叫座的游戲; 但他的確想不到,這款名叫《Dota2》的游戲,竟成為了10年后全球最前沿人工智能——GPT——的重要奠基,從而讓AGI(通用人工智能)的夢(mèng)想距離人類又近了一步。'在OpenAI,我們完成的第一個(gè)真正的大型項(xiàng)目,是制作了一個(gè)實(shí)時(shí)戰(zhàn)略游戲……而這個(gè)游戲名叫《Dota2》?!監(jiān)penAI的主創(chuàng)Ilya Sutskever在與英偉達(dá)創(chuàng)始人黃仁勛對(duì)話時(shí)如是說道。2016年開始開發(fā),歷經(jīng)三年時(shí)間,OpenAI Five就將Ti冠軍OG戰(zhàn)隊(duì)以2:0的戰(zhàn)績斬落馬下,不僅收獲不少鮮花和掌聲,更讓OpenAI在強(qiáng)化學(xué)習(xí)的領(lǐng)域開疆拓土,并且把這種經(jīng)驗(yàn)帶到了GPT的開發(fā)當(dāng)中,也間接促進(jìn)了RLHF(人類反饋強(qiáng)化學(xué)習(xí))技術(shù)的發(fā)展。“你們(OpenAI)在前期做的許多工作,有些看起來像是走了彎路,”黃仁勛在對(duì)話中回應(yīng)Ilya道,“但事實(shí)上,這些看起來像是彎路的工作,都導(dǎo)向了我們現(xiàn)在討論的重要的事情——比如ChatGPT。”游戲?qū)τ贏I,為何能夠如此重要?而AI又能以怎樣的方式,讓游戲產(chǎn)生新的可能?事實(shí)上,早在《Dota2》之前,游戲就是人工智能科學(xué)家們關(guān)注、研究的對(duì)象。甚至,最早的游戲就與人工智能緊密地結(jié)合在了一起。上個(gè)世紀(jì)50年代,當(dāng)時(shí)計(jì)算機(jī)剛剛誕生不久,英國劍橋大學(xué)專研計(jì)算機(jī)的一名博士——桑迪·道格拉斯,就在琢磨著如何讓人能在計(jì)算機(jī)中玩上“井字棋”。井字棋 而當(dāng)時(shí),互聯(lián)網(wǎng)概念還要幾十年才會(huì)誕生,兩人面對(duì)面用計(jì)算機(jī)玩井字棋,又難免有點(diǎn)“舍近求遠(yuǎn)”。于是,桑迪不僅開發(fā)了井字棋的游戲,還在游戲中植入了人工智能的概念,讓玩家可以和電腦對(duì)局——這可能是AI在游戲中的初次登場(chǎng)。 而后世,Deep Blue(深藍(lán))頗具爭(zhēng)議地?fù)魯H象棋世界冠軍卡斯帕羅夫;十年后,AlphaGo左右出擊,分別擊敗韓國與中國的兩位國手,又讓人們對(duì)AI的發(fā)展產(chǎn)生了注意與興趣。游戲與AI,這兩個(gè)幾乎誕生于同一個(gè)時(shí)代的計(jì)算機(jī)科學(xué)門類,就如同兩個(gè)結(jié)伴而行的舞者,從未離開對(duì)方左右。利用游戲提供娛樂,這是人們對(duì)于計(jì)算機(jī)近乎本能的需求和想象;而既然玩家要與計(jì)算機(jī)交互,為了提供“旗鼓相當(dāng)?shù)膶?duì)手”,計(jì)算機(jī)的智能——AI,其重要性也就不言而喻。但對(duì)于游戲,AI科學(xué)家看得更深,也更遠(yuǎn)。他們不只把游戲看成單純的娛樂方式;相反,他們看到了游戲技術(shù)的發(fā)展能夠給AI帶來的巨大裨益。在中國科學(xué)院虛擬經(jīng)濟(jì)與數(shù)據(jù)科學(xué)研究中心,和中國科學(xué)院大數(shù)據(jù)挖掘與知識(shí)管理重點(diǎn)實(shí)驗(yàn)室聯(lián)合出品的報(bào)告《探尋AI創(chuàng)新之路》(下稱《報(bào)告》)中,研究者表示:“游戲科技與科學(xué)探索在一開始就形成了一種雙螺旋結(jié)構(gòu),共同推動(dòng)了人工智能的發(fā)展。”而事實(shí)上,游戲產(chǎn)業(yè)對(duì)于AI產(chǎn)業(yè)的拉動(dòng)也體現(xiàn)在營收數(shù)據(jù)的相關(guān)性上。研究發(fā)現(xiàn),游戲產(chǎn)業(yè)的規(guī)模每進(jìn)行1%的增長,人工智能上市企業(yè)的合計(jì)營業(yè)收入就有約1.42億元的提升。而在未來,游戲產(chǎn)業(yè)對(duì)AI的拉動(dòng)作用,“預(yù)計(jì)將從 2023 年的 315.76 億元上升至 2030 年的 1038.1 億元,年均增長率約達(dá) 16%?!?o:p>中科院虛擬經(jīng)濟(jì)與數(shù)據(jù)科學(xué)研究中心研究組成員,《報(bào)告》的聯(lián)合作者之一劉鋒博士對(duì)雷峰網(wǎng)表示,游戲之所以能夠賦能AI,是因?yàn)樘摂M世界給了不少人工智能產(chǎn)品一個(gè)絕好的訓(xùn)練場(chǎng)。“在游戲中,特別多AI能力,比如多智能體博弈、強(qiáng)化學(xué)習(xí)、圖像識(shí)別等,利用游戲場(chǎng)景來進(jìn)行訓(xùn)練,都很合適?!眲h如是說道。為什么,游戲能夠成為AI訓(xùn)練的最佳場(chǎng)景?原因或許有以下幾個(gè):第一,大多數(shù)的游戲,玩法都離不開博弈和對(duì)抗,而在這種對(duì)抗和博弈的過程中,AI的決策能力能夠得到相當(dāng)完善的鍛煉;第二,游戲模擬了真實(shí)世界,但在虛擬世界中,無論怎樣的行為都不會(huì)造成現(xiàn)實(shí)世界的損失和傷害——這能讓AI可以在一個(gè)穩(wěn)定的環(huán)境里低成本地完成訓(xùn)練,并且這個(gè)過程可以重復(fù);第三,在虛擬世界中,研究者能主動(dòng)地改變、調(diào)整訓(xùn)練環(huán)境,以更低成本模擬極端狀況,獲得一般難以獲得的訓(xùn)練數(shù)據(jù)。舉例來說,由日本游戲大廠索尼所開發(fā)的競(jìng)速游戲系列《GT賽車》,自發(fā)售以來就憑借高精度的數(shù)字世界建模、高度還原空氣動(dòng)力學(xué)、摩擦、汽車結(jié)構(gòu)等要素,被不少玩家冠以“最真實(shí)”賽車游戲的名號(hào)。也正是依托于對(duì)現(xiàn)實(shí)的還原,索尼的AI專家研發(fā)的人工智能體——GT Sophy,幾乎“打遍天下無敵手”,更有望在游戲中積累的技術(shù)和數(shù)據(jù)應(yīng)用到自動(dòng)駕駛領(lǐng)域,讓未來的座駕更加智能、更加安全。無獨(dú)有偶,在美國公司Rockstar開發(fā)的大型沙盒游戲《GTA 5》中,也有人開源了一個(gè)自動(dòng)駕駛的項(xiàng)目,利用深度神經(jīng)網(wǎng)絡(luò)和監(jiān)督學(xué)習(xí)來訓(xùn)練游戲中的車輛完成“無人駕駛”。除了自動(dòng)駕駛領(lǐng)域,游戲更是在多個(gè)AI領(lǐng)域“開花結(jié)果”:2015年,DeepMind利用在游戲《Breakout》(打磚塊)和《蒙特祖瑪?shù)膹?fù)仇》中對(duì)AI神經(jīng)網(wǎng)絡(luò)訓(xùn)練經(jīng)驗(yàn),將數(shù)據(jù)中心的PUE(能源使用效率)提升了15%。雅達(dá)利開發(fā)的游戲《Breakout》 而法國游戲公司育碧,則利用他們?cè)谟螒颉洞炭托艞l》中高度逼真寫實(shí)的游戲人物和場(chǎng)景,來完成AI圖像識(shí)別和3D角色動(dòng)畫匹配。 游戲技術(shù)對(duì)AI的助力也得到了國內(nèi)廠商的關(guān)注。今年5月15日,鵝廠在SPARK 2023 騰訊游戲發(fā)布會(huì)上,公布了他們利用游戲技術(shù)訓(xùn)練機(jī)器人AI的最新進(jìn)展。為了讓機(jī)器狗Robotic X Max的動(dòng)作更真實(shí)流暢、決策更智能及時(shí),騰訊游戲?qū)W堂聯(lián)合START 團(tuán)隊(duì)、 Robotics X 實(shí)驗(yàn)室,將多智能體AI引入游戲場(chǎng)景,使AI在具備大約10的20000次方操作可能性的復(fù)雜環(huán)境中,學(xué)會(huì)像人一樣感知、分析、推理和行動(dòng)。目前經(jīng)過CPU優(yōu)化后,單個(gè)機(jī)器人的訓(xùn)練效率提升了20倍。騰訊機(jī)器狗Robotics X Max 而更進(jìn)一步,這些在游戲中訓(xùn)練獲得的AI能力,將在未來提高多機(jī)器人協(xié)作、精密控制、適應(yīng)復(fù)雜的環(huán)境等等能力,讓AI機(jī)器人能夠成為下個(gè)時(shí)代每一個(gè)家庭的標(biāo)配。 AI,游戲生產(chǎn)力的“升級(jí)裝備”游戲給了人工智能領(lǐng)域巨大的發(fā)展機(jī)會(huì),而從另一個(gè)角度上來看,AI也是游戲向未來邁進(jìn)的重要推動(dòng)力。發(fā)展數(shù)十年,游戲經(jīng)歷過不少高光時(shí)刻,但整個(gè)產(chǎn)業(yè)卻正面臨著增長的又一個(gè)瓶頸:玩家對(duì)游戲質(zhì)量日益增長的需求,讓精品游戲的制作成本——無論是時(shí)間成本還是金錢成本都水漲船高。一位投資人對(duì)雷峰網(wǎng)表示,在當(dāng)下越來越“卷”的游戲市場(chǎng),100萬的投資,只能給開發(fā)者買到一張“進(jìn)場(chǎng)券”,如果投入少于1000萬,那么就很難能夠做得出足稱“精品”的游戲。如果項(xiàng)目成功,開發(fā)者則必須考慮活躍度、付費(fèi)等等指標(biāo),才可能負(fù)擔(dān)成本;而如果項(xiàng)目失敗,那么幾年間大量的投入都如同被付之一炬,再不見回報(bào)。而上文《報(bào)告》則指出,造成這種現(xiàn)象的,歸根結(jié)底是游戲產(chǎn)業(yè)內(nèi)容生產(chǎn)力的逐漸匱乏:對(duì)玩法、故事、畫面愈發(fā)細(xì)致的打磨,讓大量的人力被卷入其中,造成了游戲開發(fā)的成本不斷擴(kuò)張,項(xiàng)目風(fēng)險(xiǎn)也難以把控。而在生成式AI的技術(shù)賦能下,生產(chǎn)力的問題也就不再是無解的難題。一方面,游戲的美術(shù)資源,可以利用當(dāng)下成熟的AIGC文生圖技術(shù),來完成快速的創(chuàng)意迭代,生成參考圖、概念圖等等;另一方面,利用生成式AI,游戲的策劃則可以利用大模型來獲取玩法參考、調(diào)整數(shù)值平衡、生成故事梗概,輔助創(chuàng)意工作;而在程序側(cè),利用大模型生成、檢查代碼,對(duì)開發(fā)的效率有著巨大的提升,這也讓AI輔助逐漸成為了實(shí)際開發(fā)中越來越多人的選擇。AIGC與游戲開發(fā)的距離,比很多人想象中要更近。利用一個(gè)名為MarioGPT大語言模型,國外的一群研究者研發(fā)完成了一個(gè)“文本生成關(guān)卡”的功能,并將其應(yīng)用到了《超級(jí)馬里奧》當(dāng)中。論文中的演示畫面 而在游戲《微軟模擬飛行》中,AI也輔助了游戲中的場(chǎng)景生成,這其中包括超過15億棟的高寫實(shí)建筑物。當(dāng)玩家駕駛著飛機(jī),從香港、洛杉磯、倫敦的上空飛過時(shí),在機(jī)身下方栩栩如生的建筑物群,都是由AI從2D衛(wèi)星圖像中生成的,如果要以人力完成這項(xiàng)工作,那么成本則難以想象。 在不少游戲中,性格各異、特色迥然的游戲角色是游戲劇情設(shè)計(jì)的亮點(diǎn),也是最能反映游戲編劇創(chuàng)意的一個(gè)部分;但如果要為一個(gè)龐大游戲中,數(shù)以百計(jì)的NPC一一撰寫對(duì)話和臺(tái)詞,這些大量的重復(fù)性工作恐怕稱得上是煎熬。在當(dāng)下,將大模型API接入游戲角色,讓對(duì)話完全由AI驅(qū)動(dòng),可能還并不現(xiàn)實(shí):大模型對(duì)于對(duì)話的反應(yīng)速度相對(duì)比較遲緩,而如果還要根據(jù)語義適配NPC合適的表情和手勢(shì),那么反應(yīng)速度還會(huì)更慢。而事實(shí)是,玩家在游戲中大多需要獲得即時(shí)的反饋。玩家說一句話,NPC如果要用幾十秒才能給玩家回應(yīng),許多玩家恐怕都接受不了。就在今年,法國游戲廠商育碧發(fā)布了一個(gè)名叫Ghostwriter的AI工具,主打利用AIGC,幫助劇情策劃完成玩家與NPC互動(dòng)時(shí)的臺(tái)詞,甚至還能利用算法,快速勾勒出這個(gè)NPC的一生。同樣的工作,可能會(huì)花費(fèi)一個(gè)資深策劃數(shù)個(gè)小時(shí),甚至大半天的工作時(shí)間。生成式AI的路徑不斷被驗(yàn)證,讓游戲開發(fā)中,少了很多讓人絞盡腦汁的“創(chuàng)意內(nèi)耗”,也少了很多重復(fù)性的機(jī)械勞動(dòng)。游戲廠商不再把更多精力放在“降本”上,也就有了更多余裕去思考如何“增效”,為玩家?guī)砀喔玫捏w驗(yàn),游戲產(chǎn)業(yè)也能夠因此獲得健康、可持續(xù)的長足發(fā)展。2022年末,ChatGPT將全球的目光引向生成式AI,并以頗具想象力的愿景,讓人們看到了AI進(jìn)入社會(huì)生活方方面面的未來——游戲當(dāng)然也是其中之一。游戲和AI,這兩個(gè)脫胎于計(jì)算機(jī)技術(shù)的孿生雙子,一直以來,就互為增長要素,以自身發(fā)展驅(qū)動(dòng)對(duì)方增長,形成了一個(gè)絕佳的飛輪。一方面,游戲技術(shù)在圖形、模擬等領(lǐng)域上的提升,讓游戲能夠更好地為AI訓(xùn)練提供條件;一方面,AI技術(shù)的不斷發(fā)展,也帶給了游戲創(chuàng)新和體驗(yàn)升級(jí)更多的可能性。有學(xué)者表示,如果沒有游戲,那么這一波AI
2.0的大潮可能會(huì)遲來十年以上。正是因?yàn)橥婕覍?duì)于游戲畫面越來越高的追求,才催生了GPU的誕生和發(fā)展。而AI能發(fā)展至今,GPU居功至偉——在深度學(xué)習(xí)領(lǐng)域,GPU的訓(xùn)練速度相較CPU,有100倍以上的領(lǐng)先優(yōu)勢(shì)。而如果沒有游戲推動(dòng)GPU出現(xiàn),按照半導(dǎo)體的“摩爾定律”,CPU用10年發(fā)展,算力才能提升64倍。即使如此,CPU也還是很難趕上GPU在當(dāng)下訓(xùn)練AI的效率。在游戲發(fā)布會(huì)上,騰訊高級(jí)副總裁馬曉軼表示:“生發(fā)于游戲產(chǎn)業(yè)的游戲科技,不僅在不斷革新游戲產(chǎn)品形態(tài)與研發(fā)方式,而且也有望為更多生產(chǎn)、生活領(lǐng)域帶來新可能。隨著各種游戲技術(shù)的跨界應(yīng)用越來越多地涌現(xiàn),游戲?qū)⒂型黄萍扔挟a(chǎn)業(yè)范疇,迎來全新的'第三次擴(kuò)容’。”在今天,游戲和AI這朵“雙生花”的故事,盡管已然十分精彩、漸入佳境,但仍然遠(yuǎn)未走到終點(diǎn)。或許如同《Dota 2》之于OpenAI,在20年后,不知哪款游戲也會(huì)成為人工智能向著通用人工智能邁進(jìn)的一塊重要基石,被濃墨重彩地寫進(jìn)人類信息技術(shù)發(fā)展的歷史當(dāng)中。
|