?? 世界第一圍棋棋手李世石愁眉苦臉地走向布置好的主席臺,坐在一張椅子上,放眼望去,臺下滿是媒體記者長槍大炮般的攝影機,燈光閃爍。左一為李世石,他旁邊的是AlphaGozhiu之父戴密斯·哈薩比斯 李世石剛剛與AlphaGo系統(tǒng)進行完第一場比賽,落敗。賽前,他信心滿滿地說:“我相信人類的直覺還是遙遙領(lǐng)先于機器的,人工智能難以望其項背,我將竭盡所能捍衛(wèi)人類的智慧?!崩钍朗M?:1或5:0戰(zhàn)勝AlphaGo。AlphaGo系統(tǒng)由英國計算機公司DeepMind(DP)研發(fā),2014年DP被谷歌收購。DP把AlphaGo在圍棋的對抗視為“人工智能領(lǐng)域的阿波羅計劃”,DP的任務(wù)是從根本上理解智能,然后人為塑造智能。第二局開始,全世界有八千多萬人在看比賽,六千多萬在中國。AlphaGo在此局中第37手下了一個人類只有萬分之一概率會選擇的“敗子”,全世界的人都疑惑為什么會如此選擇時,棋局進入臨界點,李世石再次輸了,“敗子”把整個棋局盤活了。每局比賽結(jié)束,李世石都要面對媒體。在聚光燈下,李世石和人類一同進入焦慮時刻,他說,自己一開始就喪失了主導權(quán)。全世界的媒體也從一開始討論AlphaGo如何厲害,變成恐懼和傷感。第三局沒多久,李世石落敗,媒體上鋪天蓋地出現(xiàn)了關(guān)于他的質(zhì)疑,他不再是代表人類對抗人工智能的英雄,反而成了一個落敗者。李世石也在媒體面前道歉:“如果我的棋藝更高超,或智商更高超,結(jié)果可能截然不同,這一次我讓很多人失望了?!?/span>在輸贏已定的情況下,李世石內(nèi)心的重擔反而放下了,第四局進行到1個小時14分時,李世石在第78步用挖,在對手相隔一路的棋子中間落一子。這招之后,AlphaGo預測的勝率開始大幅下降,直至脫軌,它更換評估方法和搜索路徑,所有人都不知道它在做什么,大家都覺得它的行為表現(xiàn)很奇怪。AI的核心算法是深度神經(jīng)網(wǎng)絡(luò),也就是在電腦上模擬人類大腦的神經(jīng)元網(wǎng)絡(luò),這種算法的美妙之處就在于程序能給自我學習,也就意味著它能做出超出程序設(shè)計師所知范圍的事情。忽然,電腦對弈屏幕上,出現(xiàn)一條彈窗:“the result 'W+Resign’ was added to the game information”。“the result 'W+Resign’ was added to the game information”。在AlphaGo的預測中,李世石走第78步的概率只有0.007%。李世石也不知道自己為什么會走第78步,他說,那是他知覺中唯一能走的一步。即便如此,李世石最終只拿到一個勝局,而他與AlphaGo一同完成了人工智能的有一個里程碑,上一枚里程碑建立在1997年,IBM的超級計算機DeepBlue(深藍)擊敗了世界西洋棋棋王加里·卡斯帕羅夫(Garry Kasparov)。簡單來說,因為游戲很容易量化計分,我們很容易從中測量漸進式進步(incremental progress),DP想要AI取得突破,就繞不開圍棋,因為圍棋是人類有史以來發(fā)明過最復雜的游戲。圍棋起源于中國,擁有兩千多年歷史沉淀,只有一種棋子,也只有一種落子方式,雙方各執(zhí)黑白棋子,目標是把棋子連接起來,制造一個彼此相連的群體,把一個空地圈起來,被包圍的棋子就會被清除出去,通過保衛(wèi)領(lǐng)土的方式消滅對手,獲得勝利。表面看起來很簡單,實際上很抽象,不是所有人都玩得轉(zhuǎn)。DP研究人員計算過,圍棋每一步大約有兩百種選擇路徑,棋盤上出現(xiàn)的棋局數(shù)量,比宇宙中的原子數(shù)量還要多,圍棋變幻的數(shù)目,即使運用全世界彼時的電腦算力運轉(zhuǎn),100萬年也沒法窮盡它可能變化的形式。認知決策模型是人機對抗規(guī)程中的核心環(huán)節(jié)。AlphaGo由三個主要部分組成,首先是策略網(wǎng)絡(luò),DP用數(shù)以萬計的高水平棋局訓練它,并模仿那些厲害棋手的招式;第二部分是估值網(wǎng)絡(luò),第一個棋子落入棋盤,可以衡量棋局的形勢,計算出各個位置的勝率,第三部分叫做樹搜索,用來分析棋局各種可能變化的情形,并嘗試推演棋局未來的演變。“AlphaGo是要最大化自己的勝率,它不關(guān)心自己具體贏了多少子多少目?!辟惽埃珼P團隊成員期待,“如果能戰(zhàn)勝人類,那就非同凡響了。”后來,人們復盤AlphaGo與李世石在第四場對戰(zhàn)失敗中尋找原因,發(fā)現(xiàn)第78手后連續(xù)出現(xiàn)錯誤,直指人工智能的魯棒性。可以簡單把魯棒性理解為穩(wěn)定性,指一個計算機系統(tǒng)在執(zhí)行項目過程中處理數(shù)據(jù)時維持正常運作的能力,如果穩(wěn)定性差,能力也就差。DP想要解決AlphaGo的這個問題,關(guān)鍵是提高策略網(wǎng)絡(luò)和估值網(wǎng)絡(luò)的精度。他們很快做了調(diào)整,在之后與中國圍棋職業(yè)九段棋手、世界圍棋史上最年輕五冠王柯潔的比賽中“三連殺”,讓柯潔經(jīng)歷至暗時刻,掩面而泣。業(yè)界很快從本次世界頂級對抗賽中吸收經(jīng)驗,在之后的同類型比賽中,不論是棋牌游戲,還是策略游戲,研究團隊把其視為珍貴的AI魯棒性論證支撐材料。DP團隊后來推出另一個機器人取名AlphaZero,僅僅運行8個小時,便以100:0的戰(zhàn)績碾壓掉AlphaGo(擊敗李世石的版本),它還在繼續(xù)進化。就在2016年圍棋界劃時代的“人機大戰(zhàn)”一年后,“機機大戰(zhàn)”在日本頃刻上演。2017年3月19日,第10屆UEC杯計算機圍棋大賽在東京落幕,30個AI軟件參賽,來自騰訊AI Lab團隊研發(fā)的圍棋人工智能程序“絕藝”過關(guān)斬將,在總決賽擊敗對手日本選手DeepZenGo,最終11戰(zhàn)全勝,摘得桂冠。如果說游戲為AI的進化提供了完美的試驗場地,那么人類的豐富經(jīng)驗則為AI不斷進化提供了充分的養(yǎng)料。基于策略型手游《王者榮耀》的王者絕悟AI,其側(cè)重點是多智能體,面臨更多更復雜的環(huán)境,每天深度模仿職業(yè)玩家戰(zhàn)術(shù)方法,同時自我博弈。為了評估控制能力的魯棒性,2019年8月1日起,人類玩家可以與AI英雄1V1挑戰(zhàn)。統(tǒng)計結(jié)果顯示,AI英雄在比賽中幾乎無敗績。AI Lab提供技術(shù)能力,王者榮耀團隊解決人工智能研究三大課題里面的場景和數(shù)據(jù)難題?!皟蓚€團隊共享核心代碼、數(shù)據(jù)、能力結(jié)構(gòu),在這基礎(chǔ)之上強化機器學習?!毕嚓P(guān)負責人告訴刺猬公社(ID:ciweigongshe)。游戲的互動性優(yōu)勢適合人們學習和實操一些靜態(tài)知識,科研人員與游戲從業(yè)者協(xié)作工作,把游戲與科研融合成了一個很早就被看中的方向。此類實驗有很多,比如廣為人知的太空題材游戲《星戰(zhàn)前夜》探索計劃。這是一個融合項目,是冰島游戲公司CCP在2016年發(fā)布的公益類共創(chuàng)內(nèi)容,他們與日內(nèi)瓦大學、瑞典皇家理工學院等科研機構(gòu)合作,吸引非專業(yè)科研人員參與其中,幫助科學家操作一些相對簡單重復的識別與分類工作,目前主要推進了“人類蛋白圖譜”“地外行星”兩個項目。在“人類蛋白圖譜”項目中,玩家要對1300萬個人類細胞蛋白質(zhì)染色體圖進行分類,在互動性和使命感號召下,超過30萬名玩家參與該項研究,總計完成3300萬個圖像分類,確實幫助科學家提升了研究效率。在更早些時間,華盛頓大學科研人員開發(fā)過一款益智游戲《Foldit》,開發(fā)人員利用人類天生的三維圖形匹配能力,允許普通玩家對氨基酸進行自由組裝,最終組建一個蛋白完整結(jié)構(gòu)。一個與艾滋病相關(guān)的蛋白結(jié)構(gòu)曾困擾科學家15年之久,2011年,《Foldit》和玩家用10天時間,幫助科學家成功解讀。《Foldit》沒有停止腳步,2020年2月,針對新冠疫情,研究人員推出新關(guān)卡“1805b:冠狀病毒尖峰蛋白結(jié)合劑設(shè)計(Coronavirus Spike Protein Binder Design)”。簡單來說,需要玩家針對既定蛋白中的鏈,重新設(shè)計出一種新的蛋白質(zhì)結(jié)構(gòu),阻斷新冠病毒與人體細胞結(jié)合,幫助研發(fā)人員發(fā)現(xiàn)抗病毒新藥。幾年前,《美國國家科學院院刊》刊登過一篇3.7萬人寫的論文,但“作者”也是游戲玩家,他們在科學游戲《EteRNA》中設(shè)計核糖核酸(RNA)的分子創(chuàng)造蛋白質(zhì)。這件事的思路與《Foldit》如出一轍,實質(zhì)都是眾籌科學實驗,集體智慧的力量在某種程度上超越了超級計算機。這種形式更像是“眾包式”的游戲科研方法途徑,科研機構(gòu)把一個科學命題分發(fā)給全世界玩家,自由參與其中,而具體任務(wù)有個人承擔。對《EteRNA》和《Foldit》進行過深入研究的美國信息傳播學者凱西·奧唐納說:“讓游戲和玩家參與到科學,我們改變了科研的形式?!?/span>在工業(yè)制造領(lǐng)域,游戲還推動著數(shù)字孿生的發(fā)展。最早的數(shù)字孿生概念可追溯到2002年的美國。密歇根大學教授邁克爾·格里弗斯(Michael Grieves)在美國工業(yè)制造工程協(xié)會舉辦的一個論壇上,針對產(chǎn)品全生命周期管理提出“鏡像空間模型”概念,構(gòu)思工業(yè)工廠在虛擬空間模仿生產(chǎn)流程,并進行實驗管理,提升效率。對于傳統(tǒng)工業(yè)而言,穩(wěn)定性、安全性和低效能是他們一直追求的方向,行業(yè)先行者曾利用傳感器等方式對現(xiàn)實世界進行掃描投射,但成本太高、操作程度太難,沒能快速前進,直到虛擬引擎的出現(xiàn)與進步,讓游戲成為他們實驗的最佳場所。數(shù)字孿生應(yīng)用是數(shù)字工業(yè)領(lǐng)域目前最火熱的方向和話題之一,包括沃爾沃汽車、京東、阿里巴巴在內(nèi)的很多國際型大公司都在使用Unity支持下的數(shù)字孿生技術(shù)能力。根據(jù)美國咨詢公司Forrester在2020年的一份報告判斷,數(shù)字孿生應(yīng)用正處在大爆發(fā)前夜。55%的工業(yè)公司會在兩年內(nèi)使用數(shù)字孿生應(yīng)用,94%的已使用者會在數(shù)字孿生應(yīng)用方面加大投入,這將會顛覆現(xiàn)有的工作流和過程。春江水暖鴨先知,早早與Unity合作的科技公司并非來自To C互聯(lián)網(wǎng),而是來自傳統(tǒng)工業(yè)領(lǐng)域,其中包括沃爾沃汽車。但是在實踐過程中,并非一帆風順,內(nèi)部阻力不容小覷。主導這項技術(shù)合作的高級工程師張曉辰透露,現(xiàn)實操作中面臨的第一個挑戰(zhàn)是觀念:Unity是一個游戲引擎平臺,它能在工業(yè)領(lǐng)域做出成果嗎?張曉辰和團隊比較年輕,當他們拿出成果給公司傳統(tǒng)工程師看時,往往能直接改變他們的看法,甚至會啟發(fā)新的思路。因為他們不是為了取代任何人,而是作為輔助工具,提升開發(fā)過程中的信息透明度和迭代效率,更快解決問題,降低成本。除了刻板印象之外,還有工業(yè)流程方面的挑戰(zhàn),主要來自內(nèi)容供給上。對于小型游戲開發(fā)公司而言,程序員、游戲策劃師、UI美工、3D建模師都在一個團隊里,一般的游戲邏輯都是為了一個游戲而打造。而張曉辰在沃爾沃內(nèi)部很難有這樣的便利,他手頭的3D車模和3D場景一個都沒有,只能向擁有這些資源的人溝通,但并不是所有人都有義務(wù)支撐他們,因為這不是本職工作。他們一度當起中介,協(xié)調(diào)公司內(nèi)部資源。后來,他們從市場部同事那里拿到購買的3D模型,制作了一個安全測速模型——當車行進到學校等路段時,系統(tǒng)自動限速。兩周內(nèi)加班加點完成任務(wù),這打響了他們的第一槍,逐步在公司內(nèi)部迎難而上。張曉辰后來總結(jié),沃爾沃和Unity聯(lián)手的過程相輔相成,Unity為沃爾沃提供技術(shù)和資源支持;沃爾沃為Unity提供汽車工業(yè)中的應(yīng)用場景需求,并提供有效反饋。這條經(jīng)驗與騰訊AI Lab實驗室、王者榮耀團隊的總結(jié)基本一致,通過虛擬仿真,推動更多應(yīng)用場景。如今,隨著包括Unreal、Unity等在內(nèi)的一系列游戲引擎的發(fā)展,數(shù)字孿生體的主題角色不局限于車輛,還可以是人體、建筑物、醫(yī)學細胞等。數(shù)字孿生以真實物體的替身出現(xiàn)在虛擬場景中,一切真實事物不方便測試的場合,都可以在通過數(shù)字孿生在虛擬空間中實現(xiàn)。也正是通過游戲引擎技術(shù)能力的不斷外溢,游戲與科技之間的關(guān)系正變得愈發(fā)緊密,在未來的科技創(chuàng)新與發(fā)展過程中,游戲承擔的角色也將會越來越重要。
|