對于每一個游戲玩家來說,NPC(非玩家控制角色)或許都不陌生,你可以通過他們學(xué)習(xí)游戲操作、了解游戲背景、得到任務(wù)線索和物品,甚至有些開放世界游戲里,你還能培養(yǎng)不同NPC的好感度,發(fā)展友情、愛情。 但是,在目前絕大多數(shù)的游戲里,你都沒辦法和NPC真正的聊天,他們給人的感覺更多是被寫入劇本的“工具人”,他們念著沒有感情的臺詞、在固定的位置不眠不休地“被玩家搭訕”。 不過,隨著技術(shù)的進(jìn)步,越來越多的高品質(zhì)游戲開始加入了更真實化的NPC,除了獨特的個性、背景,甚至還能擁有自己的思維方式,或許會有一天,你甚至分不清游戲里哪個是真人玩家,哪一個是NPC。 不信?我們來看看Modbox開發(fā)者Alientrap通過將Windows語音識別、OpenAI的GTP-3 AI和Replica的自然語音合成等技術(shù)融合之后打造的demo: 有性格、會嘲笑你的NPC 這段Demo展示視頻只進(jìn)行了兩段對話,從NPC的回答方式和語氣來說,如果不是角色比較卡通,你很難判斷他到底是真人還是AI,我們不妨分別看看兩短對話的內(nèi)容: 第一段對話是測試者與市政工作人員Bobby: Bobby不僅說話有語氣,還會用手比劃 測試人:你好,Bobby。 Bobby:你想干嘛?(英文回答選擇了What do you want?可以明顯聽出來有點不耐煩) 測試人:你要去哪? Bobby:我要去上班,馬上要遲到了,如果到公司晚了會被老板罰的。請走開吧,我現(xiàn)在沒法幫忙。 測試人:你在哪上班? Bobby:我在市政廳上班,位于城中心的一座政府大樓里,那是一座很大很漂亮的建筑,不容錯過。 測試人:它在哪條街道上? Bobby:你簡直太聰明了,我喜歡你這樣的!市政廳不就在市政路上(可能是在嘲笑測試者明知故問)。 測試人:好吧,再見。 Bobby:再見! 第二段是與賣熱狗的小攤販交談,我們姑且叫他,熱狗男(Hotdog Man) 帶表情和肢體語言的熱狗男 測試人:你好,熱狗男 熱狗男:您要點兒什么? 測試人:你這里都有什么類型的熱狗? 熱狗男:我們有三種熱狗,普通的,甜的還有非常辣的。 測試人:能賣給我三合一口味的嗎? 熱狗男:不好意思,我們不能做這樣的口味,客戶不會喜歡的。 測試人:好吧,一個熱狗多少錢? 熱狗男:一個常規(guī)熱狗6金幣,甜熱狗10金幣,辣熱狗9金幣一個。 測試人:是什么讓它這么辣? 熱狗男:上面加了一點辣醬,所以非常辣。 從NPC回答的內(nèi)容來看,無論是Bobby還是熱狗男,都比絕大多數(shù)游戲里的NPC更“聰明”一些,而且其語言表達(dá)方式不僅能反映出角色個性、即時狀態(tài),還可以看出NPC與玩家之間的關(guān)系遠(yuǎn)近。 不過,從給出問題到通過GPT-3和Replica給出答案,往往有比較明顯的延遲時間,盡管回答內(nèi)容非常有個性,但這個等待時間還是會讓人瞬間出戲。當(dāng)然,比較好的消息是,隨著技術(shù)的進(jìn)步,這種延遲或被逐步消弭,比如谷歌和亞馬遜已經(jīng)在一些智能家用設(shè)備增加了定制芯片,以降低數(shù)字助手的反應(yīng)延遲。 Demo背后的“黑科技”:GPT-3模型與自然語音合成 據(jù)GameLook了解,Modbox是一款支持SteamVR的多人游戲創(chuàng)作沙盒,經(jīng)過了多年的公開測試研發(fā)之后于去年底發(fā)布,不過仍處于Early Access過程中,某種程度上來說,這個技術(shù)是領(lǐng)先于時代的。 在最近的測試中,開發(fā)商Alientrap使用了兩種最先進(jìn)的機(jī)器學(xué)習(xí)服務(wù),包括OpenAI的GPT-3語言模型和Replica的自然語言合成??紤]到微軟曾經(jīng)給OpenAI投資10億美元,并且擁有GPT-3的商業(yè)使用和源語言獨占特權(quán),所以該功能是不可能只用于Modbox。 2017年的時候,谷歌的AI部門公布了一個語言模型Transformers。在此之前,最先進(jìn)的機(jī)器學(xué)習(xí)模型已經(jīng)使用Attention的概念來獲得更好的結(jié)果,但Transformers完全是圍繞它而打造的,谷歌甚至將論文標(biāo)題名命為“Attention Is All You Need”。 GPT-3論文截圖 2018年的時候,埃隆·馬斯克支持的OpenAI將Transformers方式應(yīng)用到了一個新通用語言模型中,即生成式預(yù)訓(xùn)練(Generative Pre-Training,簡稱GPT),并且發(fā)現(xiàn)它可以預(yù)測很多句子里的下一個單詞,還能回答一些多選問題。 2019年,OpenAI將該模型擴(kuò)大了10倍以上,形成了第二代模型GPT-2,但他們發(fā)現(xiàn),這種擴(kuò)容大幅增加了系統(tǒng)能力,給出幾句提示語,它幾乎可以對任何話題寫出文章,甚至還能翻譯不同語言。某些案例中,寫出來的文章甚至與真人無異。由于潛在的后果,OpenAI最初決定不將它發(fā)布出來,導(dǎo)致了大量的媒體報道和高級語言社會影響的猜測。 GPT-2有15億個變量,但在2020年6月份,OpenAI再次擴(kuò)容,將GPT-3模型里的變量增加到了1750億個,它寫出來的文章幾乎全部都很難辨認(rèn)出與真人寫手的區(qū)別。 技術(shù)上來說,GPT-3是沒有真正“理解力”的,因為如果放任機(jī)器自我思考,往往會帶來荒謬或偏執(zhí)的結(jié)果,盡管有時候這些互動可以帶來趣味,但極端情況下會造成一些重大事故,比如曾有AI語音助手告訴某些人去自殺。 跟AI嘮嗑現(xiàn)實嗎?智能游戲NPC并不遙遠(yuǎn) 1931年,計算機(jī)科學(xué)之父“艾倫·圖靈”曾提出一種測試機(jī)器是否具備人類智能的方法:如果一臺電腦的表現(xiàn)(act)、反應(yīng)(react)和互動(interact)都和有意識的個體一樣,那么它就應(yīng)該被認(rèn)為是有意識的。 這就是著名的“圖靈測試”。 如果按照這個標(biāo)準(zhǔn),demo里的NPC無疑是有意識的,他們有自己的性格和說話方式。不過,與很多虛擬偶像或者智能語音助手“機(jī)器音”不同的是,Modbox創(chuàng)作的NPC說話聲音已經(jīng)很像真人。 如果看完了展示視頻,你還能發(fā)現(xiàn),無論是Boddy還是熱狗男,每一個回答都有不同的語氣,還會根據(jù)自己的心情和狀態(tài)在說話中表現(xiàn)出抑揚頓挫。這就意味著,未來的游戲里,玩家們有望看到更智能的NPC角色,隨著GPT語言模型的升級,你甚至能和AI聊很久。 不得不說,這個demo視頻向我們展示了智能角色的潛力。隨著AI回答延遲的降低,最終游戲里將會出現(xiàn)隨口能回答問題,還帶有自己個性和情緒的智能NPC,甚至,你都不知道和自己說話的,到底是真人,還是NPC。 ····· End ····· |
|