智能助手走進人類生活已達十年之久。在某彈幕網(wǎng)站,我很喜歡看用戶“調(diào)戲”各種智能助手,問它們一些奇葩的問題,讓它們替自己接電話,每次都能讓人忍俊不禁。同時,看著大家吐槽智能助手依然“人工智障”,也難免有一絲遺憾。 數(shù)字技術(shù)不斷進步,智能助手及其產(chǎn)業(yè)是否還有新的機會,能否迎來向前進一步的發(fā)展契機?在今年的OPPO開發(fā)者大會上,我們看到小布助手呈現(xiàn)出的更多可能性。 基于“端云一體的數(shù)智大腦”Andeverse的技術(shù)能力,小布助手在元空間發(fā)布會上,打造出了一個虛實共生的數(shù)字平行世界,重磅發(fā)布4.0年度版本,集成小布空間等多個創(chuàng)新產(chǎn)品功能,讓用戶得以提前領(lǐng)略虛實融合的數(shù)字體驗。 (OPPO數(shù)智工程事業(yè)部總裁劉海鋒的數(shù)智人亮相小布元空間發(fā)布會) 從中,我們能讀到OPPO在人工智能、虛擬數(shù)智人等領(lǐng)域的技術(shù)突破,同時,也可以把握移動生態(tài)和移動交互在新背景下的脈動,當(dāng)用戶們開始熟悉并喜愛智能助手,依賴其完成更多生活體驗,小布如同一艘航船,正在成為更多人前往數(shù)智新世界的載具。 小布從來沒有停止過進化,也代表了智能助手的持續(xù)探索,與我們每個人有著千絲萬縷的聯(lián)系。讓我們從小布的進化路線圖出發(fā),一窺數(shù)智人的彼岸風(fēng)景。 渡海:不斷上升的海平面 首先需要明確一下,為什么智能助手的進化,是理解數(shù)智未來的一個重要參照點?;仡櫃C器智能的歷史,早在上個世紀(jì),機器人專家漢斯·莫拉維克就繪制了“人類能力地形圖”,中低地代表著“算數(shù)”和“死記硬背”,丘陵代表著“定理證明”和“下象棋”,高聳的山巒代表著“運動”“手眼協(xié)調(diào)”和“社交互動”。隨著人類對機器智能的不斷推進,海平面也在逐漸上升,低處的人類能力開始不再獨特,逐漸地,一些更高級的能力也可以由智能生命來完成。比如隨著預(yù)訓(xùn)練技術(shù)的發(fā)展成熟,機器對話在某些場景下甚至達到了類人的水平。 技術(shù)不斷拓展著人工智能的能力,智能助手的智慧程度近年來也取得了很大的發(fā)展,也意味著智能生命體將在我們的生活中扮演越來越重要的角色,熟悉并掌握數(shù)智生活已經(jīng)不再是一種選擇,而是一種必備的生活技能。因此漢斯·莫拉維克提出:我們應(yīng)該建造一艘方舟,盡快適應(yīng)航海生活! 智能助手作為連接物理世界和數(shù)字世界的交互入口,很適合成為那艘普羅大眾都可以搭乘的數(shù)智航船。 造舟:AI支撐下的小布身心靈進化 渡過時代之海,我們首先要看看小布助手4.0這艘航船究竟是怎樣建成的,有怎樣的能力。 小布4.0版本全新升級的5大能力,從主動式智能到情感化交互,再到數(shù)智多模態(tài)、智慧新體驗和多設(shè)備協(xié)同。從技術(shù)角度出發(fā),我們可以將其歸納為三個方面,構(gòu)成了小布助手4.0這一生命體的核心。 靈魂:漢斯·莫拉維克認(rèn)為,社交互動、情感交互等是人類最高級的能力之一,也是“人類能力地形圖”中尚未被淹沒的山巔。而小布作為OPPO AI應(yīng)用的集中體現(xiàn),4.0全新版本正在不斷抵達這些山峰,表現(xiàn)出更加智慧的一面。 智慧是一種抽象的、虛無縹緲的東西,機器要展現(xiàn)出類人般的智能,理論上要從三個角度完成進化:一是記憶,人類能夠把很多長期狀態(tài)的信息編入大腦的算法內(nèi),在未來某一天來調(diào)用它,而穩(wěn)定的長期記憶是機器智能的一大挑戰(zhàn),表現(xiàn)在智能助手上,就是難以在多輪對話中流暢而自然地交流;二是計算,人腦的并行計算能力非常強大,擅長解決復(fù)雜的任務(wù),如分析、決策。在算法和算力的快速發(fā)展下,AI也開始在決策智能上展現(xiàn)出類人的能力,讓智能助手得以從“命令式被動響應(yīng)”進化為“貼心式主動服務(wù)”;三是學(xué)習(xí),IBM的深藍計算機在1997年戰(zhàn)勝國際象棋冠軍加里·卡斯帕羅夫時,最大的優(yōu)勢是記憶能力和計算能力,到了2016年AlphaGo擊敗李世石,深度學(xué)習(xí)讓機器實力有了實質(zhì)性的飛躍。擁有學(xué)習(xí)能力之后,智能助手能夠自我進化與迭代,解決互動程式化、類人感低的問題。 具體到小布助手4.0版本中,我們已經(jīng)可以看到在記憶、計算、學(xué)習(xí)這三個層面,小布正在帶來真實可感的體驗變革。 記憶方面,適當(dāng)?shù)挠洃洓Q定了智能助手的交互體驗是否自然順暢。對于人類來說,根據(jù)之前的信息來作出即時反應(yīng),幾乎是一種本能,根本不需要特別調(diào)動記憶模塊,但這么簡單的事對于AI智能體來說卻是很困難的。在長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)出現(xiàn)之前,傳統(tǒng)神經(jīng)網(wǎng)絡(luò)沒有記憶功能,無法處理較長序列數(shù)據(jù),簡單來說就是記不住長距離數(shù)據(jù)的信息,表現(xiàn)在智能助手身上,用戶跟它說完“吃完晚飯跟我聊會兒天”,它還會問一句“吃了沒”,妥妥地煞風(fēng)景。要避免用戶說“前門樓子”AI說“胯骨軸子”這種前言不搭后語的情況,就需要智能助手很好地理解上下文,以此來生成更自然、情感化的表達,這就離不開強大的記憶能力。所以,研究人員特別為小布研發(fā)了記憶能力,讓AI在聊天過程中能夠理解一些更長距離的關(guān)鍵數(shù)據(jù),不至于學(xué)過就忘,從而生成有趣、有用的聊天內(nèi)容,用戶不必反復(fù)強調(diào)一些說過的內(nèi)容,人機交流也就更加輕松愉快。有了記憶,智能助手才有了可持續(xù)成長的人格化基礎(chǔ)。 計算方面,在端側(cè)算力的支持下,小布助手得以搭載更強大的算法應(yīng)用,基于自研的情感識別算法,讓小布助手具備智趣單輪、技能引導(dǎo)、話題多輪、情緒感知等基礎(chǔ)能力,再引入較為前沿的預(yù)訓(xùn)練技術(shù),通過1億~10億參數(shù)級別的大模型來提升語言理解的泛化能力,緩解因“意圖理解不到位”而造成的“智障”問題。同時,注重AI與知識計算的結(jié)合,構(gòu)建了精品知識圖譜,規(guī)模達到億級別的實體和百億級別的關(guān)系,讓小布具備足夠的知識儲備,能夠解答用戶各種各樣的疑問,在知識問答方面帶來了2%~4%的效果提升。一番技術(shù)打磨之下,小布助手對于口語化表達的理解、用戶意圖的分析、有溫度的情感化交互,就得到了有效的提升。 不止于此,小布助手還能夠準(zhǔn)確判斷用戶需求、結(jié)合上下文場景,進而主動提供服務(wù)。將數(shù)字服務(wù)的各個“斷點”串聯(lián)起來,讓服務(wù)呈現(xiàn)連貫性,用戶感受到的是符合行為慣性的絲滑與順暢,比如感知到用戶的出行需求后,小布會在用戶出行前就提供行李準(zhǔn)備、酒店預(yù)訂、交通情況、防疫政策等基礎(chǔ)提醒,提前為旅程做好充分的準(zhǔn)備。 學(xué)習(xí)方面,小布更智慧的一面還體現(xiàn)在持續(xù)學(xué)習(xí)和發(fā)展進化的能力上。對內(nèi),小布會根據(jù)用戶的行為反饋不斷學(xué)習(xí)進化,變得越來越“懂你”:如果發(fā)現(xiàn)用戶的需求沒有被滿足,會反復(fù)修改自己的話術(shù)進行重試;收到用戶的表揚,也會根據(jù)口碑滿意度體系來進一步優(yōu)化,持續(xù)提升自己。對外,小布會持續(xù)學(xué)習(xí)多場景、跨終端帶來的數(shù)據(jù)資源,不斷擴展自身的能力邊界和服務(wù)場景。比如通過場景理解,支持一句話多指令,讓查天氣、定鬧鐘、打電話等常規(guī)服務(wù)更加便捷高效,只需對小布說一句“打開健康碼”指令,能省去手動操作的一系列繁瑣流程。另外,小布可以支持手機、手表、電視、Pad等OPPO自有設(shè)備控制,以及小布生態(tài)的第三方品牌,跨端、跨設(shè)備執(zhí)行指令,打破了數(shù)據(jù)壁壘,既讓用戶享受到全場景服務(wù)無縫切換的絲滑;又能夠通過多終端數(shù)據(jù)協(xié)同反哺算法,為小布助手的自主學(xué)習(xí)提供多維度的數(shù)據(jù)養(yǎng)分,進一步提升小布的智慧水平和服務(wù)能力。 沿著記憶、計算、學(xué)習(xí)的路線圖,小布正一步步向“人類能力地形圖”的山巔攀爬。 身體:很長一段時間以來,智能助手都如同科幻電影《HER》中的女主角一樣,只有語音而沒有形體,近年來隨著數(shù)智技術(shù)的進步,一些智能助手開始整合語音交互、自然語言理解、圖像識別等AI能力,外觀形象變得更加鮮活,比如微軟小冰、OPPO小布、騰訊云小微等……今年的小布也在技術(shù)支撐下進一步迭代。 一方面,小布4.0進行了互動層面的全新升級,支持用戶通過手機屏幕的多點觸控,與數(shù)智人實時互動,如可以戳戳小布的肚子、摸摸小布的頭和屁股,小布數(shù)智人都可以給出相應(yīng)的反饋。小布4.0版本推出的小布數(shù)智人3D聊天功能,則更進一步,通過3D場景、AI驅(qū)動的數(shù)智人和故事設(shè)定,支持多模態(tài)互動的同時,還能創(chuàng)造出真實自然的聊天場景,識別用戶情緒,讓用戶獲得以聊天互動為主、兼具游戲娛樂的沉浸式聊天新體驗。 另一方面,小布空間為數(shù)智人提供了交互的場域,更具沉浸感和互動趣味。盡管XR設(shè)備尚未普及應(yīng)用,但OPPO已經(jīng)基于小布助手APP打造了虛實融合的元空間概念產(chǎn)品,讓用戶可以在手機界面下體驗虛實融合的魅力。小布空間支持用戶在其中創(chuàng)建自身形象,3D視覺效果和真實角色設(shè)置讓數(shù)字生活更具沉浸感和真實感,運用“第二分身”與數(shù)智人和真人在廣場社交互動,解鎖更多創(chuàng)新玩法,比如一起去展廳觀看會議直播,足不出戶完成線上參會等,提前體驗“模擬人生”。 物理學(xué)家邁克斯·泰格馬克提出,1.0版的生命,其硬件和軟件都是靠進化獲得的,無法改變。而以人工智能為代表的生命3.0階段,生命不僅可以自行設(shè)計軟件(文化),還可以自行設(shè)計硬件(身體),從碳基走向硅基。顯然,小布數(shù)智人所表現(xiàn)出的“身體”形象的可設(shè)計、可塑造,正是智能生命向3.0階段發(fā)展的必然過程,也讓我們提前感受到了與硅基生命互動的樂趣。 OPPO“科技為人”的理念,推動了小布助手身心靈向更智慧的方向發(fā)展迭代,成為秀外慧中的智能生命。有了堅實的身心基礎(chǔ),也就有了進一步探索虛實融合未來的底氣。 啟航:數(shù)智世界的技術(shù)彼岸 夯實智能助手的能力只是第一步,此次創(chuàng)新的第二個價值點在于:數(shù)智人的世界探尋。 客觀而坦率地說,移動互聯(lián)網(wǎng)發(fā)展了十多年,用戶對于人機交互的新鮮感也極大下降,大家渴望新體驗,而新體驗必將建立起移動終端市場的新秩序。而當(dāng)下,技術(shù)指向已經(jīng)十分明顯,那就是一個被反復(fù)提及的名詞——虛實融合。 此次OPPO開發(fā)者大會,可以很清晰地看到OPPO對技術(shù)路徑和產(chǎn)業(yè)方向的判斷,小布元空間發(fā)布會打造一個現(xiàn)實世界與虛擬世界相互交織、自然融合的交流共享空間,小布4.0集感知和交互為一體的視覺效果。 沿著小布助手和數(shù)智人的航線,究竟會駛向一個怎樣的技術(shù)彼岸?從OPPO的舉措,我們可以看到三個正在被釋放出的紅利。 1.技術(shù)紅利。數(shù)智人的應(yīng)用場景不斷拓展,但技術(shù)門檻依然高企,一個具備高互動性的數(shù)智人,需要領(lǐng)先的AI算法來對唇形、表情、動作等進行生成和驅(qū)動,比如NLP算法生成的語句要跟口型精密匹配,才能讓用戶有跟真人對話的既視感。要讓交互不枯燥,有新鮮感,不能來來回回就是幾個固定動作,就需要GAN生成算法等參與構(gòu)建并驅(qū)動數(shù)智人的動作。數(shù)智人要進入銀行、醫(yī)院、學(xué)校、高鐵站等各種場景提供服務(wù),不可能所有企業(yè)都要靠自己來研發(fā)基礎(chǔ)能力,通過小布數(shù)智人平臺和OPPO開放生態(tài)合作,避免在底層技術(shù)上反復(fù)造輪子,能夠降低技術(shù)門檻,加速數(shù)智人的產(chǎn)業(yè)化進程。 2.產(chǎn)業(yè)紅利。隨著多模態(tài)人機交互被廣泛接受,對數(shù)智人的產(chǎn)業(yè)需求也越來越多,但個性化外形和技能呈現(xiàn),需要美術(shù)設(shè)計、3D建模、骨骼綁定、貼圖捏臉等一系列操作,高企的制作門檻阻礙了數(shù)智人的規(guī)?;涞?。目前,小布也在數(shù)智人平臺沉淀了相應(yīng)的能力,提供個性化、高表現(xiàn)力、多場景的數(shù)智人服務(wù),減少落地應(yīng)用門檻,助力數(shù)智人深入到B端市場的更多場景。 3.生態(tài)紅利。豐富繁榮的數(shù)智人應(yīng)用與服務(wù),離不開個人開發(fā)者和企業(yè)開發(fā)者的創(chuàng)新智慧,讓開發(fā)者的創(chuàng)意和精力快速轉(zhuǎn)化為商業(yè)回報,OPPO在AIoT領(lǐng)域的全面布局和生態(tài)建設(shè)提供了豐沃的成果轉(zhuǎn)化土壤,前面提到小布助手支持手機、手表、電視、Pad等OPPO自有設(shè)備控制,也支持第三方品牌,覆蓋全品類硬件,這意味著相關(guān)應(yīng)用和服務(wù)能夠在多端部署、覆蓋OPPO生態(tài)內(nèi)的用戶,開發(fā)者借助OPPO收獲商業(yè)價值,又進一步吸引更多人共建虛實融合的數(shù)智世界,OPPO創(chuàng)新生態(tài)也就進入了良性循環(huán)。 不難看出,隨著小布助手的潛力不斷釋放,未來不僅僅會在OPPO萬物互融的生態(tài)體系中,扮演交互入口的重要角色,還將在整個移動生態(tài)內(nèi)擴散智能生命體的價值,成為更多企業(yè)和用戶與數(shù)字世界的交接點。萬物互融、虛實融合的大趨勢下,小布的存在價值正前所未有地顯現(xiàn)出來。 未來生命研究所的邁克斯·泰格馬克認(rèn)為:有人工智能相伴的生命未來是我們這個時代最重要的對話。小布助手正帶著我們參與到與AI生命溫暖而有趣的對話中,有理由相信,生于這個人工智能極大發(fā)展時代的人們,都應(yīng)該與智能助手共同成就更好的彼此。 一段精彩的旅程正等待著我們揚帆出海,不妨從一句“小布小布”開始吧。 |
|