今年初,微軟創(chuàng)始人比爾·蓋茨在接受德國商報采訪時感概:「ChatGPT 像互聯(lián)網(wǎng)發(fā)明一樣重要,將會改變世界?!?/span>過去將近一年的時間里,大模型幾乎可以說是最炙手可熱的一種技術(shù)、趨勢和概念,一方面從大眾到全球各國政府的關(guān)注,另一方面是所有科技互聯(lián)網(wǎng)公司都在加速布局大模型,就算沒有構(gòu)建大模型(在開源大模型的基礎(chǔ)上)的技術(shù)實(shí)力,也在緊迫地尋找業(yè)務(wù)與大模型的結(jié)合點(diǎn)。不過嚴(yán)格來說,目前手機(jī)行業(yè)還處于 AI 大模型的混戰(zhàn)前夜。盡管所有人的共識都是把大模型帶到手機(jī)上,但在實(shí)現(xiàn)路徑上還是各有想法,同時一些廠商已經(jīng)只差臨門一腳,就能將大模型正式帶到手機(jī)上,另一些廠商還差一些準(zhǔn)備,還有一些處于更早的準(zhǔn)備階段。大亂斗倒計(jì)時就在這幾天,OPPO 宣布將在 11 月 16 日舉行 ColorOS 14 發(fā)布會,同時還宣布基于 AndesGPT 大模型打造的新版 AI 助手——新小布 1.0 開啟了第一輪公測。同一天,OPPO 宣布將與聯(lián)發(fā)科合作,共建輕量化大模型終端部署方案。按照 OPPO 的說法,AndesGPT 大模型作為 OPPO 自主訓(xùn)練的生成式用戶專屬大模型,以「端云協(xié)同」為基礎(chǔ)架構(gòu)設(shè)計(jì)思路,推出從 10 億至千億多種不同參數(shù)規(guī)模的模型規(guī)格,實(shí)現(xiàn)本地與云端協(xié)同運(yùn)作的效果。不過更具體的,還要等到發(fā)布會上或者之后揭曉了。但其實(shí)更早之前,華為已經(jīng)在國內(nèi)率先掀起了手機(jī)大模型的戰(zhàn)爭「號角」。 8 月初,我參加了華為舉辦的開發(fā)者大會,華為在會上就宣布 HarmonyOS 4 的全新小藝 AI 助手將率先接入大模型。不過還要到 8 月下旬,華為才是真正開啟全新小藝的邀請測試。全新小藝是在華為云自研盤古大模型的基礎(chǔ)上,融入了大量的場景數(shù)據(jù),并對模型進(jìn)行精調(diào),核心是一個對話模型,這方面從將小藝作為大模型的接入點(diǎn)也可以看到。另一方面,由于主要依賴云端算力,理論上所有支持升級到 HarmonyOS 4 的機(jī)型后續(xù)體驗(yàn)到全新小藝。 8 月 14 日,小米比華為還早就開啟了小愛大模型的邀請測試活動,覆蓋從 Redmi Note9 系列到小米 MIX Fold 3 等大量機(jī)型,還包括部分智能音箱,比如小米 Sound。雖然在 8 月的那場年度演講上,雷總提到小米自研端側(cè)大模型 MiLM,走了輕量化的路線,宣稱將 13 億參數(shù)版本塞進(jìn)手機(jī),可以實(shí)現(xiàn)部分場景媲美云端大模型的效果,做到百億內(nèi)參數(shù)大模型的第一。但考慮到從高端機(jī)到低端機(jī)的覆蓋,顯然不可能主要依賴本地計(jì)算。按照小米 AI 實(shí)驗(yàn)室大模型團(tuán)隊(duì)負(fù)責(zé)人欒劍的說法,小米會先選擇在內(nèi)存最大、算力最強(qiáng)的手機(jī)上做實(shí)驗(yàn)(大模型 MiLM)。最大的可能是小米做了兩手準(zhǔn)備,也許是受限于性能和功耗,目前開啟邀測的小愛大模型走了云端路線,端側(cè)路線的 MiLM 只能在高端型號乃至未來機(jī)型上搭載運(yùn)行。云端大模型和終端大模型都想要,谷歌大概會是小米的目標(biāo)。 今年 5 月的谷歌 I/O 開發(fā)者大會上,谷歌就宣布了新一代大模型 PaLM 2 將具備四個參數(shù)規(guī)格的版本,最大的「獨(dú)角獸」擁有 5400 億參數(shù),最小的「壁虎」則專為智能手機(jī)而適配,在離線狀態(tài)下也能實(shí)現(xiàn)每秒 20 個 token 的處理。就在本月初,谷歌正式發(fā)布 Pixel 8 系列手機(jī),其中明確 Pixel 8 Pro 在自研芯片 Tensor G3 的加持下,真正實(shí)現(xiàn)了在手機(jī)上本地運(yùn)行大模型。基于本地運(yùn)行的大模型,谷歌還設(shè)法改進(jìn)了用于照片后期處理的魔術(shù)橡皮擦功能,以及更智能的銳化和細(xì)節(jié)增強(qiáng),其他還包括錄音、谷歌鍵盤等。不過與華為、小米類似,即將推出的 Google Assistant with Bard(Bard 是類 ChatGPT 的生成式對話 AI)也是依賴于谷歌云上的計(jì)算。事實(shí)上,在主流手機(jī)廠商中也只有谷歌和華為擁有自研的通用大模型,還有足夠規(guī)模的自有云計(jì)算業(yè)務(wù)提供海量算力的支撐。相比之下,vivo 的進(jìn)展其實(shí)也不慢。 9 月舉辦的博鰲亞洲論壇上,vivo 執(zhí)行副總裁、首席運(yùn)營官胡柏山宣布了即將發(fā)布自研大模型,并且「帶有大模型的手機(jī)很快就會伴隨 vivo 新機(jī)來到大家面前」。按照目前流出的信息,vivo 計(jì)劃在很快就要發(fā)布的 OriginOS 4 發(fā)布會上一齊發(fā)布自研大模型,更具體的還等待屆時揭曉。不過根據(jù)英偉達(dá)透露,至少在 6 月初 vivo 面向自然語言理解任務(wù)的文本預(yù)訓(xùn)練模型 3MP-Text,在中文語言理解測評基準(zhǔn) CLUE 上,1 億參數(shù)模型效果排名同規(guī)模第一,7 億參數(shù)模型排名總榜第十(不包括人類)。 事實(shí)上,榮耀 CEO 趙明在很早就強(qiáng)調(diào)了大模型端側(cè)部署的趨勢和重要性,6 月底的上海 MWC 上還指出,手機(jī)端側(cè)的個人大模型是未來探索方向,這也是榮耀的計(jì)劃。但計(jì)劃是一方面,實(shí)際進(jìn)展又是一方面,截止目前,榮耀仍未透露接入大模型的時間節(jié)點(diǎn),沒有看到構(gòu)建大模型相關(guān)的明確信息。不過我相信,等到下一代 MagicOS 發(fā)布的時候,榮耀至少也會公布接入大模型的時間節(jié)點(diǎn)。 iOS 17 鍵盤輸入引入 Transformer 模型,圖/蘋果三星其實(shí)在較早就宣布自研通用大模型,由三星研究院主導(dǎo),并且根據(jù)媒體報道,三星一度將公司所有 GPU 算力資源都投入到大模型訓(xùn)練之中,計(jì)劃在 8 月完成第一版大模型的開發(fā)。不過考慮到是研究院主導(dǎo),距離在三星手機(jī)上實(shí)際應(yīng)用,可能還有一段時間要走。蘋果也顯得非常慎重,或者說保守。蘋果內(nèi)部已經(jīng)建立自研的大模型框架「Ajax」,也創(chuàng)建了類 ChatGPT 的生成式對話 AI。按照彭博社報道,大模型一度幾乎成為了蘋果公司每次開會都要提及的話題,幾個技術(shù)團(tuán)隊(duì)甚至因?yàn)榇竽P晚?xiàng)目合并在一起。但在 iOS 17 上,蘋果只是在鍵盤輸入上引入 Transformer 模型運(yùn)行,技術(shù)團(tuán)隊(duì)想要先解決與大模型技術(shù)有關(guān)的潛在隱私問題。潮水變了,但離上岸還有一段距離今年 2 月,高通在一部沒有聯(lián)網(wǎng)的 Android 手機(jī)上使用了 Stable Diffusion 來生成 AI 圖像,整個生成時間不超過 15 秒,過程全部在手機(jī)上進(jìn)行。高通、聯(lián)發(fā)科等移動芯片廠商很早就開始探索在手機(jī)本地運(yùn)行大模型的未來。到今天,手機(jī)大模型已經(jīng)是一個無可爭議的趨勢。但事實(shí)上手機(jī)大模型還面臨很多的疑問和挑戰(zhàn),除了谷歌,所有已經(jīng)或者即將落地大模型的手機(jī)廠商,幾乎都是在手機(jī)助手的基礎(chǔ)上進(jìn)行接入,不僅實(shí)際應(yīng)用場景有待驗(yàn)證,目前的實(shí)現(xiàn)效果也存疑。另一方面,雖然在具體架構(gòu)和實(shí)現(xiàn)路徑上存在不同看法,但業(yè)界的普遍共識是手機(jī)大模型將走向云端+終端的混合架構(gòu),在終端本地運(yùn)行勢在必行,手機(jī)廠商也都在放棄「通用」,縮減「大」模型的參數(shù)規(guī)模,壓到百億級、十億級和億級(大模型能力也會不同程度的影響)。這不僅是因?yàn)樯钊胧謾C(jī)使用場景后的隱私問題,算力的稀缺性和高成本也決定了,大模型必須利用起終端本身的算力,覆蓋大模型的一定算力成本,而不是由應(yīng)用和平臺背后的公司一力承擔(dān)。坦率地說,手機(jī)大模型在目前這個階段,距離真正被大眾用戶應(yīng)用可能還有很遠(yuǎn),最直接的問題就是,在保持大模型關(guān)鍵的「智能涌現(xiàn)」能力的同時,手機(jī)還需要面對處理器算力、功耗和面積的改進(jìn)。
|