【原】大模型手機(jī)，扎堆來了！

雷科技 2023-10-19 發(fā)布于廣東

展開全文

今年初，微軟創(chuàng)始人比爾·蓋茨在接受德國商報采訪時感概：「ChatGPT 像互聯(lián)網(wǎng)發(fā)明一樣重要，將會改變世界?！?/span>

過去將近一年的時間里，大模型幾乎可以說是最炙手可熱的一種技術(shù)、趨勢和概念，一方面從大眾到全球各國政府的關(guān)注，另一方面是所有科技互聯(lián)網(wǎng)公司都在加速布局大模型，就算沒有構(gòu)建大模型（在開源大模型的基礎(chǔ)上）的技術(shù)實(shí)力，也在緊迫地尋找業(yè)務(wù)與大模型的結(jié)合點(diǎn)。

同樣地，沒有一家手機(jī)廠商打算錯過大模型。

不過嚴(yán)格來說，目前手機(jī)行業(yè)還處于 AI 大模型的混戰(zhàn)前夜。盡管所有人的共識都是把大模型帶到手機(jī)上，但在實(shí)現(xiàn)路徑上還是各有想法，同時一些廠商已經(jīng)只差臨門一腳，就能將大模型正式帶到手機(jī)上，另一些廠商還差一些準(zhǔn)備，還有一些處于更早的準(zhǔn)備階段。

大亂斗倒計(jì)時

圖/ OPPO

就在這幾天，OPPO 宣布將在 11 月 16 日舉行 ColorOS 14 發(fā)布會，同時還宣布基于 AndesGPT 大模型打造的新版 AI 助手——新小布 1.0 開啟了第一輪公測。

同一天，OPPO 宣布將與聯(lián)發(fā)科合作，共建輕量化大模型終端部署方案。

按照 OPPO 的說法，AndesGPT 大模型作為 OPPO 自主訓(xùn)練的生成式用戶專屬大模型，以「端云協(xié)同」為基礎(chǔ)架構(gòu)設(shè)計(jì)思路，推出從 10 億至千億多種不同參數(shù)規(guī)模的模型規(guī)格，實(shí)現(xiàn)本地與云端協(xié)同運(yùn)作的效果。不過更具體的，還要等到發(fā)布會上或者之后揭曉了。

但其實(shí)更早之前，華為已經(jīng)在國內(nèi)率先掀起了手機(jī)大模型的戰(zhàn)爭「號角」。

圖/雷科技

8 月初，我參加了華為舉辦的開發(fā)者大會，華為在會上就宣布 HarmonyOS 4 的全新小藝 AI 助手將率先接入大模型。不過還要到 8 月下旬，華為才是真正開啟全新小藝的邀請測試。

全新小藝是在華為云自研盤古大模型的基礎(chǔ)上，融入了大量的場景數(shù)據(jù)，并對模型進(jìn)行精調(diào)，核心是一個對話模型，這方面從將小藝作為大模型的接入點(diǎn)也可以看到。

另一方面，由于主要依賴云端算力，理論上所有支持升級到 HarmonyOS 4 的機(jī)型后續(xù)體驗(yàn)到全新小藝。

小米的小愛大模型其實(shí)也是一樣。

雷軍年度演講，圖/小米

8 月 14 日，小米比華為還早就開啟了小愛大模型的邀請測試活動，覆蓋從 Redmi Note9 系列到小米 MIX Fold 3 等大量機(jī)型，還包括部分智能音箱，比如小米 Sound。

雖然在 8 月的那場年度演講上，雷總提到小米自研端側(cè)大模型 MiLM，走了輕量化的路線，宣稱將 13 億參數(shù)版本塞進(jìn)手機(jī)，可以實(shí)現(xiàn)部分場景媲美云端大模型的效果，做到百億內(nèi)參數(shù)大模型的第一。

但考慮到從高端機(jī)到低端機(jī)的覆蓋，顯然不可能主要依賴本地計(jì)算。

按照小米 AI 實(shí)驗(yàn)室大模型團(tuán)隊(duì)負(fù)責(zé)人欒劍的說法，小米會先選擇在內(nèi)存最大、算力最強(qiáng)的手機(jī)上做實(shí)驗(yàn)（大模型 MiLM）。

最大的可能是小米做了兩手準(zhǔn)備，也許是受限于性能和功耗，目前開啟邀測的小愛大模型走了云端路線，端側(cè)路線的 MiLM 只能在高端型號乃至未來機(jī)型上搭載運(yùn)行。

云端大模型和終端大模型都想要，谷歌大概會是小米的目標(biāo)。

PaLM 2 壁虎，圖/谷歌

今年 5 月的谷歌 I/O 開發(fā)者大會上，谷歌就宣布了新一代大模型 PaLM 2 將具備四個參數(shù)規(guī)格的版本，最大的「獨(dú)角獸」擁有 5400 億參數(shù)，最小的「壁虎」則專為智能手機(jī)而適配，在離線狀態(tài)下也能實(shí)現(xiàn)每秒 20 個 token 的處理。

就在本月初，谷歌正式發(fā)布 Pixel 8 系列手機(jī)，其中明確 Pixel 8 Pro 在自研芯片 Tensor G3 的加持下，真正實(shí)現(xiàn)了在手機(jī)上本地運(yùn)行大模型。

基于本地運(yùn)行的大模型，谷歌還設(shè)法改進(jìn)了用于照片后期處理的魔術(shù)橡皮擦功能，以及更智能的銳化和細(xì)節(jié)增強(qiáng)，其他還包括錄音、谷歌鍵盤等。

不過與華為、小米類似，即將推出的 Google Assistant with Bard（Bard 是類 ChatGPT 的生成式對話 AI）也是依賴于谷歌云上的計(jì)算。事實(shí)上，在主流手機(jī)廠商中也只有谷歌和華為擁有自研的通用大模型，還有足夠規(guī)模的自有云計(jì)算業(yè)務(wù)提供海量算力的支撐。

相比之下，vivo 的進(jìn)展其實(shí)也不慢。

vivo 胡柏山，圖/ vivo

9 月舉辦的博鰲亞洲論壇上，vivo 執(zhí)行副總裁、首席運(yùn)營官胡柏山宣布了即將發(fā)布自研大模型，并且「帶有大模型的手機(jī)很快就會伴隨 vivo 新機(jī)來到大家面前」。

按照目前流出的信息，vivo 計(jì)劃在很快就要發(fā)布的 OriginOS 4 發(fā)布會上一齊發(fā)布自研大模型，更具體的還等待屆時揭曉。

不過根據(jù)英偉達(dá)透露，至少在 6 月初 vivo 面向自然語言理解任務(wù)的文本預(yù)訓(xùn)練模型 3MP-Text，在中文語言理解測評基準(zhǔn) CLUE 上，1 億參數(shù)模型效果排名同規(guī)模第一，7 億參數(shù)模型排名總榜第十（不包括人類）。

榮耀確實(shí)慢了一拍。

榮耀趙明，圖/榮耀

事實(shí)上，榮耀 CEO 趙明在很早就強(qiáng)調(diào)了大模型端側(cè)部署的趨勢和重要性，6 月底的上海 MWC 上還指出，手機(jī)端側(cè)的個人大模型是未來探索方向，這也是榮耀的計(jì)劃。

但計(jì)劃是一方面，實(shí)際進(jìn)展又是一方面，截止目前，榮耀仍未透露接入大模型的時間節(jié)點(diǎn)，沒有看到構(gòu)建大模型相關(guān)的明確信息。不過我相信，等到下一代 MagicOS 發(fā)布的時候，榮耀至少也會公布接入大模型的時間節(jié)點(diǎn)。

三星和蘋果，好像沒有那么急。

iOS 17 鍵盤輸入引入 Transformer 模型，圖/蘋果

三星其實(shí)在較早就宣布自研通用大模型，由三星研究院主導(dǎo)，并且根據(jù)媒體報道，三星一度將公司所有 GPU 算力資源都投入到大模型訓(xùn)練之中，計(jì)劃在 8 月完成第一版大模型的開發(fā)。不過考慮到是研究院主導(dǎo)，距離在三星手機(jī)上實(shí)際應(yīng)用，可能還有一段時間要走。

蘋果也顯得非常慎重，或者說保守。蘋果內(nèi)部已經(jīng)建立自研的大模型框架「Ajax」，也創(chuàng)建了類 ChatGPT 的生成式對話 AI。按照彭博社報道，大模型一度幾乎成為了蘋果公司每次開會都要提及的話題，幾個技術(shù)團(tuán)隊(duì)甚至因?yàn)榇竽Ｐ晚?xiàng)目合并在一起。

但在 iOS 17 上，蘋果只是在鍵盤輸入上引入 Transformer 模型運(yùn)行，技術(shù)團(tuán)隊(duì)想要先解決與大模型技術(shù)有關(guān)的潛在隱私問題。

潮水變了，

但離上岸還有一段距離

今年 2 月，高通在一部沒有聯(lián)網(wǎng)的 Android 手機(jī)上使用了 Stable Diffusion 來生成 AI 圖像，整個生成時間不超過 15 秒，過程全部在手機(jī)上進(jìn)行。高通、聯(lián)發(fā)科等移動芯片廠商很早就開始探索在手機(jī)本地運(yùn)行大模型的未來。

到今天，手機(jī)大模型已經(jīng)是一個無可爭議的趨勢。

但事實(shí)上手機(jī)大模型還面臨很多的疑問和挑戰(zhàn)，除了谷歌，所有已經(jīng)或者即將落地大模型的手機(jī)廠商，幾乎都是在手機(jī)助手的基礎(chǔ)上進(jìn)行接入，不僅實(shí)際應(yīng)用場景有待驗(yàn)證，目前的實(shí)現(xiàn)效果也存疑。

一個 OPPO 新小布的例子，圖/微博@如何釋好

另一方面，雖然在具體架構(gòu)和實(shí)現(xiàn)路徑上存在不同看法，但業(yè)界的普遍共識是手機(jī)大模型將走向云端+終端的混合架構(gòu)，在終端本地運(yùn)行勢在必行，手機(jī)廠商也都在放棄「通用」，縮減「大」模型的參數(shù)規(guī)模，壓到百億級、十億級和億級（大模型能力也會不同程度的影響）。

這不僅是因?yàn)樯钊胧謾C(jī)使用場景后的隱私問題，算力的稀缺性和高成本也決定了，大模型必須利用起終端本身的算力，覆蓋大模型的一定算力成本，而不是由應(yīng)用和平臺背后的公司一力承擔(dān)。

坦率地說，手機(jī)大模型在目前這個階段，距離真正被大眾用戶應(yīng)用可能還有很遠(yuǎn)，最直接的問題就是，在保持大模型關(guān)鍵的「智能涌現(xiàn)」能力的同時，手機(jī)還需要面對處理器算力、功耗和面積的改進(jìn)。

End