誰將領跑大模型金融產業(yè)應用? 文 | 周公子 自2022年底以來,ChatGPT引發(fā)了人工智能新一輪創(chuàng)新熱潮,各大企業(yè)更是爭先拿出各自的大模型產品,尤其在中國市場的競爭,已經(jīng)進入白熱化階段。由中國科學技術信息研究所、科技部新一代人工智能發(fā)展研究中心聯(lián)合相關研究機構編寫的《中國人工智能大模型地圖研究報告》更是顯示,中國已發(fā)布的AI大模型已有79個。 但近日,這場沒有硝煙的戰(zhàn)爭,風向仿佛發(fā)生了一些微妙的變化。首先是ChatGPT的月度流量首次出現(xiàn)下降——2023年6月份,ChatGPT網(wǎng)站在全球的桌面和移動端流量比5月減少9.7%,獨立訪客減少5.7%。 擺在各行各業(yè)面前的一個問題是,除了聊天對話之外,還能解決什么問題、帶來什么樣的商業(yè)效益?畢竟,每一次對話背后都是大量的運營成本、計算資源的消耗。沒有哪家企業(yè)能夠長久扛下這種成本損耗。 正如中國市場上,消費互聯(lián)網(wǎng)向產業(yè)互聯(lián)網(wǎng)的發(fā)展一樣,C端免費的個人應用終將走向B端的收費服務,也就是產業(yè)應用,才能在人口紅利消失、各行各業(yè)降本增效的當下,真正創(chuàng)造價值。 賽事行至中場,這一場AI大模型之戰(zhàn)的賽點已然清晰:技術之外,大模型做好垂直產業(yè)應用才是王道。 基于這樣的洞見和對技術演進的判斷,馬上消費CTO蔣寧表示,近期馬上消費將正式發(fā)布自主大模型,聚焦“自主動態(tài)強化學習能力的大模型(AIGC+RLHF)、多種模型組合式的AI系統(tǒng)、多模態(tài)音視頻實時人機結合”三項核心關鍵能力,致力解決金融行業(yè)大模型在落地過程中的安全可控和隱私保護、基礎設施能力建設等方面的關鍵問題。 Part 1賽點:搶跑還是深挖?近日,由知名數(shù)據(jù)公司IDC發(fā)布的首份AI大模型評估報告出爐,名為《AI大模型技術能力評估報告》,對百度、阿里、智譜等14家國內主流企業(yè)的大模型平臺進行評比。 值得注意的一點,IDC這份《AI大模型技術能力評估報告》和其他不同的是,評估維度除了常見的“產品”、“服務”之外,還將“行業(yè)覆蓋”這一點作為關鍵的評估維度。 但周觀認為,該報告雖然詳實而權威,但作為一個面向通用平臺的能力評估,對于各個垂直產業(yè)選用AI大模型的參考價值并不大,至少對于金融、金融科技行業(yè)來說是如此。 其中的關鍵點在于,“行業(yè)覆蓋”僅僅只是解決了有沒有的問題,而不能解決“好不好用”的問題。 當然,該報告也正視了這一點,其指出,大模型的最終目的還是要落地于產業(yè)實踐。再看阿里、百度等企業(yè)在行業(yè)上的評分優(yōu)勢,仍只是在于其過往積累的產業(yè)領域,例如阿里評分較高的在于電商、百度在于能源。 縱觀全行業(yè)來看,金融由于其行業(yè)的特殊性和獨特性,尤其對于風險和安全的可控性,目前仍未有哪家企業(yè)能夠有底氣拿出相應的殺手級應用。 至今仍被口口相傳的是,年初彭博推出的金融行業(yè)大語言模型BloombergGPT,涉及500億參數(shù),這背后依賴于彭博社廣泛的金融領域數(shù)據(jù)優(yōu)勢構建了3630億個標簽的特有數(shù)據(jù)集(363 billion token dataset)。 蔣寧也認為,金融行業(yè)天然有著數(shù)據(jù)密集型、技術密集型的屬性,一直在探索數(shù)據(jù)資產化,挖掘數(shù)據(jù)價值,同時又面臨著如銀行線下網(wǎng)點的價值傳遞效率問題、用戶體驗問題,需要機構持續(xù)創(chuàng)新。 也就是說,對于金融行業(yè)來說,大模型的關鍵不在于跑得快,而在于挖得深。無論跑得多快,終究還是得回歸行業(yè)本質,解決行業(yè)關鍵問題。 Part 2難點:金融的特殊性與獨特性蔣寧分析認為,除了數(shù)據(jù)、技術問題之外,目前金融行業(yè)大模型應用主要面臨四個關鍵挑戰(zhàn)。 第一,關鍵任務和動態(tài)適應性。 關鍵任務往往關系到生命或重大資產,比如自動駕駛、銀行存款,人工智能要做到100%的準確,并不容易。生成式人工智能大模型與工業(yè)界的判別式模型相結合的化學反應,目前尚無明顯效果。同時,與AlphaGo的封閉系統(tǒng)不同,大模型要想做到越來越聰明,就要想辦法在開放的體系里讓群體力量貢獻給模型,讓盡量多的用戶參與反饋,形成生態(tài),對于金融行業(yè)來說,要想做到這一點還需要跨越巨大的行業(yè)鴻溝。 第二,個性化要求和隱私保護。 摒棄千篇一律的教條式服務,做到千人千面,大模型在為用戶提供個性化體驗的同時,又能確保用戶隱私,這也是一個需要解決的問題。 第三,群體智能與安全可控。 一方面,也就是前面提到的有效數(shù)據(jù)集問題,中文網(wǎng)絡世界的可用數(shù)據(jù)和有效數(shù)據(jù),相比之下非常有限;另一方面,行業(yè)領域的數(shù)據(jù)往往是封閉的,存在巨大的“數(shù)據(jù)孤島”,難以打破共享。蔣寧認為,如何設計一個跨行業(yè)、組織的數(shù)據(jù)共享、權益共享且安全可控的機制,同樣面臨巨大挑戰(zhàn)。 第四,基礎設施能力。 以ChatGPT為例,按照國盛證券的報告《ChatGPT需要多少算力》估算結果來看,GPT-3 訓練一次的成本約為 140 萬美元;再以 ChatGPT 在 1 月的獨立訪客平均數(shù) 1300 萬來計算,每天光計算所耗費的電費就在 5 萬美元左右,這不是所有企業(yè)都能夠承受得起的硬性成本支出。 不僅如此,GPU、網(wǎng)絡、機房等基礎環(huán)境要針對大模型訓練、推理等方面的需求做出相應的改造,才能發(fā)揮最大的效能。例如最近國內就有云廠商相繼推出向量數(shù)據(jù)庫、高性能計算集群等產品,適應企業(yè)大模型訓練、推理的計算需求。 總結來看,垂直產業(yè)大模型的落地和應用,存在高成本、缺數(shù)據(jù)、缺算力、難以實現(xiàn)安全可控等諸多關鍵問題。和金融類似的,還有醫(yī)療、健康等行業(yè),關乎錢袋子、資產安全,更關乎生命健康,也因此,這類垂直行業(yè)的容錯率往往更低、對于技術落地的精度和安全性要求也更高。 Part 3破局:應用為王,產業(yè)至上針對這些行業(yè)痛點和難點,蔣寧認為,馬上消費應該有自己的打法。 蔣寧指出,對于垂直產業(yè)來說,私有專屬模型是較好選擇,要聚焦“經(jīng)濟”、“安全”和“可控”的大模型一體化解決方案,強化大模型私域數(shù)據(jù)的領域微調、精調訓練能力,并和外部企業(yè)形成生態(tài)互助,解決數(shù)據(jù)歸檔、脫敏、分層、評判價值等問題。 而作為金融科技的探索者和踐行者,馬上消費在金融大模型的落地應用上通過持續(xù)的技術積累,已經(jīng)具備這樣的優(yōu)勢和特點:安全可控、個性化決策和體驗、持續(xù)學習。蔣寧透露,目前馬上消費已經(jīng)研發(fā)了實時人機決策模型、多模態(tài)大模型、數(shù)據(jù)智能模型等,并在內部正式上線測試。 這背后,馬上消費希望幫助解決金融行業(yè)的三個通用問題: 首先,個性化的服務和極致用戶體驗。金融業(yè)務有高價值、低頻的特點,很難提供個性化的體驗。傳統(tǒng)的做法是分層打標簽,提供不同的產品,但標簽是動態(tài)變化的,因此如何自動化地決策為客戶提供自動化的體驗,就需要產品與眾不同。 其次,高效的價值傳遞效率。雖然金融是技術密集型、數(shù)據(jù)密集型行業(yè),但目前線下網(wǎng)點還是為數(shù)不少,因為人工智能尚不能做到不出錯,很多工作還要高度依賴人工操作。 最后,合規(guī)安全的決策智能,這與魯棒性相關。所謂魯棒性,是指在特性參數(shù)和系統(tǒng)內,維持某些性能的特性,例如金融行業(yè)尤為看重的合規(guī)、安全問題。 基于這三方面考慮,以及上萬臺的服務器,近千張的GPU卡,40PB的文字、聲音、圖片、視頻等形式的數(shù)據(jù),馬上消費金融力求實現(xiàn)算力、算法、數(shù)據(jù)以及場景的閉環(huán),并由此打造“三縱三橫”的AI戰(zhàn)略。 馬上消費金融的“三縱三橫”戰(zhàn)略 所謂三縱,是指實時人機決策、多模態(tài)大模型、數(shù)據(jù)智能。例如,要解決工業(yè)界的魯棒性問題,讓人接手人工智能解決不了的1%的問題。而馬上消費過去多年的實踐,已經(jīng)積累了海量的語言、文字、圖片等素材,并圍繞其進行了大量的訓練,形成了一套完整的多模態(tài)的資產。解決數(shù)據(jù)智能的問題,背后離不開馬上金融早已經(jīng)構建起來的2000+個模型,可以為2億多用戶提供自動化的營銷、風控等服務。 三橫即是指持續(xù)學習、模型控制、組合式AI:確保讓模型越用越聰明,同時更穩(wěn)定、更安全可控。而不局限于單一模型,通過多種模型的組合應用,可以更高效解決問題。 據(jù)了解,目前馬上消費的人工智能技術主要應用在三大場景:一是金融智能對話,實現(xiàn)實時人機協(xié)作、持續(xù)學習、可信安全合規(guī);二是金融數(shù)字人,通過大模型+組合式AI多模態(tài)能力,實現(xiàn)有溫度的數(shù)字人;三是金融服務的AI核心引擎,通過大模型的大腦與心理學的有機結合,實現(xiàn)有情感的人機互動體驗。 蔣寧將這些實踐和成果總結為一句話:“垂直領域的判別式模型與生成式模型等多種模型組合,構筑一個開放的持續(xù)學習、具備魯棒性、合規(guī)安全的體系,才是大模型的真正落地,而不是一個模型靠幾千億參數(shù)去落地,我們將為之而努力?!?/p> 以應用為王。不久的將來,或許大模型垂直產業(yè)落地應用難的問題,終將破局。 |
|