國內(nèi)的商業(yè)大佬和技術(shù)天才聞風(fēng)而動,都想將AI時代賜予的良機(jī)緊緊拽在手中。
2023年2月,原美團(tuán)副總裁,王興清華大學(xué)室友王慧文振臂一呼,招募同是清華人工智能博士,現(xiàn)硅基流動創(chuàng)始人的袁進(jìn)輝,以及“搜狗輸入法之父”馬占凱和智源研究院前副院長劉江紛,高舉進(jìn)軍AGI的旗號,成立光年之外,入局通用大模型。
3月,清華和CMU天才學(xué)霸楊植麟同他的清華本科同學(xué)兼好友周昕宇,以及同樣畢業(yè)于清華、卡內(nèi)基梅隆大學(xué)的吳育昕,創(chuàng)辦月之暗面,目標(biāo)直指AGI。
4月,原搜狗CEO,同樣是清華系4屆信奧冠軍得主王小川,官宣創(chuàng)辦AI大模型公司百川智能,原搜狗CMO洪濤,原搜狗搜索事業(yè)部負(fù)責(zé)人、清華大學(xué)天工智能計(jì)算研究院副院長茹立云跟隨其加入,公司起步資金就達(dá)5000萬。
5月,微軟中國研究院創(chuàng)始人,創(chuàng)新工場董事長李開復(fù)博士親自下場,以AI 2.0為目標(biāo),成立MinMax,揮師進(jìn)軍大模型。其陣容華麗,成員中技術(shù)副總裁及AI Alignment負(fù)責(zé)人是 Google Bard/Assistant 早期核心成員,首席架構(gòu)師曾在Google Brain與Jeff Dean、Samy Bengio等合作,為TensorFlow的核心創(chuàng)始成員之一。
除光年之外因王慧文因抑郁癥退出被美團(tuán)收購?fù)猓?strong>百川智能、月之暗面、零一智能、同2019年成立,源于清華KEG實(shí)驗(yàn)室的智譜AI,以及 2021年從”AI四小龍“商湯科技中離職的原副總裁閆俊杰創(chuàng)立的MinMax, 在行業(yè)中聲勢日隆,成為這個行業(yè)的獨(dú)角獸公司。
其中,智普AI目前已經(jīng)有中關(guān)村創(chuàng)新基金,美團(tuán),阿里,螞蟻,騰訊,小米,金山,順位,boss直聘,好未來,紅衫,高瓴投資,總?cè)谫Y額度超過25億人民幣,目前估值超過兩百億。月之暗面,MinMax的估值25億美元、零一智能、百川智能的最新估值都已超過10億美元。
各個公司目前的產(chǎn)品和戰(zhàn)略
最近著名投資人朱嘯虎的言論在整個AI界鬧得沸沸揚(yáng)揚(yáng),要求落地看到場景,看到短期利潤的他,對大模型根本無法落地的評論引起媒體界投資圈的一陣騷動,也引出了通用大模型行業(yè)的大討論。各個獨(dú)角獸公司持有什么樣的技術(shù)愿景,如何達(dá)到他們所期望的AGI終局,都有不同的看法。
月之暗面
“技術(shù)信仰派“楊植麟,曾于2011年至2015年在清華計(jì)算機(jī)系就讀,本科期間師從唐杰教授;隨后去往CMU讀博,師從蘋果AI研究負(fù)責(zé)人Ruslan Salakhutdinov 和谷歌首席科學(xué)家 William Cohen。在此期間先后以一作身份和LeCun等AI界泰斗合作,發(fā)表了影響廣泛的成果 Transformer-XL 和 XLNet,對自然語言處理帶來了極大的影響。在AI行業(yè)深耕接近20年的他,對Open AI所稱“Scaling Law“的忠實(shí)捍衛(wèi)者。
”Scaling Law作為第一性原理,是目前我們能看到的唯一可行的辦法。其不僅僅是在模型端的Scaling,我們也需要在用戶端做Scaling。真正的AGI一定會與商業(yè)相結(jié)合,科研端很難有希望。那些商業(yè)落地場景,此時為此付出的努力大多都是'雕花’操作,靠規(guī)?;_(dá)成AGI后,對這些場景都是降維打擊。”
楊植麟認(rèn)為他是行業(yè)里極少的有技術(shù)信仰的,他的戰(zhàn)術(shù)也很簡單:只做ToC的Kimi智能助手,最大限度的擴(kuò)充Long-Context,最快的速度Scaling。他就像是率領(lǐng)騎兵,就是要最快的速度,深入腹地,直搗黃龍。
“只做ToC,最后是個性化的AI,個性化是終極的落腳點(diǎn)。終究還是AGI。要做AGI必須要結(jié)合科學(xué)研究,工程和商業(yè),技術(shù)理想主義+商業(yè)化落地,AGI只有跟所有人互動,才有可能形成?!睏钫f。2024年3月18日,月之暗面宣布其對話式AI助手產(chǎn)品Kimi智能助手現(xiàn)已支持200萬字的無損上下文輸入。
百川智能
相比之下,百川智能王小川的戰(zhàn)術(shù)就顯示出老練的一面。王小川在搜狗時其工作與AI高度結(jié)合,離開搜狗后也在研究生命如何數(shù)字化的工作,“搜狗一直是一家AI公司,我一直在做AI相關(guān)的工作?!蓖跣〈▽ψ约旱募夹g(shù)有十分的自信,同時他認(rèn)為,雖然對大模型都是盲人摸象,他看到的會要全面一點(diǎn),“不僅要有技術(shù)信仰,還要同時尋找落地場景,通過應(yīng)用場景收集數(shù)據(jù),打通數(shù)據(jù)飛輪”。
王小川給百川智能確定了橫縱兩個維度的目標(biāo),橫向維度的目標(biāo)是“構(gòu)建中國最好的大模型底座”,縱向維度的目標(biāo)是在搜索、多模態(tài)、教育、醫(yī)療等領(lǐng)域增強(qiáng)。
“比較成熟的領(lǐng)域已經(jīng)有ToC產(chǎn)品覆蓋的時候,我們就做ToB。但是對于增量的、大家沒見過的產(chǎn)品,我們會做ToC。”
其產(chǎn)品百川智能530億參數(shù)通用大模型Baichuan-53B,定位閉源,主要面向B端用戶提供服務(wù),在寫作、文本創(chuàng)作能力方面已達(dá)到行業(yè)較好水平,用于教育、醫(yī)療等領(lǐng)域。目前已有阿里云、騰訊云、火山引擎、浪潮、順豐科技等超過150家合作伙伴使用Baichuan模型。同時,應(yīng)用端的游戲NPC等,也相繼推出(其效果被朱嘯虎一頓噴)。
2024年3月,王小川對于百川智能不做Sora的訓(xùn)話上熱搜,他說“AGI的通路一定是靠大語言模型的。文生視頻,一不靠近技術(shù)端,又不貼近應(yīng)用端”。
智譜AI
智譜AI的CEO張鵬就比較低調(diào)一點(diǎn)。他也是清華大學(xué)計(jì)算機(jī)系博士,在他看來,AIGC 未來發(fā)展會很像云計(jì)算的軌跡,成為基礎(chǔ)設(shè)施,而不是互聯(lián)網(wǎng)生態(tài)下的應(yīng)用。所以智譜AI的目標(biāo)就是提供MaaS(模型即服務(wù))。其思路與百川智能相似,也是提倡兩條腿走路,但是文生圖是應(yīng)用服務(wù)之一。
2024年1月16日,智譜 AI 發(fā)布了全新自研的第四代多模態(tài)基座大模型GLM-4系列,稱性能相比上一代全面提升接近60%、模型性能直接逼近GPT-4,“特別是中文能力可比肩GPT-4”。公司也在進(jìn)行商業(yè)化探索,打造AGI產(chǎn)品矩陣,包括已獲批上線的智譜清言、高效率代碼模型CodeGeeX等平臺。
至2023年下半年,張鵬稱公司簽單客戶約有幾百家,2023年一年整體有億級簽單額?!?strong>目前為止智譜AI已經(jīng)有2000多家合作伙伴,其中200多家企事業(yè)單位,范圍涵蓋了金融、能源、制造等不同行業(yè)。”
MinMax
MinMax的閆俊杰幾乎看不到太多公開的采訪。
先補(bǔ)充介紹一下MinMax的團(tuán)隊(duì),閆俊杰于2015年博士畢業(yè)于中科院自動化所,他此前在商湯科技負(fù)責(zé)搭建深度學(xué)習(xí)的工具鏈和底層算法,另一位創(chuàng)始人周彧聰則來自北京航空航天大學(xué)。他在學(xué)生時代分別拿過世界大學(xué)生超級計(jì)算機(jī)競賽ASC15總決賽和國際超級計(jì)算機(jī)大會ISC17的第一,也拿到了iQIYI-Large賽道的冠軍。
MiniMax的商業(yè)模式與OpenAI相似,包括to C與to B兩大方向。在to C方向,其首款A(yù)I虛擬陪伴聊天社交軟件Glow推出四個月已經(jīng)積累五百萬用戶;在to B方向,MiniMax對外開放API。Glow對于MiniMax 的意義重大,其跑通了大模型和現(xiàn)實(shí)世界的交互。
零一智能
出道最晚的零一智能,雖然有極其強(qiáng)悍的研發(fā)團(tuán)隊(duì),但是雖然在短短幾個月內(nèi)就發(fā)布了自己的首款大模型,但是卻陷入了抄襲風(fēng)波。其故意為刷榜訓(xùn)練,同時對LLAMA模型照搬,但為遮掩只該其變量名的做法,讓其口碑劇減。
李開復(fù)博士的理念就是AI-first,驅(qū)動力是技術(shù)愿景,背靠卓越的中國工程底蘊(yùn),突破點(diǎn)是基座大模型,覆蓋范圍包含技術(shù)、平臺到應(yīng)用多個層面。技術(shù)路線是通用大模型,會推出結(jié)合圖片、視頻、3D的多模態(tài)模型。入口級的Super App也是計(jì)劃中的一部分,平臺中間件和開發(fā)者工具也會對外發(fā)布。
后續(xù)
這部份就這些了。第一部分針對國內(nèi)的通用大模型的創(chuàng)業(yè)公司。之后我還會寫寫互聯(lián)網(wǎng)公司中入局大模型的公司,團(tuán)隊(duì),產(chǎn)品和策略。但是院校就不寫了,跟大佬們觀念一致,無法形成數(shù)據(jù)閉環(huán)的,都是在玩過家家,到不了AGI。