「今天距離 ChatGPT 發(fā)布,已經(jīng)第 131 天了。」 身著橙色帽衫,王小川走進(jìn)一間近 30 平米的會(huì)議室,在這里,他宣布了自己即將投入創(chuàng)業(yè)的大模型產(chǎn)品名叫「百川智能」?!复ā棺忠徽Z雙關(guān),既象征了河流匯聚入海的過程,如同數(shù)據(jù)匯聚產(chǎn)生支持;又隱含了自己的名字,「我把自己也放進(jìn)去了。同時(shí)也意味著需要更多人才加入進(jìn)來?!?/p> 這場(chǎng)內(nèi)部交流會(huì)可謂低調(diào),現(xiàn)場(chǎng)沒有 PPT,王小川對(duì)著一臺(tái) iPad 講述完自己的創(chuàng)業(yè)背景與愿景,過程中樓上不時(shí)傳來一陣陣裝修的電鉆聲。這是在搜狐網(wǎng)絡(luò)大廈的二層,戲劇性的是,不久前亦投入大模型創(chuàng)業(yè)的王慧文所創(chuàng)立的光年之外也在這棟大樓辦公。 而本次創(chuàng)業(yè)的啟動(dòng)資金也同樣低調(diào)——「百川智能」由 5000 萬美金啟動(dòng),據(jù)王小川本人介紹,資金部分來源為他個(gè)人出資,其余為幾位友人的個(gè)人支持。相比光年之外的兩億美金融資(未宣布 close),在大模型領(lǐng)域,五千萬美金并不是一筆引人矚目的金額。但王小川表示,將產(chǎn)品從 0 到 1 跑通,這筆錢在初期夠用了。 但據(jù)極客公園了解,王小川完全可以拿到更大金額的融資,他卻選擇了相對(duì)較小的初步啟動(dòng)資金。在大模型領(lǐng)域大消息不斷的 3 月,外界環(huán)境的變化令他逐漸從沖動(dòng)過渡到冷靜,選擇了以極低調(diào)的身姿入場(chǎng),為的是「不讓早期團(tuán)隊(duì)有太大壓力」。 事實(shí)上,早在一個(gè)月前王慧文高調(diào)入局后,王小川就開始了與產(chǎn)學(xué)界和政府有關(guān)部門的密切交流。最近他在社交平臺(tái)上發(fā)布了不少言論,稱如果機(jī)器掌握了語言,則強(qiáng)人工智能的時(shí)代就要到來。在此次交流會(huì)上,王小川強(qiáng)調(diào),創(chuàng)業(yè)搜狗的背景是他帶領(lǐng)團(tuán)隊(duì)做大模型的最大優(yōu)勢(shì)。「搜索就是做語言,在 AGI 方向,做語言是很大的優(yōu)勢(shì)?!苟鴵?jù)極客公園觀察,這一個(gè)月以來,王小川也是大模型創(chuàng)業(yè)者中,最被業(yè)內(nèi)看好的一個(gè)。 在「百川智能」目前公布的圖景中,目標(biāo)是「要構(gòu)建中國(guó)最好的大模型底座」——「最好」體現(xiàn)在參數(shù)、品測(cè)以及體驗(yàn)。與別家大模型有所區(qū)別的是,「百川智能」將率先在教育、醫(yī)療兩個(gè)垂類領(lǐng)域做知識(shí)增強(qiáng),目標(biāo)是要幫助大眾獲得普惠知識(shí),幫助企業(yè)做通用服務(wù)。底座產(chǎn)品目標(biāo)在年底公布,垂類產(chǎn)品可能會(huì)提前公布。 人才是大模型領(lǐng)域競(jìng)爭(zhēng)的關(guān)鍵詞。王小川透露,「百川智能」到月底團(tuán)隊(duì)會(huì)接近 50 人,不到一半是搜狗班底。而半個(gè)月后他本人就要飛去美國(guó)繼續(xù)招募技術(shù)人才。 有趣的是,這場(chǎng)交流會(huì)的靈感來自 ChatGPT,當(dāng)王小川問及 ChatGPT:如何招到更多更好的大模型領(lǐng)域人才?ChatGPT 給出的回答是,你要先對(duì)外界講清楚你的邏輯。于是才有了這場(chǎng)交流會(huì)。 有關(guān)此次創(chuàng)業(yè)的融資節(jié)奏,王小川的表現(xiàn)和外界的狂熱期待并不相符,當(dāng)被極客公園問及這是否仍是職業(yè)經(jīng)理人作風(fēng),而非創(chuàng)業(yè)者身位——他笑著回答,「我習(xí)慣了一切 ready 才公布,我承認(rèn)這有職業(yè)經(jīng)理人的慣性思維,但我走出來了,所以先選擇向大家公布。」 01 從狂熱,到冷靜王小川低a調(diào)官宣的背后,是過去數(shù)月大模型創(chuàng)業(yè)從狂熱到冷靜的一個(gè)縮影。 說起王小川,第一個(gè)浮現(xiàn)出的標(biāo)簽往往是「理工天才」,他有著世人對(duì)「理工男」刻板印象里的那些特質(zhì):做事審慎,不想好不出手。但在大模型這件事情上,王小川最初也曾陷入狂熱之中。 就在王慧文在朋友圈宣布做中國(guó)版 OpenAI 的前一天,創(chuàng)業(yè)者社區(qū)「前沿社」舉行了一場(chǎng)關(guān)于通用大模型的線上交流會(huì)。「OpenAI 正在展現(xiàn)出一場(chǎng)革命的開篇,這將是是互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)之后,同等量級(jí)的產(chǎn)業(yè)變革。」會(huì)上,極客公園創(chuàng)始人張鵬提出這個(gè)觀點(diǎn),并在與會(huì)者中發(fā)起投票。 一共 13 票投向認(rèn)同,這里面第一個(gè)投票的就是王小川。參與活動(dòng)多次以來,那一晚是他一年多來表達(dá)最多,也最興奮的一次。 在這場(chǎng)交流活動(dòng)上,王小川是 ChatGPT 最堅(jiān)定的支持者之一。當(dāng)幾位參加交流的 AI 領(lǐng)域創(chuàng)業(yè)者,嘗試僅僅從功能上定義 ChatGPT 的進(jìn)步的時(shí)候,王小川甚至明確表態(tài),說大家「把這件事想小了」。 「我看到了 AGI(通用人工智能)的曙光!」王小川說這是他去年末開始體驗(yàn) ChatGPT 的時(shí)候,內(nèi)心最強(qiáng)烈的感覺。并且在這次討論活動(dòng)里,第一次含蓄透露了自己可能也會(huì)參與大模型這場(chǎng)變革的態(tài)度。 在 2023 年 2 月 12 日極客公園前沿社的一次「AGI 信徒聚會(huì)」上,王小川第一次明確表達(dá)了「早就下決心肯定要入局」的決心?;蛘哒f,王慧文的突然高調(diào)入場(chǎng),實(shí)際上打亂了王小川原本四平八穩(wěn)的節(jié)奏,某種程度上幫他走出了「經(jīng)理人的思維」,開始激活了「腎上腺素」。 左起:李志飛、周源、王小川、翟光龍、張鵬 極客公園從接近王小川的人士處得知,在王慧文高調(diào)宣布入局后一周左右的時(shí)間內(nèi),王小川也曾準(zhǔn)備對(duì)外宣布入局。但那段時(shí)間密集的輿論熱潮,外界不上船就要被落下的 FOMO 心態(tài),讓他最終開始剎車反思自己急匆匆宣布,是否真的有必要。 王小川最熟悉的「老地方」 王小川沉默的這段時(shí)間,其他先放出消息的團(tuán)隊(duì)開始了緊鑼密鼓的籌備工作。王慧文設(shè)立北京光年之外科技有限公司,吸引了頂級(jí) VC 上億美元的認(rèn)購(gòu)。 另一位宣布投身大模型領(lǐng)域的出門問問的創(chuàng)始人李志飛,曾向極客公園表達(dá)過他的觀點(diǎn),他認(rèn)為,通用 AI 大模型就像是核武器,入局確實(shí)有時(shí)間窗口。「人才壁壘、時(shí)間壁壘、數(shù)據(jù)壁壘、資金壁壘一旦建立起來,小的團(tuán)隊(duì)就沒有戲了。」王小川和李志飛也是很熟悉的朋友,他也認(rèn)同這個(gè)觀點(diǎn),但是他也提出了一個(gè)觀點(diǎn)——「這事情不能上頭,還是要走心多思考下?!?/p> 在過去一段時(shí)間中,確實(shí)有些東西是值得思考的。比如以最早宣布入局的王慧文為例,一個(gè)月過去了,即使手握大筆資金,招到足夠人才,特別是一個(gè)業(yè)界被認(rèn)可的首席科學(xué)家或者 CTO,依舊是充滿挑戰(zhàn)的任務(wù)。 而從收購(gòu) AI 架構(gòu)公司一流科技 Oneflow,到意向收購(gòu)兩家清華 NLP 團(tuán)隊(duì)的初創(chuàng)公司——深言科技和面壁智能。也體現(xiàn)了王慧文希望盡快用最短路徑集結(jié)人才,而這恰恰體現(xiàn)了大模型創(chuàng)業(yè)的復(fù)雜性,資本意義重大,但不是唯一決定性的因素。 而王小川在 AI 領(lǐng)域的積累和在技術(shù)產(chǎn)品領(lǐng)域的個(gè)人品牌和經(jīng)驗(yàn),確實(shí)讓他在思考后,可以選擇另一種入局的方式。 02 融資思路為何變化?值得關(guān)注的第一個(gè)不同的思路,就是王小川為何把啟動(dòng)資金設(shè)在 5000 萬美元。 在 ChatGPT 問世的時(shí)候,王小川曾經(jīng)發(fā)過一條朋友圈說:OpenAI 的勝利,是技術(shù)理想主義的勝利。 從創(chuàng)立公司到推出 ChatGPT,OpenAI 整整走過了八年,在那之前,他們投入了大量的資金和資源。但也正是這種對(duì)技術(shù)的信仰,才能讓他們?nèi)〉谜痼@世界的成就,在 AGI 的前夜,為自己賺取今天難望其項(xiàng)背的領(lǐng)先優(yōu)勢(shì)。 最初國(guó)內(nèi)創(chuàng)業(yè)者都是想做中國(guó)的 OpenAI,也就是做底層的通用大模型,這件事背后的邏輯很簡(jiǎn)單:
幾個(gè)月過去,今天來看前兩者都沒有問題。但復(fù)制OpenAI的路徑,卻看起來越來越有挑戰(zhàn)。
以大模型能力為基礎(chǔ),OpenAI 已經(jīng)構(gòu)建起產(chǎn)品能力、商業(yè)化能力和生態(tài)能力,這為他們積累了大量用戶,而數(shù)據(jù)飛輪效應(yīng)進(jìn)一步加快 OpenAI 迭代基礎(chǔ)大模型。 如果說做一個(gè)大模型的難度系數(shù)是 1,想要快速做出能對(duì)標(biāo) ChatGPT 水平的、「完全開放式對(duì)話產(chǎn)品」的難度是 100 了。 既便王小川決心要做中國(guó)的 OpenAI,甚至最終要超越他。那么他核心要面對(duì)的問題就是:
當(dāng)面對(duì) OpenAI 在過去數(shù)年燒掉數(shù)十億美元構(gòu)建起的完整生態(tài),復(fù)制相同的路徑需要的資源,不論是 5000 萬美元還是幾億美元,如果不考慮造勢(shì)問題,其實(shí)都是杯水車薪。 比較務(wù)實(shí)的思考是如何迅速啟動(dòng),設(shè)定合理的里程碑,并且用最高的效率,以及超預(yù)期的結(jié)果到達(dá)里程碑,那么后續(xù)的資源才會(huì)源源不斷。 據(jù)參與了王小川本輪融資的好友透露,王小川正是出于這個(gè)考慮,改變了之前設(shè)定的融資計(jì)劃。在內(nèi)部交流會(huì)上,王小川被問及五千萬美金是否經(jīng)過詳細(xì)的計(jì)算,他透露,「從 0 到 1,5000 萬的啟動(dòng)資金就夠了。但要持續(xù)做到最好,我估計(jì)應(yīng)該是從 3 億-20 億美元之間?!?/strong> 03 王小川想要怎么做?交流會(huì)上,王小川給出了百川智能現(xiàn)階段的幾個(gè)目標(biāo):
相比 OpenAI 專注在一個(gè)通用模型,百川智能則會(huì)同時(shí)發(fā)展垂類模型和通用模型。 對(duì)于通用大模型,王小川稱,百川智能目前已經(jīng)開始訓(xùn)練 500 億參數(shù)的模型,進(jìn)展很順利,年底前預(yù)計(jì)會(huì)發(fā)布對(duì)標(biāo) GPT-3.5 的大模型,有信心今年年底做到國(guó)內(nèi)最好。 相比之下,垂類模型預(yù)計(jì)會(huì)出來的更快。盡管垂類模型的通用性沒法與 OpenAI 抗衡,但可以通過針對(duì)具體場(chǎng)景優(yōu)化,在細(xì)分場(chǎng)景里達(dá)到與 OpenAI 相近的效果,從而積累用戶、構(gòu)建起生態(tài),跑通小閉環(huán)。 而王小川選擇的幾個(gè)場(chǎng)景,除了搜索這個(gè)老本行外,選擇醫(yī)療、教育這兩個(gè)垂類賽道,是因?yàn)檫@兩個(gè)行業(yè)「對(duì)知識(shí)的要求最高」,而這個(gè)特征也會(huì)是大模型最先落地的方向。 甚至王小川曾經(jīng)與參與本次投資的朋友表示,大模型的之外,最需要花精力的,是打造超級(jí)應(yīng)用的思考和實(shí)踐,「最大最成功的公司一定是在應(yīng)用上想得最清楚的公司。」 顯然,中國(guó) OpenAI 這件事,今天已經(jīng)不只是大模型本身的競(jìng)爭(zhēng),而是大模型、超級(jí) App、行業(yè)應(yīng)用三合一的「新鐵人三項(xiàng)」賽了。 附:王小川公開信全文今天我正式宣布,創(chuàng)建「百川智能」,一家研發(fā)并提供通用人工智能服務(wù)的中國(guó)公司。 生活在二十一世紀(jì)初是如此幸運(yùn),波瀾壯闊的互聯(lián)網(wǎng)革命還沒有謝幕,通用人工智能時(shí)代又呼嘯而來。多年前我曾斷言,機(jī)器掌握語言,通用人工智能時(shí)代就來了;我也有暢想,搜索的未來是問答。ChatGPT 的騰空出世,地動(dòng)山搖,這一切都開始成為現(xiàn)實(shí)。ChatGPT 發(fā)布到今天,僅僅 131 天,每天都有撲面而來的新進(jìn)展、新突破。131 天恍如隔世! 大半個(gè)世紀(jì)以來,科學(xué)家們前赴后繼,努力創(chuàng)造通用智能機(jī)器。這一天終于到來,我們找到了一條巧妙的路徑,用 AI 成功將語言轉(zhuǎn)化成了數(shù)學(xué)模型。語言是知識(shí)、思考、溝通和文化的載體。維特根斯坦說,語言的邊界就是世界的邊界。當(dāng) AI 掌握了語言后,就開始認(rèn)知世界,成為有知識(shí)、能思考、善表達(dá)、會(huì)學(xué)習(xí)的智能體。我把這樣的智能體稱為「語言 AI」。 人類個(gè)體總有消亡的一天,但能夠?qū)吷闹R(shí)通過語言記錄下來供新生命學(xué)習(xí)、繼承,文明因此延續(xù)。人類協(xié)作也需要個(gè)體之間通過語言溝通。掌握了溝通和世界知識(shí)的語言 AI 不再只是人類的「工具」,而將成為我們的伙伴和超級(jí)助理,成為人類文明的一部分。 智能時(shí)代會(huì)改寫互聯(lián)網(wǎng)時(shí)代的范式。『連接』會(huì)被『陪伴』取代,『信息服務(wù)』會(huì)被『知識(shí)服務(wù)』取代,『免費(fèi)與廣告』會(huì)被『付費(fèi)與高品質(zhì)』取代。 智能時(shí)代也會(huì)改寫自工業(yè)時(shí)代以來的范式。曾經(jīng)是專業(yè)化社會(huì)分工帶來規(guī)模效應(yīng)與效率提升,而未來會(huì)是逆專業(yè)化分工:之前需要很多公司協(xié)作完成的工作,會(huì)因?yàn)?AI 的賦能『端到端』的完成。 智能時(shí)代將再一次開啟「文藝復(fù)興」。每個(gè)人都會(huì)因?yàn)?AI 的助力而變得更加強(qiáng)大。用好 AI,一個(gè)人就可能做一個(gè)公司,解決之前難以解決的難題,也更容易成為自己想成為的人。社會(huì)也會(huì)更加扁平,以前少數(shù)人才能享有的智力服務(wù),也能更普惠。 告別搜狗后,我已開啟新的遠(yuǎn)征:立志往后二十年,為生命科學(xué)和醫(yī)學(xué)的發(fā)展盡一份力,為大眾健康做出一點(diǎn)貢獻(xiàn),核心路徑是構(gòu)建生命健康數(shù)學(xué)模型,并已經(jīng)付諸行動(dòng)。ChatGPT 的出現(xiàn),也將成為新遠(yuǎn)征的重要助力。 不僅如此,ChatGPT 是我過往經(jīng)歷的延續(xù)和升華。2019 年我將搜狗的使命升級(jí)為「讓表達(dá)和獲取知識(shí)更簡(jiǎn)單」,愿景定義為「幫助每個(gè)人輕松地對(duì)話和書寫。便捷地獲得知識(shí)和服務(wù),提升工作效率和生活品質(zhì)」。 搜狗輸入法和搜狗搜索的數(shù)據(jù)制備和產(chǎn)品形態(tài),也與 ChatGPT 接近。它們都是把互聯(lián)網(wǎng)上的全部語言數(shù)據(jù)收集、清洗,壓縮成數(shù)據(jù)庫并構(gòu)建超級(jí)產(chǎn)品。隨著深度學(xué)習(xí)的發(fā)展,這些產(chǎn)品都多次迭代升級(jí),全面用上了 Transformer/Bert 等技術(shù)。輸入法猜你想說什么,搜索猜你想要什么。而 ChatGPT 把這些能力推到了一個(gè)全新的高度,是輸入法、搜索之外,第三個(gè)把全網(wǎng)數(shù)據(jù)轉(zhuǎn)化成語言服務(wù)的超級(jí)產(chǎn)品。搜狗未盡的使命在機(jī)器掌握了語言后終于可以實(shí)現(xiàn)。 很多朋友認(rèn)可我的技術(shù)理想主義和技術(shù)驅(qū)動(dòng)的創(chuàng)業(yè)經(jīng)驗(yàn),鼓勵(lì)和支持我做中國(guó)的 OpenAI。也有很多搜狗和非搜狗的技術(shù)大拿,得知我有做大模型的想法,主動(dòng)申請(qǐng)參與組隊(duì),甚至「帶資入組」。 我最動(dòng)心的是,能和一群有理想的人,用極致的技術(shù)驅(qū)動(dòng)創(chuàng)造出顛覆性的智能產(chǎn)品。這一次,百川智能將借助語言 AI 的突破,構(gòu)建中國(guó)最好的大模型底座,并在搜索、多模態(tài)、教育、醫(yī)療等方面增強(qiáng),幫助大眾輕松、普惠的獲取世界知識(shí)和專業(yè)服務(wù)。 籌建百川智能不到兩個(gè)月,已有多位技術(shù)合伙人和領(lǐng)軍人物的加入。到這個(gè)月底將會(huì)有近 50 人規(guī)模的精英團(tuán)隊(duì)。大模型的訓(xùn)練也已經(jīng)啟動(dòng),進(jìn)展順利。按照現(xiàn)在的進(jìn)度,爭(zhēng)取年內(nèi)發(fā)布國(guó)內(nèi)最好的大模型和顛覆性的產(chǎn)品。 我們是中國(guó)公司,但我們并不希望只是「中國(guó)的 OpenAI」,而是能建立世界級(jí)的視野和技術(shù)品質(zhì),讓中國(guó)享有世界級(jí)的產(chǎn)品,產(chǎn)生有世界影響力的技術(shù)的突破,進(jìn)而服務(wù)海外。百川本意是眾多的河流匯集奔赴海洋,象征著眾多數(shù)據(jù)、行業(yè)知識(shí)匯聚成為一個(gè)強(qiáng)大的智能體系,生生不息。百川也象征著集百家智慧,更多人與我一道共赴山海。我們呼喚中國(guó)的領(lǐng)軍人物、行業(yè)產(chǎn)品經(jīng)理和遠(yuǎn)在美國(guó)的同仁的加入。 同志們,請(qǐng)通過如下郵箱聯(lián)系我們: 80@baichuan-inc.com 90@baichuan-inc.com 95@baichuan-inc.com 00@baichuan-inc.com oier@baichuan-inc.com 通用人工智能時(shí)代剛剛開啟,我們作為第一批跨入新時(shí)代的人類,帶著焦慮和好奇去擁抱它,思考和探索「我是誰?」我們還可以把自己的智慧注入它,做新時(shí)代的開創(chuàng)者,讓后代們有一個(gè)更美好的未來,繁榮和延續(xù)人類文明。 百川智能 CEO 王小川 2023 年 4 月 10 日 |
|