翻譯|匡萃彪 一年前,我們發(fā)表了一個假設(shè),即生成式人工智能將成為技術(shù)領(lǐng)域的重大平臺轉(zhuǎn)變。接著就引起了軒然大波。 科學(xué)家、歷史學(xué)家和經(jīng)濟(jì)學(xué)家長期以來一直研究著創(chuàng)造出創(chuàng)新的富饒時期所需的最佳條件。在生成式人工智能領(lǐng)域,我們已經(jīng)達(dá)到了一個現(xiàn)代的奇跡,可以說是我們這一代的太空競賽。 這一時刻是幾十年來的成果。摩爾定律的六十年發(fā)展使我們擁有了足夠的計算能力來處理數(shù)量龐大的數(shù)據(jù)?;ヂ?lián)網(wǎng)的四十年發(fā)展(在COVID-19的推動下)為我們提供了數(shù)萬億個標(biāo)記的訓(xùn)練數(shù)據(jù)。移動和云計算的二十年發(fā)展為每個人提供了一臺超級計算機(jī),掌握在我們手中。換句話說,幾十年的技術(shù)進(jìn)步積累起來,創(chuàng)造了生成式人工智能起飛所需的必要條件。 ChatGPT的崛起是引爆了這一創(chuàng)新浪潮的火花,釋放出了一種創(chuàng)新的密度和熱情,這種情況已經(jīng)有多年沒有見過了,也許自互聯(lián)網(wǎng)早期以來就沒有了。這種激動人心的氛圍在“智能谷”尤為強(qiáng)烈,人工智能研究人員成為了明星,黑客之家每個周末都擠滿了新的自主代理和聊天機(jī)器人。人工智能研究人員從傳統(tǒng)的“車庫黑客”變成了指揮數(shù)十億美元計算資源的特種部隊。arXiv論文出版已經(jīng)變得如此頻繁,以至于研究人員開玩笑要求暫停新的出版物,以便他們趕上來。 但很快,人工智能的熱情變成了近乎歇斯底里的狀態(tài)。突然之間,每家公司都成了“AI副駕駛”。我們的收件箱充斥著“AI Salesforce”、“AI Adobe”和“AI Instagram”等無差別的推銷信息。1億美元的早期種子輪融資回歸。我們陷入了一場不可持續(xù)的籌資狂潮、人才爭奪戰(zhàn)和GPU采購的狂熱之中。 而且,問題開始顯露出來。藝術(shù)家、作家和歌手開始質(zhì)疑機(jī)器生成的知識產(chǎn)權(quán)的合法性。關(guān)于倫理、監(jiān)管和潛在的超級智能的爭論占據(jù)了華盛頓的輿論。最令人擔(dān)憂的是,硅谷內(nèi)部開始傳播一種聲音,認(rèn)為生成式人工智能實(shí)際上并沒有多大用處。許多應(yīng)用的用戶留存率表現(xiàn)糟糕,許多應(yīng)用的最終用戶需求開始趨于飽和。這只是又一個虛幻軟件周期嗎? AI的不滿之夏使批評者們興高采烈地跳舞,讓人回想起互聯(lián)網(wǎng)早期的日子,1998年一位著名的經(jīng)濟(jì)學(xué)家曾宣稱:“到2005年,將會明顯看出互聯(lián)網(wǎng)對經(jīng)濟(jì)的影響與傳真機(jī)一樣微不足道?!?/span> 毫無疑問,盡管存在吵鬧聲、歇斯底里和不確定感,但生成式人工智能已經(jīng)比SaaS有更成功的開端,僅來自初創(chuàng)公司的收入就已超過10億美元(而SaaS市場花了多年才達(dá)到同樣的規(guī)模)。一些應(yīng)用已經(jīng)家喻戶曉:ChatGPT成為了增長最快的應(yīng)用程序,特別在學(xué)生和開發(fā)者中有著強(qiáng)大的產(chǎn)品市場契合度;Midjourney成為了我們共同的創(chuàng)意靈感,并據(jù)報道已經(jīng)達(dá)到了數(shù)億美元的收入,團(tuán)隊只有十一人;Character推廣了人工智能娛樂和伴侶應(yīng)用,并創(chuàng)造了我們最渴望的消費(fèi)者“社交”應(yīng)用,用戶平均在應(yīng)用中花費(fèi)兩個小時。 盡管如此,這些早期的成功跡象并不改變一個事實(shí),即許多人工智能公司簡單地沒有產(chǎn)品市場契合度或可持續(xù)的競爭優(yōu)勢,整個人工智能生態(tài)系統(tǒng)的熱潮是不可持續(xù)的。 現(xiàn)在,塵埃已經(jīng)稍微平息了一些,我們認(rèn)為現(xiàn)在是審視生成式人工智能的時機(jī)——我們今天所處的位置以及可能的前景。 走向第二幕 生成式人工智能的第一年出現(xiàn)了“第一幕”,它是從技術(shù)角度出發(fā)的。我們發(fā)現(xiàn)了一個新的“工具”——基礎(chǔ)模型——并發(fā)布了一系列輕便的應(yīng)用程序,展示了令人興奮的新技術(shù)。 我們現(xiàn)在認(rèn)為市場正在進(jìn)入“第二幕”,這將從客戶需求出發(fā)。第二幕將從頭到尾解決人類問題。這些應(yīng)用程序與最初的應(yīng)用程序在性質(zhì)上不同。它們傾向于將基礎(chǔ)模型作為更全面解決方案的一部分,而不是整個解決方案。它們引入了新的編輯界面,使工作流程更加黏性,輸出更加優(yōu)質(zhì)。它們通常是多模態(tài)的。 市場已經(jīng)開始從“第一幕”過渡到“第二幕”。進(jìn)入“第二幕”的公司的例子包括Harvey,為精英律師事務(wù)所構(gòu)建自定義LLM;Glean,正在爬取和索引我們的工作空間,使生成式人工智能在工作中更加相關(guān);Character和Ava,正在創(chuàng)建數(shù)字伴侶。 市場地圖 我們更新的生成式人工智能市場地圖如下。 與去年的地圖不同,我們選擇按用例而不是按模型模態(tài)組織這張地圖。這反映了市場的兩個重要趨勢:生成式人工智能從技術(shù)工具逐漸演化為實(shí)際用例和價值,以及生成式人工智能應(yīng)用程序越來越多模態(tài)的性質(zhì)。 此外,我們還包括了一個新的LLM(大型語言模型)開發(fā)者堆棧,反映了公司在構(gòu)建生成式人工智能應(yīng)用程序投入生產(chǎn)時所依賴的計算和工具供應(yīng)商。 回顧我們的論點(diǎn) 我們最初的文章提出了生成式人工智能市場機(jī)會的論點(diǎn)以及市場發(fā)展的假設(shè)。我們做對了什么? 以下是我們犯的錯誤: 事情發(fā)展迅速。去年,我們預(yù)計在實(shí)現(xiàn)實(shí)習(xí)生級別的代碼生成、好萊塢質(zhì)量的視頻或人類質(zhì)量的語音(而不是機(jī)械的聲音)之前,還需要近十年的時間。但聽一下TikTok上的Eleven Labs的聲音或Runway的人工智能電影節(jié)就能清楚地看出,未來已經(jīng)以超光速到來。甚至3D模型、游戲和音樂也在迅速變得優(yōu)秀。 瓶頸在供應(yīng)端。我們沒有預(yù)料到最終用戶需求會超過GPU供應(yīng)的程度。許多公司的增長瓶頸很快從客戶需求轉(zhuǎn)向了獲得來自Nvidia的最新GPU。長時間等待成為了常態(tài),一個簡單的商業(yè)模式出現(xiàn)了:支付訂閱費(fèi)以跳過排隊并獲得更好的模型。 垂直分離尚未發(fā)生。我們?nèi)匀幌嘈拧皯?yīng)用層”公司和基礎(chǔ)模型提供商之間會存在分離,模型公司專注于規(guī)模和研究,應(yīng)用層公司專注于產(chǎn)品和用戶界面。事實(shí)上,這種分離尚未明確發(fā)生。事實(shí)上,最成功的用戶界面應(yīng)用程序一開始就已經(jīng)進(jìn)行了垂直整合。 競爭激烈且現(xiàn)有公司反應(yīng)迅速。去年,市場上有一些競爭激烈的領(lǐng)域(尤其是圖像生成和文案寫作等領(lǐng)域),但總體上市場是空白。如今,市場競爭已經(jīng)超過了機(jī)會的許多領(lǐng)域?,F(xiàn)有公司的反應(yīng)速度之快,從谷歌的Duet和Bard到Adobe的Firefly,以及現(xiàn)有公司愿意承擔(dān)“風(fēng)險”的意愿,都放大了競爭的熱度。即使在基礎(chǔ)模型層面,我們看到客戶正在建立他們的基礎(chǔ)設(shè)施,以在不同供應(yīng)商之間保持中立。 護(hù)城河在客戶身上,而不在數(shù)據(jù)身上。我們預(yù)測,最好的生成式人工智能公司可以通過數(shù)據(jù)飛輪獲得可持續(xù)的競爭優(yōu)勢:更多的使用→更多的數(shù)據(jù)→更好的模型→更多的使用。盡管這在某種程度上仍然成立,尤其是在具有非常專業(yè)化和難以獲取的數(shù)據(jù)的領(lǐng)域,但“數(shù)據(jù)壁壘”岌岌可危:應(yīng)用公司生成的數(shù)據(jù)并不能創(chuàng)造出無法逾越的壕溝,而下一代基礎(chǔ)模型很可能會消除初創(chuàng)公司生成的任何數(shù)據(jù)壕溝。相反,工作流程和用戶網(wǎng)絡(luò)似乎正在創(chuàng)造更持久的競爭優(yōu)勢的來源。 以下是我們做對的事情: 生成式人工智能是一種現(xiàn)象。突然之間,每個開發(fā)人員都在開發(fā)生成式人工智能應(yīng)用程序,每個企業(yè)買家都在要求它。市場甚至保留了“生成式人工智能”的稱號。人才涌入市場,風(fēng)險投資也涌入。生成式人工智能甚至在病毒視頻中成為流行文化現(xiàn)象,例如“Harry Potter Balenciaga”或Ghostwriter的模仿歌曲“Heart on My Sleeve”,已成為排行榜上的熱門歌曲。 第一個殺手級應(yīng)用出現(xiàn)了。眾所周知,ChatGPT是最快達(dá)到1億月活躍用戶的應(yīng)用程序之一,僅用了6周就實(shí)現(xiàn)了這一壯舉。相比之下,Instagram用了2.5年,WhatsApp用了3.5年,YouTube和Facebook用了4年才達(dá)到了這一用戶需求水平。但ChatGPT并不是一個孤立的現(xiàn)象。Character AI的深度參與度(平均會話時間為2小時)、Github Copilot的生產(chǎn)效益(提高了55%)以及Midjourney的貨幣化路徑(數(shù)億美元的收入)都表明,第一批殺手級應(yīng)用已經(jīng)出現(xiàn)。 開發(fā)人員是關(guān)鍵。像Stripe或Unity等以開發(fā)人員為先的公司的核心洞察之一是,開發(fā)人員的訪問打開了你甚至無法想象的用例。在過去的幾個季度里,我們聽到了各種各樣的提案,從音樂生成社區(qū)到人工智能匹配制作者再到人工智能客戶支持代理。 形式因素正在演變。AI應(yīng)用程序的第一個版本主要是自動完成和初稿,但這些形式因素現(xiàn)在正變得更加復(fù)雜。Midjourney引入的攝像機(jī)移動和填充是一個很好的例子,說明了生成式人工智能用戶體驗的豐富性??偟膩碚f,形式因素正在從個人級別的生產(chǎn)力發(fā)展為系統(tǒng)級別的生產(chǎn)力,從人在回路中的執(zhí)行導(dǎo)向型系統(tǒng)發(fā)展。 版權(quán)和倫理以及存在恐慌。關(guān)于這些敏感話題的辯論一直在持續(xù)。藝術(shù)家、作家和音樂家意見不一,一些創(chuàng)作者理所當(dāng)然地對其他人從衍生作品中獲利感到憤怒,而一些創(chuàng)作者則接受了新的人工智能現(xiàn)實(shí)(Grimes的盈利共享提議和James Buckhouse對成為創(chuàng)意基因組的一部分的樂觀態(tài)度讓人印象深刻)。沒有一家初創(chuàng)公司想成為未來Spotify的Napster或Limewire(鳴謝Jason Boehmig)。規(guī)則是不透明的:日本宣布用于訓(xùn)練人工智能的內(nèi)容沒有知識產(chǎn)權(quán),而歐洲提出了嚴(yán)厲的監(jiān)管。 我們現(xiàn)在處于何種地步?生成式人工智能的價值問題 生成式人工智能不缺乏用例或客戶需求。用戶渴望能夠使他們的工作更容易,工作產(chǎn)品更好的人工智能,這就是為什么他們紛紛涌向這些應(yīng)用程序的原因(盡管缺乏自然分發(fā))。 但是人們會留下來嗎?實(shí)際上并不會。下面的圖表比較了AI優(yōu)先應(yīng)用程序(AI-First)和現(xiàn)有公司的第一個月移動應(yīng)用程序保留率。 用戶參與度也不高。一些最好的消費(fèi)者公司有60-65%的DAU/MAU;WhatsApp則達(dá)到了85%。相比之下,生成式人工智能應(yīng)用的中位數(shù)為14%(特別例外是Character和“AI伴侶”類別)。這意味著用戶對生成式人工智能產(chǎn)品尚未找到足夠的價值來每天使用它們。 簡而言之,生成式人工智能最大的問題不是找到用例、需求或分發(fā),而是證明其價值。正如我們的同事David Cahn所說,“2000億美元的問題是:你打算用所有這些基礎(chǔ)設(shè)施來做什么?它將如何改變?nèi)藗兊纳??”建立持久業(yè)務(wù)的道路將需要解決留存問題,并為客戶創(chuàng)造足夠深厚的價值,使他們留下來成為日?;钴S用戶。 讓我們不要感到絕望。生成式人工智能仍處于“尷尬的青少年時期”。我們可以看到一些閃光的跡象,當(dāng)產(chǎn)品未達(dá)到預(yù)期時,失敗通常是可靠、可重復(fù)和可解決的。我們的工作擺在那里。 第二幕:共享游戲規(guī)則 創(chuàng)始人們正在進(jìn)行辛勤的提示工程、微調(diào)和數(shù)據(jù)集策劃工作,以使他們的人工智能產(chǎn)品變得“好”。他們一塊一塊地將引人注目的演示構(gòu)建成整體產(chǎn)品體驗。與此同時,基礎(chǔ)模型基礎(chǔ)繼續(xù)充斥著研究和創(chuàng)新。 隨著公司找到持久價值的路徑,一個共享的游戲規(guī)則正在形成。我們現(xiàn)在已經(jīng)有了共享的技術(shù),使模型變得有用,以及新興的用戶界面范式將塑造生成式人工智能的第二幕。 模型開發(fā)堆棧 - 新興的推理技術(shù),如思維鏈、思維樹和反思,正在提高模型執(zhí)行更豐富、更復(fù)雜的推理任務(wù)的能力,彌合了客戶期望和模型能力之間的差距。開發(fā)人員正在使用Langchain等框架來調(diào)用和調(diào)試更復(fù)雜的多鏈序列。 - 遷移學(xué)習(xí)技術(shù),如RLHF和微調(diào),變得更加可訪問,特別是最近GPT-3.5和Llama-2的微調(diào)變得可行,這意味著公司可以將基礎(chǔ)模型適應(yīng)其特定領(lǐng)域,并根據(jù)用戶反饋進(jìn)行改進(jìn)。開發(fā)人員正在下載Hugging Face的開源模型,并對其進(jìn)行微調(diào),以實(shí)現(xiàn)高質(zhì)量的性能。 - 檢索增強(qiáng)生成將業(yè)務(wù)或用戶的上下文納入考慮,減少了產(chǎn)生幻覺的可能性,提高了真實(shí)性和有用性。像Pinecone這樣的公司的矢量數(shù)據(jù)庫已經(jīng)成為RAG的基礎(chǔ)設(shè)施支撐。 - 新的開發(fā)人員工具和應(yīng)用程序框架為公司提供了可重復(fù)使用的構(gòu)建塊,以創(chuàng)建更高級的人工智能應(yīng)用程序,并幫助開發(fā)人員評估、改進(jìn)和監(jiān)控生產(chǎn)中的人工智能模型的性能,包括像Langsmith和Weights & Biases這樣的LLMOps工具。 - AI優(yōu)先基礎(chǔ)設(shè)施公司,如Coreweave、Lambda Labs、Foundry、Replicate和Modal,正在拆分公共云,提供人工智能公司最需要的東西:以合理的成本、按需提供、高度可擴(kuò)展的大量GPU,擁有良好的PaaS開發(fā)者體驗。 這些技術(shù)共同應(yīng)該縮小模型期望與現(xiàn)實(shí)之間的差距,同時基礎(chǔ)的基礎(chǔ)模型也在不斷改進(jìn)。但使模型變得出色只是戰(zhàn)斗的一半。生成式人工智能首次用戶體驗的游戲規(guī)則也在不斷發(fā)展: 新興的產(chǎn)品藍(lán)圖 生成式界面?;谖谋镜膶υ捰脩趔w驗是LLM之上的默認(rèn)界面。逐漸地,新的形式因素進(jìn)入了裝備庫,從Perplexity的生成式用戶界面到Inflection AI的人聲模式等新模態(tài)。 新的編輯體驗:從Copilot到導(dǎo)演模式。隨著我們從零次到詢問和調(diào)整(感謝Zach Lloyd)的進(jìn)展,生成式人工智能公司正在發(fā)明一組與傳統(tǒng)編輯工作流非常不同的旋鈕和開關(guān)。Midjourney的新的攝像機(jī)移動命令和Runway的導(dǎo)演模式創(chuàng)造了新的類似于攝像機(jī)的編輯體驗。Eleven Labs正在通過提示來操縱聲音。 越來越復(fù)雜的代理系統(tǒng)。生成式人工智能應(yīng)用程序越來越不僅僅是人工審核的自動完成或初稿;它們現(xiàn)在具有自主解決問題、訪問外部工具并代表我們解決問題的能力。我們正在穩(wěn)步從0級進(jìn)展到5級自主。 系統(tǒng)范圍的優(yōu)化。一些公司不是嵌入到單個人用戶的工作流程中,使該個體更有效率,而是直接解決了系統(tǒng)范圍的優(yōu)化問題。您可以自動解決一部分支持票或拉取請求,從而使整個系統(tǒng)更加有效嗎? 最后的想法 隨著我們接近前沿悖論,以及Transformer和擴(kuò)散模型的新奇感逐漸消退,生成式人工智能市場的性質(zhì)正在演變。炒作和閃光效果正在讓位于真正的價值和完整產(chǎn)品體驗。 在紅杉,我們?nèi)匀粓远ǖ叵嘈派墒饺斯ぶ悄?。這個市場起飛所需的必要條件已經(jīng)在數(shù)十年內(nèi)積累起來,市場終于來臨了。殺手級應(yīng)用程序的出現(xiàn)和終端用戶需求的巨大規(guī)模加深了我們對市場的信心。 然而,阿瑪拉定律(Amara's Law)——即我們傾向于高估技術(shù)的短期影響并低估其長期影響的現(xiàn)象——正在發(fā)生。在投資決策中,我們正在運(yùn)用耐心和判斷,特別注意創(chuàng)始人如何解決價值問題。公司在推動模型性能和產(chǎn)品體驗的界限上使用的共享游戲規(guī)則給我們帶來了對生成式人工智能第二幕的樂觀看法。 END
|
|