中國的AI圈,有一種根深蒂固的頑疾,我們可以稱之為:AI商業(yè)化恐懼與AI應(yīng)用缺失綜合癥。 具體表現(xiàn)為,一種AI技術(shù)爆火之后大家先是驚嘆,什么“人人都被AI創(chuàng)飛了”之類的。緊接著,在這條賽道真正熱起來之后就會轉(zhuǎn)變?yōu)橘|(zhì)疑:你做的AI能商業(yè)化嗎?為什么AI還是沒有超級應(yīng)用?為什么我還是沒有用到AI應(yīng)用? 似乎AI總是在對技術(shù)的巨大期待,以及對應(yīng)用的不斷失望間輪回。大模型是真的雷聲大雨點小,很難帶來高增長、有商業(yè)化能力的應(yīng)用嗎? 最近外網(wǎng)一款應(yīng)用的火爆,讓我們有了些新的想法。不久之前,NotebookLM的核心團隊離職引發(fā)熱議,團隊負(fù)責(zé)人Raiza Martin宣布將和核心設(shè)計師、工程師一起離職,準(zhǔn)備打造新的大模型應(yīng)用。這一消息引發(fā)討論的原因在于,NotebookLM是今年歐美最出圈的大模型應(yīng)用之一,甚至它出圈的原因根本不是作為AI筆記本的基礎(chǔ)功能,而是一個嘗鮮類的附加功能——AI播客生成。 透過NotebookLM的爆火,我們可以由此聊聊AI+聲音方向的商業(yè)化可能性,以及究竟應(yīng)該如何打造具有高增長潛力的AI應(yīng)用。 或許可以說,越來越多的熱門應(yīng)用正在證明,AI應(yīng)用缺失癥是能夠被治愈的。 NotebookLM原本是谷歌一個小組打造的AIGC寫作工具,在全球有非常多的競品,并且已經(jīng)推出了幾年時間都沒有什么水花。但最近讓這個看似比較平庸的應(yīng)用突然爆火的,是它添加了一項功能:播客生成。 更新后的這一功能,允許用戶上傳文檔、文本、網(wǎng)頁以及YouTube視頻來生成由AI制作的音頻播客。與其他音頻功能不同的是,NotebookLM生成的不是那種照著文本念出來的簡單播客,而是有兩個主持人的對談型播客。 AI生成的兩位主播,會根據(jù)素材提供的內(nèi)容進行分析、討論,甚至?xí)嗷フ{(diào)侃,還能進行大笑。比如說,如果你輸入一本歷史類書籍,NotebookLM就能生成多集的歷史解密類對談播客。如果輸入自己的資料,它也能生成兩位AI主播對你吹彩虹屁的聊天內(nèi)容,他們有理有據(jù),一本正經(jīng)地分析討論你有多么了不起。 這種新穎的內(nèi)容生成模式給了網(wǎng)友極大的創(chuàng)造和收聽動力,玩出的花樣也越來越多。甚至有人認(rèn)為,這可能是第一款不是由于模型能力,而是通過應(yīng)用體驗獲得認(rèn)可的AI。 而在NotebookLM背后作為支持的,是谷歌的Gemini 1.5 Pro大語言模型。它能夠一次處理多達(dá)1500頁的內(nèi)容,并且支持超長上下文的多輪對話。NotebookLM的音頻功能則是基于谷歌的語音模型來實現(xiàn)。 到這里我們會發(fā)現(xiàn),NotebookLM是一個標(biāo)準(zhǔn)到不能更標(biāo)準(zhǔn)的AI原生應(yīng)用。它基于多個大模型來實現(xiàn);利用了AIGC和多模態(tài)這些非常具有代表性的AI機制;創(chuàng)造了傳統(tǒng)移動應(yīng)用完全無法實現(xiàn)的服務(wù)體驗。 由此可見,只要做對能力,找準(zhǔn)市場,AI應(yīng)用是完全有可能撐起流量和商業(yè)化場面的。 當(dāng)然,NotebookLM取巧的一點在于它的市場切入點非常精準(zhǔn)。播客在美國的市場需求量非常龐大,甚至大有超越短視頻的態(tài)勢。美國用戶,尤其是年輕用戶大多有收聽播客的習(xí)慣,而明星、運動員、脫口秀演員也普遍將錄制播客作為表達(dá)方式。 在這個關(guān)注度高、需求量大的市場上,AI帶來了兩人對談播客這種前所未見的應(yīng)用體驗,這才讓NotebookLM在幾個月內(nèi)爆火出圈。 如果僅僅關(guān)注AI播客生成這件事,那么NotebookLM所代表的意義或許會被裁剪掉很多,首先播客市場在國內(nèi)還遠(yuǎn)不如歐美火爆,其次AI播客生成的商業(yè)化潛力本就有限。 想要深度利用NotebookLM的意義,首先應(yīng)該看到其所代表的AI音頻賽道本就有著更為寬闊的商業(yè)化空間。對于AI行業(yè)普遍存在的商業(yè)焦慮,AI+音頻至少是一種紓解。在生活中大量太長不看的內(nèi)容,都可以通過轉(zhuǎn)換為音頻的方式來提升觸達(dá)效率。比如在谷歌內(nèi)部,谷歌廣告團隊就在研究基于NotebookLM的生成能力來打造銷售問答,從而對新人進行培訓(xùn)。這樣原本厚重的資料,就可以被模擬成銷售人員與顧客之間的對話,新入職的銷售可以直接學(xué)習(xí)與顧客進行交流,每個問題應(yīng)該如何對應(yīng)、解釋等。 類似的例子還有很多,比如產(chǎn)品說明書的音頻版、在線教育的問答機制。我們在很多時候都會面臨資料太多,過長不看的窘境。這時我們往往會想要跟懂行的人問上兩句,而現(xiàn)在問AI或許就可以了。 推而廣之,NotebookLM還可以跟機器視覺進行結(jié)合。比如去健身房,私教的工作其實就是看著你訓(xùn)練,然后指出動作的正誤,回答健身者的問題。如果讓NotebookLM附帶上視覺能力,或許AI播客可以變成AI私教。 這些探索證明,一個出圈的AI應(yīng)用往往具備連鎖反應(yīng)。它不僅能夠在本圈層得到用戶的追捧,同時還具有持續(xù)擴散商業(yè)影響力的可行性。 即使你不聽AI播客,也對AI音頻賽道毫無興趣。NotebookLM也依舊展示了優(yōu)秀AI應(yīng)用最底層的東西:輸入簡單,生產(chǎn)驚喜,貼近用戶。 如今,大模型已經(jīng)能做到很多前所未見的事,但總是無法出現(xiàn)那種能夠引發(fā)討論和傳播的爆火應(yīng)用。NotebookLM的火爆告訴我們,其中很大原因出自產(chǎn)品設(shè)計的缺失。 與其他AI應(yīng)用相比,NotebookLM在產(chǎn)品層面有一個鮮明的特點,就是整體UI設(shè)計盡量傾向簡單。AI播客生成本身只是NotebookLM功能的一部分,用戶打開門檻天然較高。在這種情況下,項目團隊對其整體UI都進行了盡量簡化。比如上傳文檔是很多AIGC應(yīng)用都有的步驟,但上傳文件的步驟瑣碎、容錯度低,往往會給用戶帶來不悅的產(chǎn)品體驗。NotebookLM則支持一鍵上傳源文檔,并且可以覆蓋文檔、視頻等多種文件源與文件格式。這種非常友好的用戶界面設(shè)計,讓這種創(chuàng)新型的AI應(yīng)用擁有了極低的門檻。用戶不會在UI層面就被瑣碎的操作、復(fù)雜的文件要求給勸退。 而與輸入端盡量簡單構(gòu)成正比的是NotebookLM在輸出端給出了非常完整且復(fù)雜的內(nèi)容。用AI生成播客在今天已經(jīng)不太新鮮,但NotebookLM能夠生成兩人對談播客,并且對談內(nèi)容是有語氣、有節(jié)奏,甚至是富有幽默感的。這種驚喜感和意想不到,與極簡的內(nèi)容輸入構(gòu)成了對比,進而變成了能夠出圈的產(chǎn)品動力。 除此之外,NotebookLM的成功還有一個關(guān)鍵因素,就是它找到了播客這個在歐美頗具市場號召力的領(lǐng)域。正是因為播客本身有市場需求,受關(guān)注程度高,NotebookLM帶來的AI驚喜感才能順理成章激活用戶認(rèn)同。而且NotebookLM又一次證明了,尋找更能接受AI的年輕人認(rèn)可,貼近年輕市場的生活、娛樂、消費模式,是AI應(yīng)用能夠成功的關(guān)鍵。 總結(jié)NotebookLM的故事,可以發(fā)現(xiàn)一款成功的AI應(yīng)用需要具備三要素: 1.極簡的用戶界面與生成規(guī)則。 2.具有驚喜感與震撼力的AIGC效果。 3.貼近用戶注意力,尤其是年輕人注意力的市場落點。 從大模型的能力出發(fā),尋找到這三個條件,應(yīng)該就能勾勒出差不多的AI應(yīng)用了。 所謂AI應(yīng)用缺失癥,從正面看是一個巨大的問題,反面看則是很多個具體的機會。 |
|