【原】關(guān)于GPT-4的產(chǎn)品化狂想

腦極體 2023-03-25 發(fā)布于河南

展開全文

如今打開互聯(lián)網(wǎng)一看，會看到鋪天蓋地的“GPT-4好厲害”“太牛了”“科技革命到來了”“人類都要失業(yè)了”……

但這么偉大的變革到底是怎么到來呢？答案好像比較含糊。只有ChatGPT基礎(chǔ)的問答、代寫能力，以及微軟已經(jīng)開始做的搜索、辦公是目前比較清楚的大語言模型落地方案。如果僅僅有這些東西，似乎也還達不到科技革命的效果。

為什么會這樣？

答案在于，任何技術(shù)想要最終發(fā)揮效應(yīng)，都要經(jīng)歷一個“技術(shù)-產(chǎn)品-經(jīng)濟效益”的三階段發(fā)展。這其中，產(chǎn)品化是承上啟下不可或缺的一步，很多優(yōu)秀的技術(shù)就是因為無法產(chǎn)品化，最終只能停留在特殊或小眾領(lǐng)域，也有很多變革并不需要明確的技術(shù)指向，僅僅是因為產(chǎn)品出色，就可以引發(fā)變革。就像iPhone集成了很多新技術(shù)，但本身是產(chǎn)品創(chuàng)新。

在如今這個節(jié)骨眼上，每個人都能感覺到GPT蘊藏的變革能量。但我們對他如何產(chǎn)品化還知之甚少，能看見的應(yīng)用方案，主要還是以API的形式完成，更多屬于極客和開發(fā)者。

那么，這輪AI熱潮下，到底有可能產(chǎn)生哪些“殺手級”產(chǎn)品呢？我們以GPT-4的一些關(guān)鍵特性作為線索，來和大家分享幾個大語言模型的產(chǎn)品可能性。

先別提顛覆世界，那太虛，也別僅僅盯著已有的技術(shù)能力，那又太實。只有中程的產(chǎn)品化階段，才是絕大多數(shù)人在這輪AI爆發(fā)中的機會所在。

信息時代3.0，主線是“命令”

信息時代有兩條顛撲不破的主線：信息獲取與個人娛樂。搜索、信息流、門戶網(wǎng)站、直播、短視頻等，這些互聯(lián)網(wǎng)產(chǎn)品樣態(tài)都離不開信息獲取效率的升級，以及個人娛樂體驗的加強。GPT-4代表的大語言模型，可以在短時間內(nèi)生成大量內(nèi)容，甚至生成PPT、網(wǎng)站、視頻，這些傳統(tǒng)意義上AIGC難以做到的內(nèi)容。

這個能力推演下去，最大的產(chǎn)品價值在于，大語言模型帶來人與信息交互方式的徹底改變。

英偉達 GTC 2023 大會上，黃仁勛說：“生成式 AI 就是一種新型的計算機，我們可以用人類語言進行編程，任何人都可以命令計算機來解決問題。”

“命令”這個詞非常關(guān)鍵。當(dāng)GPT-4以及未來更多大語言模型成為產(chǎn)品基底，用戶與信息產(chǎn)品、娛樂產(chǎn)品之間的互動方式，最大可能性就是命令。

在信息1.0時代，你的需求可以被查詢到，這是搜索機制，代表產(chǎn)品就是搜索引擎。

信息2.0時代，你的需求可以被迎合，這是推薦機制，代表產(chǎn)品是信息流和短視頻。

當(dāng)AI能力進一步提升，你的需求可以被短時間內(nèi)訂制且滿足，GPT-4乃至5、6、7帶來的新機制，就是命令機制。

在這個階段，信息不是已經(jīng)成型，然后根據(jù)用戶需求進行查找，而是信息本身不存在，當(dāng)用戶發(fā)出指令后再進行AIGC。比如說，我在搜索引擎時代，想要寫一篇關(guān)于芯片的文章，就需要依靠關(guān)鍵詞、關(guān)鍵信息去搜索、查詢各種數(shù)據(jù)報告，需要用戶有耐心和信息查找能力。而在信息流時代，AI推薦機制會根據(jù)我查找、瀏覽了芯片相關(guān)信息，自動推送相關(guān)內(nèi)容，這些內(nèi)容有的有益，有的沒用，需要用戶來辨別。

當(dāng)“命令”成為主要的信息交互方式，我可以直接命令A(yù)I找到近期關(guān)于芯片的所有數(shù)據(jù)，并生成一份專屬報告給我。如果不滿意，我還可以命令它修改。

如果說，這種命令式信息收集，改變的生產(chǎn)、學(xué)習(xí)效率，以及信息獲取方式。那么類似技術(shù)驅(qū)動的AI生成視頻則可以極大改變娛樂模式。今天我們會覺得很多短視頻的模式化、快餐化，簡直像AI做的，未來這個擔(dān)心或許就沒有了，因為視頻就是AI做的。

電影解說、明星八卦、勁歌熱舞，AIGC未來將會隨時訂制大量視頻內(nèi)容，里面的電影信息是GPT抓取的，明星八卦是AI搜羅的，跳舞的男孩女孩形象都是AI生成的，不用再去尋找內(nèi)容，不用再讓AI推薦，也不需要大量短視頻創(chuàng)作者、UP主費時費力制作剪輯，只需要一個命令，輕輕松松幾個小時的娛樂時間就打發(fā)掉了。

如果說，信息時代1.0是人找信息，2.0是信息找人，那么AIGC帶來的信息3.0時代，就是誰也不用找誰，AI自己可以生成。

這個產(chǎn)品化機會的核心是繼搜索引擎、信息流之后，打造“命令引擎”這種新的產(chǎn)品形態(tài)。我猜“阿拉丁神燈”應(yīng)該是個好名字。

游戲NPC正盯著你

GPT-4發(fā)布的那個晚上，我看到群里很多開發(fā)者都在討論，而第一條蹦出來關(guān)于GPT-4應(yīng)用的消息，是有人說可以把他放在游戲里當(dāng)NPC。

讓NPC使用大語言模型作為底座，來跟玩家進行內(nèi)容豐富、高自由度的多輪對話，應(yīng)該是一件很容易想到的事情，但這位朋友說的卻不是這個意思。

GPT-4的一個關(guān)鍵創(chuàng)新特性，是讓AI來識別圖片，并且理解圖片中的細(xì)節(jié)、內(nèi)涵等，比如可以理解一張搞笑梗圖中的幽默點到底在哪。

這種能力如果用到游戲里，將賦予游戲和游戲NPC一個前所未有的能力：看見玩家。

從電子游戲誕生之日起，玩家要做的就是去看到、聽到一個虛擬世界，并沉浸其中。這個過程中，玩家要盡可能脫離自己周遭的現(xiàn)實，游戲感始終是單向的。雖然AR游戲、體感游戲的出現(xiàn)，一定程度上改變了這種情況，讓玩家的體態(tài)、運動、力量以及游玩環(huán)境進入到游戲當(dāng)中，但游戲本身對玩家是缺乏理解的。

如果讓GPT-4成為游戲NPC，或者作為游戲本身機制的一部分，那或許我們距離游戲能夠理解玩家，并做出對應(yīng)反應(yīng)已經(jīng)不遠(yuǎn)了。你在觀察游戲NPC的時候，他們可能也在觀察著你，嘗試?yán)斫饽愕谋砬椤⒛愕捏w態(tài)，解讀你在游戲中的困惑、激動，或者卡關(guān)之后想摔手柄的暴怒。

如果這種機制被放置在一些游戲大師手中，最終作品一定是震撼人心的。事實上，AI生成關(guān)卡、環(huán)境，完成自動渲染等技術(shù)，已經(jīng)極大改變了游戲開發(fā)，而GPT-4與游戲的深度融合，未來也是極大概率事件。

這種融合在兩個領(lǐng)域最有可能性，一個是強調(diào)互動的AR、VR游戲，另一個是注重NPC自由互動的開放世界與多結(jié)局角色扮演游戲。

除了游戲之外，“看懂”這個能力還可以被用到數(shù)字人，甚至機器人身上。也可以帶來相當(dāng)有分量的產(chǎn)品機會。

“一嘴通辦”

說了toC的，讓我們再聊聊toB。今天很多人都知道一個詞，叫做“一網(wǎng)通辦”。就是說在政務(wù)系統(tǒng)中打通各個部門的信息系統(tǒng)界限，從而避免辦事人要在不同部門之間來回奔波，產(chǎn)生辦不完的手續(xù)、蓋不完的章、跑不完的路。

在全球很多地方，一網(wǎng)通辦都是城市服務(wù)、政務(wù)、金融、財稅等領(lǐng)域的數(shù)字化核心發(fā)展方向，在中國的東部沿海地區(qū)和一線城市，“一網(wǎng)通辦”也正在高速發(fā)展。

但是“一網(wǎng)通辦”這種模式，其實依舊有痛點存在：

一是“通辦”僅僅是數(shù)據(jù)打通了，但辦理邏輯和辦理方式依舊與之前無異，用戶該不會的還是不會，該卡住的還是卡住，可能需要花費大量時間在反復(fù)詢問、填寫材料、咨詢上。

另一個是“一網(wǎng)通辦”的效率高度依賴操作人員能力。由于操作人員精力和專業(yè)能力有限，必然不了解各個業(yè)務(wù)領(lǐng)域，因此一旦出現(xiàn)復(fù)雜的情況，就會出現(xiàn)操作員雖然能處理，但不知道如何處理的問題，需要層層請示領(lǐng)導(dǎo)或者跨部門溝通，這樣反而降低了效率。

大語言模型與這些領(lǐng)域的融合，必然能夠解決一些問題。辦事人可以直接咨詢AI，了解復(fù)雜的部門、業(yè)務(wù)之間的內(nèi)在邏輯、辦事方法，從而盡量一次性完成辦事需求；而操作人員也可以依靠AI來獲取跨部門的操作方法、操作樣例，從而能夠完成較復(fù)雜情況的高效率處理。最關(guān)鍵的是，類似能力可以更多用AI替代人工。

這種依靠大語言模型知識抓取、邏輯分析能力的服務(wù)平臺，可以把“一網(wǎng)通辦”升級成“一嘴通辦”，辦事人說清楚訴求就全面搞定。當(dāng)然這個名字純屬開玩笑，但城市服務(wù)的核心，一定要從“網(wǎng)”轉(zhuǎn)變?yōu)椤叭恕保@一點是毫無疑問的，也是大模型時代的toB產(chǎn)品核心機遇。

類似的能力，最具有落地需求的就是政務(wù)與金融方面，這兩個領(lǐng)域涉及事項多、專業(yè)性強，并且與民眾需求緊密相連，從更遠(yuǎn)一點考慮，可能也包括財稅、法律、醫(yī)療。GPT代表的大語言模型，可以打破公眾服務(wù)的邊界，讓AI連接起專業(yè)知識與用戶需求。

集成了咨詢、數(shù)據(jù)匯總、事項辦理、文書認(rèn)證等功能的新型AI服務(wù)平臺，將是接下來toB市場AI技術(shù)的核心機遇。

超級無代碼開發(fā)

移動互聯(lián)網(wǎng)創(chuàng)業(yè)熱潮的時候，經(jīng)常有人開玩笑說，“我創(chuàng)意、機會、方法論都有了，距離拿到融資就差一個程序員”。

這當(dāng)然是一個笑談，但笑著笑著我們可能會發(fā)現(xiàn)，連那個程序員都不差了。

ChatGPT讓人驚艷的一點，就在于代碼的自動生成和修改。其實很多程序員朋友都說，類似AI模型的能力還主要是輔助工作，根本代替不了一個懂業(yè)務(wù)、懂產(chǎn)品邏輯與實現(xiàn)方式的程序員。

但復(fù)雜的開發(fā)可能做不了，簡單的難道不行嗎？GPT-4發(fā)布時演示的創(chuàng)新點之一，就是讓模型根據(jù)需求自動生成一個網(wǎng)站，雖然生成結(jié)果比較粗糙，但已經(jīng)實現(xiàn)了基本的開發(fā)需求。

在云計算與軟件業(yè)，低代碼開發(fā)，甚至無代碼開發(fā)是近兩年流行的熱門概念。核心邏輯是利用代碼庫，將已有開發(fā)樣例進行快速復(fù)寫，但GPT-4的邏輯顯然更加先進，他甚至不需要用戶懂架構(gòu)，而是直接根據(jù)需求生成開發(fā)程序。

這種能力，在短時間內(nèi)生成復(fù)雜的軟件應(yīng)用或許不行，但對于很多沒有編程與開發(fā)能力的人來說，通過AI來獲取一個小程序、一個電商平臺、一個簡單的APP還是非常有意義的。

用一些模板搭配GPT-4，可以形成“超級無代碼”的產(chǎn)品形式。用戶只需要下達需求并支付費用，就可以獲得屬于自己的軟件應(yīng)用，整個開發(fā)過程中的人工成本趨近于0。

為人提供這種AI主導(dǎo)，模板+微調(diào)的軟件開發(fā)，或許也將變成一個全新風(fēng)口。其實想想，現(xiàn)在隨手就能拉個群聊，這在早期的互聯(lián)網(wǎng)聊天室時代簡直難以想象，那么未來人手幾個APP，一堆網(wǎng)站，一群數(shù)字人，可能也不是什么難事。

從預(yù)訓(xùn)練大模型崛起，再到今天的ChatGPT、GPT-4，最值得關(guān)注的是智能涌現(xiàn)效應(yīng)驅(qū)動下，一些作為信息化常識的東西被改變了。換句話說，GPT-4是條件，而不是結(jié)果。

只有運用好這些新條件，得出新方法，創(chuàng)造新產(chǎn)品的人才能獲得AI時代最好的結(jié)果。

有人會擔(dān)心，這么大的變化之下，我的工作、生活會不會被顛覆？

其實吧，這種焦慮什么時候都有，但從沒有真正變成災(zāi)難。

1999年，樸樹有首歌叫做《New Day》，里面有句歌詞是這么寫的，“快來吧奔騰電腦，就讓它們代替我來思考”。

20多年過去了，人類還在思考，奔騰電腦在哪里？