【原】科技巨頭狂卷“智能體”，大模型上終于長(zhǎng)出了“大家伙”？

雷科技 2024-08-30 發(fā)布于廣東

展開全文

這兩天，備受矚目的 OpenAI 新項(xiàng)目又有了新消息。

The Information 援引內(nèi)部消息報(bào)道稱，OpenAI 計(jì)劃最快將在今年秋天推出代號(hào)「草莓（Strawberry）」的全新 AI，其擁有前所未有的「推理」能力，可以處理復(fù)雜的數(shù)學(xué)和編程任務(wù)，甚至還能體現(xiàn)在日常生活中的非技術(shù)問(wèn)題上。

此外，報(bào)道還指出這項(xiàng)技術(shù)對(duì)未來(lái) AI 產(chǎn)品，特別是旨在解決多步驟任務(wù)的「智能體（Agent）」具有重要意義。

又是智能體。

在 2022 年年底 ChatGPT 大火之后，「智能體」很快就從故紙堆中一躍而出，引起整個(gè)行業(yè)的廣泛關(guān)注。而從開源項(xiàng)目 AutoGPT 到 OpenAI 官方推出的 GPTs 和 GPT 商店，作為「雛形」，也都在一定程度上展現(xiàn)了 AI 智能體的潛力與必要。

但如果說(shuō)在 2023 年，人工智能行業(yè)的發(fā)展和競(jìng)爭(zhēng)更多還是聚焦在大模型本身，關(guān)于智能體探索才剛剛邁出第一步。那到了 2024 年，從 Google 到百度，從阿里巴巴、字節(jié)跳動(dòng)到 OpenAI，國(guó)內(nèi)外都在明顯加快了智能體落地的步伐。

都在說(shuō)「智能體」，

但它到底什么？

如果平常關(guān)注 AI 領(lǐng)域，我相信讀者們一定不少看到或者聽到「智能體」這個(gè)詞。但智能體到底是什么？可能很難講清楚。

事實(shí)上，在 1995 年出版的《未來(lái)之路》一書中，微軟公司創(chuàng)始人比爾·蓋茨就提到了「智能體」的概念。但近三十年間，「智能體」的概念顯然發(fā)生了不小的變化，尤其是在 ChatGPT 之后基于大模型的「智能體」。

圖/ OpenAI

而時(shí)至今日，學(xué)術(shù)界對(duì)于「智能體」也沒有一個(gè)比較統(tǒng)一的定義。不過(guò)一般認(rèn)為，「智能體」是能夠自主感知環(huán)境、做出規(guī)劃、執(zhí)行任務(wù)的智能實(shí)體，不是「副駕駛」，而是主駕駛。

也可以用一個(gè)比較直觀的公式來(lái)表示：

Agent（智能體）= LLM（大模型）+Planning（規(guī)劃）+Feedback（反饋）+Tool use（工具使用）

以人類借助 ChatGPT 寫一篇文章為例，如果想要確保文章的質(zhì)量，我們通常需要先確定一個(gè)選題，然后讓 AI 輔助生成文章大綱，再通過(guò) AI 的搜索能力進(jìn)行分析、調(diào)研，然后再讓 AI 生成第一版，最后則是通過(guò)不斷地反饋優(yōu)化內(nèi)容，并得到最終的版本。

而 AI 智能體在大模型基礎(chǔ)上，通過(guò)自主的規(guī)劃、反饋和工具使用能力，進(jìn)一步減少了人工介入的操作。更具體來(lái)說(shuō)，AI 智能體能夠自主使用資料搜索、閱讀理解、數(shù)值計(jì)算等工具，再通過(guò)規(guī)劃「大綱——搜索、分析、調(diào)研——初稿——反饋再優(yōu)化」多步驟任務(wù)，實(shí)現(xiàn)「人類一句話，AI 跑斷腿」的效果。

簡(jiǎn)言之，AI 智能體通過(guò)迭代和對(duì)話式的模式工作，不再是簡(jiǎn)單的指令執(zhí)行者，而是能夠進(jìn)行自我反思、規(guī)劃和修正的參與者。

智能體是大模型上長(zhǎng)出的

“大家伙”

「智能體不僅會(huì)改變每個(gè)人與計(jì)算機(jī)交互的方式。它們還將顛覆軟件行業(yè)，帶來(lái)自我們從鍵入命令到點(diǎn)擊圖標(biāo)以來(lái)最大的計(jì)算革命?！?/span>

去年 11 月，比爾·蓋茨在其個(gè)人網(wǎng)站發(fā)布了一篇題為《AI 將徹底改變計(jì)算機(jī)使用方式》的博文，認(rèn)為 AI 智能體（AI Agent）將在未來(lái)五年顛覆人們使用計(jì)算機(jī)的方式。

堅(jiān)定看好 AI 智能體的人當(dāng)然不只是比爾·蓋茨。

吳恩達(dá)演講，圖/ YouTube

今年 3 月，斯坦福大學(xué)教授吳恩達(dá)指出，他們?cè)谘芯恐谢?GPT-3.5 構(gòu)建的智能體工作流在應(yīng)用中表現(xiàn)可以比 GPT-4 要好，基于 GPT-4 構(gòu)建的智能體工作流效果當(dāng)然還可以更好。由此他還表示，AI 智能體將在今年（2024 年）推動(dòng) AI 的大規(guī)模進(jìn)步：

甚至可能超過(guò)下一代基礎(chǔ)模型所帶來(lái)的影響。

到 7 月舉辦的世界人工智能大會(huì)上，基于大模型的智能體已經(jīng)成為了絕對(duì)的焦點(diǎn)。螞蟻集團(tuán)董事長(zhǎng)兼 CEO 井賢棟在演講中表示，從實(shí)踐來(lái)看，專業(yè)智能體是大模型落地嚴(yán)謹(jǐn)產(chǎn)業(yè)的有效路徑。百度創(chuàng)始人李彥宏更是明確表示，智能體是百度最看好的人工智能應(yīng)用發(fā)展方向。

同期，谷歌還推出了 AI 智能體平臺(tái) Oscar，讓開發(fā)者可以通過(guò)一定的配置就能生成各種的 AI 智能體。但類似的 AI 智能體平臺(tái)不只是谷歌一家：

百度文心有 AgentBuilder，字節(jié)跳動(dòng)有扣子（Coze）以及 HiAgent，阿里巴巴有百煉智能體和釘釘智能體，騰訊微信有云開發(fā) AI 智能體……智能體平臺(tái)逐漸開始成為大模型廠商的一種「標(biāo)配」。百度甚至還喊出了「人人都是開發(fā)者」的口號(hào)。

圖/扣子

可以說(shuō)，在經(jīng)歷 2023 年的思考和探索之后，AI 智能體在 2024 年已經(jīng)成為了人工智能行業(yè)的新共識(shí)。

智能體讓AI

從技術(shù)卷向場(chǎng)景

去年年底，OpenAI 推出了 GPTs 和 GPT 商店，允許用戶無(wú)需編碼就可創(chuàng)建自己版本的 GPT。但 GPTs 依然是充當(dāng)「副駕駛」的角色，只是多了更多個(gè)性化定制的可能，并不能將任務(wù)拆解，并且一步步推算和執(zhí)行。

事實(shí)上，今天很多標(biāo)榜為 AI Agent 的「智能體」，其實(shí)更多還是 ChatBot（聊天機(jī)器人），反倒是釘釘?shù)?AI 助理（英文名為 AI Agent）更接近實(shí)質(zhì)上的智能體。

如何判斷并不困難，核心在于在任務(wù)過(guò)程中人工的介入程度，以及大模型在規(guī)劃、決策上的參與程度，由此可以判斷一個(gè)名義上的「智能體」到底是更接近真的智能體，還是接近常規(guī)的 AI 聊天機(jī)器人。

圖/釘釘

但必須要指出，從「副駕駛」到「主駕駛」，當(dāng)下的智能體在技術(shù)上還有很大的進(jìn)步空間，并未能帶來(lái)顛覆性的體驗(yàn)。不過(guò)更重要的是未來(lái)，比起以聊天為交互形式的聊天機(jī)器人，AI 如果想要更深入生活、改變生活，就需要讓 AI 擁有更強(qiáng)的自主性。

理想情況下，AI 智能體能夠根據(jù)各種條件智能地作出決策和規(guī)劃。比如在制定旅游規(guī)劃的時(shí)候，可以自主搜索旅游的交通住宿以及各種旅游信息，并且充分考慮用戶的歷史偏好和習(xí)慣，查漏補(bǔ)缺進(jìn)行多次補(bǔ)充和修改。

又比如用戶在下班后夏夜里，即將拖著疲累的身心到家，AI 應(yīng)該可以根據(jù)汽車或者手機(jī)位置提前感知到，并根據(jù)位置和時(shí)間在不斷階段智能地打開空調(diào)、掃地機(jī)器人、燈光等設(shè)備。

就如同在蓋茨的構(gòu)想中，未來(lái)我們不再需要為不同的任務(wù)切換到不同的應(yīng)用中，需要用平常的語(yǔ)言告訴電腦和手機(jī)想做什么，而后根據(jù)用戶愿意分享的數(shù)據(jù)，智能體將個(gè)性化地作出反應(yīng)。

寫在最后

本質(zhì)上，智能體其實(shí)是在 AI 的基礎(chǔ)上借鑒人類的思考方式，構(gòu)建更加專業(yè)的推理和決策能力，以此提供更加智能化的用戶體驗(yàn)。所以在一定程度上，AI 智能體相比 ChatGPT 更進(jìn)了一步。

但可想而知的是，單一智能體無(wú)法滿足無(wú)數(shù)人的無(wú)數(shù)種需求，所以井賢棟認(rèn)為未來(lái)智能化的用戶體驗(yàn)需要很多的專業(yè)智能體共同參與、各司其職，李彥宏認(rèn)為未來(lái)將出現(xiàn)數(shù)百萬(wàn)量級(jí)的智能體。

下一個(gè)平臺(tái)的競(jìng)爭(zhēng)，勢(shì)不可擋。

而正如移動(dòng)時(shí)代的 App Store，伴隨智能體的興起，AI Agent Store 也在成為新的競(jìng)爭(zhēng)焦點(diǎn)。所以除了場(chǎng)景上的角力，對(duì)擁有基礎(chǔ)大模型的大廠來(lái)說(shuō)，生態(tài)更是智能體發(fā)展過(guò)程中核心之一，也是兵家必爭(zhēng)之地。

End