這兩天,備受矚目的 OpenAI 新項(xiàng)目又有了新消息。The Information 援引內(nèi)部消息報(bào)道稱,OpenAI 計(jì)劃最快將在今年秋天推出代號(hào)「草莓(Strawberry)」的全新 AI,其擁有前所未有的「推理」能力,可以處理復(fù)雜的數(shù)學(xué)和編程任務(wù),甚至還能體現(xiàn)在日常生活中的非技術(shù)問(wèn)題上。此外,報(bào)道還指出這項(xiàng)技術(shù)對(duì)未來(lái) AI 產(chǎn)品,特別是旨在解決多步驟任務(wù)的「智能體(Agent)」具有重要意義。在 2022 年年底 ChatGPT 大火之后,「智能體」很快就從故紙堆中一躍而出,引起整個(gè)行業(yè)的廣泛關(guān)注。而從開源項(xiàng)目 AutoGPT 到 OpenAI 官方推出的 GPTs 和 GPT 商店,作為「雛形」,也都在一定程度上展現(xiàn)了 AI 智能體的潛力與必要。但如果說(shuō)在 2023 年,人工智能行業(yè)的發(fā)展和競(jìng)爭(zhēng)更多還是聚焦在大模型本身,關(guān)于智能體探索才剛剛邁出第一步。那到了 2024 年,從 Google 到百度,從阿里巴巴、字節(jié)跳動(dòng)到 OpenAI,國(guó)內(nèi)外都在明顯加快了智能體落地的步伐。 但它到底什么? 如果平常關(guān)注 AI 領(lǐng)域,我相信讀者們一定不少看到或者聽到「智能體」這個(gè)詞。但智能體到底是什么?可能很難講清楚。事實(shí)上,在 1995 年出版的《未來(lái)之路》一書中,微軟公司創(chuàng)始人比爾·蓋茨就提到了「智能體」的概念。但近三十年間,「智能體」的概念顯然發(fā)生了不小的變化,尤其是在 ChatGPT 之后基于大模型的「智能體」。而時(shí)至今日,學(xué)術(shù)界對(duì)于「智能體」也沒有一個(gè)比較統(tǒng)一的定義。不過(guò)一般認(rèn)為,「智能體」是能夠自主感知環(huán)境、做出規(guī)劃、執(zhí)行任務(wù)的智能實(shí)體,不是「副駕駛」,而是主駕駛。也可以用一個(gè)比較直觀的公式來(lái)表示:Agent(智能體)= LLM(大模型)+Planning(規(guī)劃)+Feedback(反饋)+Tool use(工具使用)以人類借助 ChatGPT 寫一篇文章為例,如果想要確保文章的質(zhì)量,我們通常需要先確定一個(gè)選題,然后讓 AI 輔助生成文章大綱,再通過(guò) AI 的搜索能力進(jìn)行分析、調(diào)研,然后再讓 AI 生成第一版,最后則是通過(guò)不斷地反饋優(yōu)化內(nèi)容,并得到最終的版本。而 AI 智能體在大模型基礎(chǔ)上,通過(guò)自主的規(guī)劃、反饋和工具使用能力,進(jìn)一步減少了人工介入的操作。更具體來(lái)說(shuō),AI 智能體能夠自主使用資料搜索、閱讀理解、數(shù)值計(jì)算等工具,再通過(guò)規(guī)劃「大綱——搜索、分析、調(diào)研——初稿——反饋再優(yōu)化」多步驟任務(wù),實(shí)現(xiàn)「人類一句話,AI 跑斷腿」的效果。簡(jiǎn)言之,AI 智能體通過(guò)迭代和對(duì)話式的模式工作,不再是簡(jiǎn)單的指令執(zhí)行者,而是能夠進(jìn)行自我反思、規(guī)劃和修正的參與者。“大家伙” 「智能體不僅會(huì)改變每個(gè)人與計(jì)算機(jī)交互的方式。它們還將顛覆軟件行業(yè),帶來(lái)自我們從鍵入命令到點(diǎn)擊圖標(biāo)以來(lái)最大的計(jì)算革命?!?/span>去年 11 月,比爾·蓋茨在其個(gè)人網(wǎng)站發(fā)布了一篇題為《AI 將徹底改變計(jì)算機(jī)使用方式》的博文,認(rèn)為 AI 智能體(AI Agent)將在未來(lái)五年顛覆人們使用計(jì)算機(jī)的方式。堅(jiān)定看好 AI 智能體的人當(dāng)然不只是比爾·蓋茨。今年 3 月,斯坦福大學(xué)教授吳恩達(dá)指出,他們?cè)谘芯恐谢?GPT-3.5 構(gòu)建的智能體工作流在應(yīng)用中表現(xiàn)可以比 GPT-4 要好,基于 GPT-4 構(gòu)建的智能體工作流效果當(dāng)然還可以更好。由此他還表示,AI 智能體將在今年(2024 年)推動(dòng) AI 的大規(guī)模進(jìn)步:甚至可能超過(guò)下一代基礎(chǔ)模型所帶來(lái)的影響。到 7 月舉辦的世界人工智能大會(huì)上,基于大模型的智能體已經(jīng)成為了絕對(duì)的焦點(diǎn)。螞蟻集團(tuán)董事長(zhǎng)兼 CEO 井賢棟在演講中表示,從實(shí)踐來(lái)看,專業(yè)智能體是大模型落地嚴(yán)謹(jǐn)產(chǎn)業(yè)的有效路徑。百度創(chuàng)始人李彥宏更是明確表示,智能體是百度最看好的人工智能應(yīng)用發(fā)展方向。同期,谷歌還推出了 AI 智能體平臺(tái) Oscar,讓開發(fā)者可以通過(guò)一定的配置就能生成各種的 AI 智能體。但類似的 AI 智能體平臺(tái)不只是谷歌一家:百度文心有 AgentBuilder,字節(jié)跳動(dòng)有扣子(Coze)以及 HiAgent,阿里巴巴有百煉智能體和釘釘智能體,騰訊微信有云開發(fā) AI 智能體……智能體平臺(tái)逐漸開始成為大模型廠商的一種「標(biāo)配」。百度甚至還喊出了「人人都是開發(fā)者」的口號(hào)。可以說(shuō),在經(jīng)歷 2023 年的思考和探索之后,AI 智能體在 2024 年已經(jīng)成為了人工智能行業(yè)的新共識(shí)。從技術(shù)卷向場(chǎng)景 去年年底,OpenAI 推出了 GPTs 和 GPT 商店,允許用戶無(wú)需編碼就可創(chuàng)建自己版本的 GPT。但 GPTs 依然是充當(dāng)「副駕駛」的角色,只是多了更多個(gè)性化定制的可能,并不能將任務(wù)拆解,并且一步步推算和執(zhí)行。事實(shí)上,今天很多標(biāo)榜為 AI Agent 的「智能體」,其實(shí)更多還是 ChatBot(聊天機(jī)器人),反倒是釘釘?shù)?AI 助理(英文名為 AI Agent)更接近實(shí)質(zhì)上的智能體。如何判斷并不困難,核心在于在任務(wù)過(guò)程中人工的介入程度,以及大模型在規(guī)劃、決策上的參與程度,由此可以判斷一個(gè)名義上的「智能體」到底是更接近真的智能體,還是接近常規(guī)的 AI 聊天機(jī)器人。但必須要指出,從「副駕駛」到「主駕駛」,當(dāng)下的智能體在技術(shù)上還有很大的進(jìn)步空間,并未能帶來(lái)顛覆性的體驗(yàn)。不過(guò)更重要的是未來(lái),比起以聊天為交互形式的聊天機(jī)器人,AI 如果想要更深入生活、改變生活,就需要讓 AI 擁有更強(qiáng)的自主性。理想情況下,AI 智能體能夠根據(jù)各種條件智能地作出決策和規(guī)劃。比如在制定旅游規(guī)劃的時(shí)候,可以自主搜索旅游的交通住宿以及各種旅游信息,并且充分考慮用戶的歷史偏好和習(xí)慣,查漏補(bǔ)缺進(jìn)行多次補(bǔ)充和修改。又比如用戶在下班后夏夜里,即將拖著疲累的身心到家,AI 應(yīng)該可以根據(jù)汽車或者手機(jī)位置提前感知到,并根據(jù)位置和時(shí)間在不斷階段智能地打開空調(diào)、掃地機(jī)器人、燈光等設(shè)備。就如同在蓋茨的構(gòu)想中,未來(lái)我們不再需要為不同的任務(wù)切換到不同的應(yīng)用中,需要用平常的語(yǔ)言告訴電腦和手機(jī)想做什么,而后根據(jù)用戶愿意分享的數(shù)據(jù),智能體將個(gè)性化地作出反應(yīng)。寫在最后 本質(zhì)上,智能體其實(shí)是在 AI 的基礎(chǔ)上借鑒人類的思考方式,構(gòu)建更加專業(yè)的推理和決策能力,以此提供更加智能化的用戶體驗(yàn)。所以在一定程度上,AI 智能體相比 ChatGPT 更進(jìn)了一步。但可想而知的是,單一智能體無(wú)法滿足無(wú)數(shù)人的無(wú)數(shù)種需求,所以井賢棟認(rèn)為未來(lái)智能化的用戶體驗(yàn)需要很多的專業(yè)智能體共同參與、各司其職,李彥宏認(rèn)為未來(lái)將出現(xiàn)數(shù)百萬(wàn)量級(jí)的智能體。下一個(gè)平臺(tái)的競(jìng)爭(zhēng),勢(shì)不可擋。而正如移動(dòng)時(shí)代的 App Store,伴隨智能體的興起,AI Agent Store 也在成為新的競(jìng)爭(zhēng)焦點(diǎn)。所以除了場(chǎng)景上的角力,對(duì)擁有基礎(chǔ)大模型的大廠來(lái)說(shuō),生態(tài)更是智能體發(fā)展過(guò)程中核心之一,也是兵家必爭(zhēng)之地。
|