一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

全面解讀Agent,前OpenAI高管 斯坦福頂尖學(xué)者綜述

 邸彥強(qiáng) 2024-12-11

“探秘智能體,解讀未來智能?!?在人工智能的前沿領(lǐng)域,智能體(AI Agent)正逐漸成為焦點。它究竟是如何構(gòu)建的?又具備怎樣的能力?本文將深入解讀前 OpenAI 高管和斯坦福頂尖學(xué)者的綜述,為你揭開智能體的神秘面紗,展現(xiàn)其在模擬人類行為等方面的巨大潛力。

全面解讀Agent,前OpenAI高管+斯坦福頂尖學(xué)者綜述全面解讀Agent,前OpenAI高管+斯坦福頂尖學(xué)者綜述

(Lilian Weng定義的Agent結(jié)構(gòu)圖)

智能體(AI Agent)=大模型(LLM)+記憶(Memory)+規(guī)劃(Planning)+工具使用(Tool Use)

LLM(AI大模型)是Agent的大腦,屬于“中樞”模型,要求有以下3種能力:

planning skills:對問題進(jìn)行拆解得到解決路徑,既進(jìn)行任務(wù)規(guī)劃

tool use:評估自己所需的工具,進(jìn)行工具選擇,并生成調(diào)用工具請求

memory:短期記憶包括工具的返回值,已經(jīng)完成的推理路徑;長期記憶包括可訪問的外部長期存儲,例如知識庫

斯坦福大學(xué)+谷歌頂尖學(xué)者發(fā)布的《Generative Agents: Interactive Simulacra of Human Behavior》中做了一個AI小鎮(zhèn),通過類似《模擬人生》的沙盒環(huán)境中里面內(nèi)置了25個Agent。

全面解讀Agent,前OpenAI高管+斯坦福頂尖學(xué)者綜述

用戶可以觀察并干預(yù) Agent 規(guī)劃他們的日常、分享新聞、建立關(guān)系以及協(xié)調(diào)團(tuán)隊活動。這篇文章要解決的問題是如何創(chuàng)建能夠模擬人類行為的生成Agent,這些Agent可以在交互式應(yīng)用中使用,例如沉浸式環(huán)境、人際交流排練工具和原型設(shè)計工具。

架構(gòu)

這篇論文提出了一種生成代理架構(gòu),用于解決人類行為模擬的問題。具體來說,

記憶流:首先,論文描述了一個長期記憶模塊,稱為記憶流,它以自然語言形式記錄代理的所有經(jīng)歷。記憶對象包括自然語言描述、創(chuàng)建時間戳和最近訪問時間戳。

全面解讀Agent,前OpenAI高管+斯坦福頂尖學(xué)者綜述

檢索函數(shù):為了決定代理的下一步行動,論文實現(xiàn)了一個檢索函數(shù),該函數(shù)根據(jù)代理當(dāng)前的情況返回記憶流的一個子集。檢索函數(shù)考慮了三個主要組件:

新穎性:最近訪問的記憶對象得分較高。

重要性:代理認(rèn)為重要的記憶對象得分較高。

相關(guān)性:與當(dāng)前情況相關(guān)的記憶對象得分較高。

反思:其次,論文引入了反思的概念,這是一種更高級別的思維,由代理定期生成。反思通過將最新的記憶記錄作為查詢,并從語言模型中獲取相關(guān)記憶來生成。

全面解讀Agent,前OpenAI高管+斯坦福頂尖學(xué)者綜述

規(guī)劃和反應(yīng):最后,論文描述了規(guī)劃和反應(yīng)的過程。規(guī)劃描述了代理未來的行動序列,幫助保持行為的一致性。反應(yīng)則是代理在感知到環(huán)境變化時采取的行動。對話生成則是基于代理之間的記憶來進(jìn)行的。

全面解讀Agent,前OpenAI高管+斯坦福頂尖學(xué)者綜述

實驗

論文通過在一個類似《模擬人生》的沙盒環(huán)境中實現(xiàn)生成代理來驗證其架構(gòu)。具體來說,

環(huán)境:沙盒環(huán)境被稱為Smallville,包含一個小鎮(zhèn),其中有25個獨特的代理。每個代理由一個簡單的精靈頭像表示,初始記憶包括一個自然語言描述的段落。

全面解讀Agent,前OpenAI高管+斯坦福頂尖學(xué)者綜述

用戶控制:用戶可以通過自然語言與代理互動,指定一個角色來感知代理。用戶也可以直接命令一個代理,使其更像代理的“內(nèi)心聲音”。

環(huán)境交互:代理在沙盒世界中移動和與環(huán)境中的對象互動。用戶可以改變代理的環(huán)境狀態(tài),例如將廚房爐子從“開啟”改為“燃燒”。

結(jié)果

可控評估:在可控評估中,論文通過“采訪”代理來測試其在自我認(rèn)知、記憶、計劃、反應(yīng)和反思方面的能力。結(jié)果表明,完整的生成代理架構(gòu)生成的行為最為可信,而移除某個組件后性能會下降。

全面解讀Agent,前OpenAI高管+斯坦福頂尖學(xué)者綜述

端到端評估:在端到端評估中,論文觀察了25個代理在兩天內(nèi)的自發(fā)行為。結(jié)果顯示,代理之間形成了信息傳播、關(guān)系建立和協(xié)調(diào)。具體來說,關(guān)于Sam市長競選的信息傳播范圍從1人(4%)增加到8人(32%),關(guān)于Isabella情人節(jié)派對的信息傳播范圍從1人(4%)增加到13人(52%)。

全面解讀Agent,前OpenAI高管+斯坦福頂尖學(xué)者綜述

總結(jié)

智能體(AI Agent)可以比喻為一部高效運作的智能機(jī)器人。這部機(jī)器人由以下幾個核心部件組成:

大語言模型(LLM):相當(dāng)于機(jī)器人的大腦。它負(fù)責(zé)處理和理解語言信息,就像人類大腦處理思考、理解和溝通一樣。大語言模型使得機(jī)器人能夠理解指令、回答問題并與人類進(jìn)行流暢的對話。

記憶(Memory):相當(dāng)于機(jī)器人的存儲系統(tǒng)。它允許機(jī)器人記住過去的交互和經(jīng)驗,以便在未來的任務(wù)中加以利用。就像人類根據(jù)記憶來做出決策一樣,智能體通過記憶來提高其處理問題的能力。

規(guī)劃(Planning):相當(dāng)于機(jī)器人的導(dǎo)航系統(tǒng)。它幫助機(jī)器人制定行動方案,以實現(xiàn)既定目標(biāo)。就像我們在旅行前規(guī)劃路線一樣,智能體通過規(guī)劃來確定如何執(zhí)行任務(wù)。

工具使用(Tool Use):相當(dāng)于機(jī)器人的雙手。它使得機(jī)器人能夠使用各種工具來輔助完成任務(wù)。就像人類使用工具來提高工作效率一樣,智能體通過使用工具來擴(kuò)展其功能,解決更復(fù)雜的問題。

所以智能體(AI Agent)就像一個具備高級認(rèn)知能力、豐富經(jīng)驗、出色規(guī)劃和實際操作能力的智能機(jī)器人,能夠高效地完成各種復(fù)雜任務(wù)。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多

    日本一本不卡免费视频 | 国产91色综合久久高清| 在线播放欧美精品一区| 婷婷九月在线中文字幕| 国产在线不卡中文字幕| 欧美日韩欧美国产另类| 国产精品熟女在线视频| 成人精品视频在线观看不卡| 国产精品亚洲一级av第二区| 在线观看免费午夜福利| 极品熟女一区二区三区| 厕所偷拍一区二区三区视频| 丝袜诱惑一区二区三区| 丰满人妻一二三区av| 在线欧洲免费无线码二区免费| 大香蕉网国产在线观看av| 人妻乱近亲奸中文字幕| 国产精品久久精品毛片| 自拍偷拍福利视频在线观看| 亚洲视频在线观看免费中文字幕| 激情图日韩精品中文字幕| 日本一区二区三区久久娇喘| 国产欧美日韩视频91| 老司机这里只有精品视频| 精品亚洲av一区二区三区| 国内精品偷拍视频久久| 国产一区二区熟女精品免费| 麻豆tv传媒在线观看| 国产精品午夜福利免费阅读| 国产传媒精品视频一区| 亚洲天堂精品一区二区| 五月婷婷欧美中文字幕| 很黄很污在线免费观看| 午夜精品黄片在线播放| 欧美不雅视频午夜福利| 国产精品免费自拍视频| 亚洲a码一区二区三区| 欧美日韩国产的另类视频| 精品久久综合日本欧美| 亚洲欧美日产综合在线网| 久久99爱爱视频视频|