(Lilian Weng定義的Agent結(jié)構(gòu)圖) 智能體(AI Agent)=大模型(LLM)+記憶(Memory)+規(guī)劃(Planning)+工具使用(Tool Use) LLM(AI大模型)是Agent的大腦,屬于“中樞”模型,要求有以下3種能力: planning skills:對問題進(jìn)行拆解得到解決路徑,既進(jìn)行任務(wù)規(guī)劃 tool use:評估自己所需的工具,進(jìn)行工具選擇,并生成調(diào)用工具請求 memory:短期記憶包括工具的返回值,已經(jīng)完成的推理路徑;長期記憶包括可訪問的外部長期存儲,例如知識庫 斯坦福大學(xué)+谷歌頂尖學(xué)者發(fā)布的《Generative Agents: Interactive Simulacra of Human Behavior》中做了一個AI小鎮(zhèn),通過類似《模擬人生》的沙盒環(huán)境中里面內(nèi)置了25個Agent。 用戶可以觀察并干預(yù) Agent 規(guī)劃他們的日常、分享新聞、建立關(guān)系以及協(xié)調(diào)團(tuán)隊活動。這篇文章要解決的問題是如何創(chuàng)建能夠模擬人類行為的生成Agent,這些Agent可以在交互式應(yīng)用中使用,例如沉浸式環(huán)境、人際交流排練工具和原型設(shè)計工具。 架構(gòu)這篇論文提出了一種生成代理架構(gòu),用于解決人類行為模擬的問題。具體來說, 記憶流:首先,論文描述了一個長期記憶模塊,稱為記憶流,它以自然語言形式記錄代理的所有經(jīng)歷。記憶對象包括自然語言描述、創(chuàng)建時間戳和最近訪問時間戳。 檢索函數(shù):為了決定代理的下一步行動,論文實現(xiàn)了一個檢索函數(shù),該函數(shù)根據(jù)代理當(dāng)前的情況返回記憶流的一個子集。檢索函數(shù)考慮了三個主要組件: 新穎性:最近訪問的記憶對象得分較高。 重要性:代理認(rèn)為重要的記憶對象得分較高。 相關(guān)性:與當(dāng)前情況相關(guān)的記憶對象得分較高。 反思:其次,論文引入了反思的概念,這是一種更高級別的思維,由代理定期生成。反思通過將最新的記憶記錄作為查詢,并從語言模型中獲取相關(guān)記憶來生成。 規(guī)劃和反應(yīng):最后,論文描述了規(guī)劃和反應(yīng)的過程。規(guī)劃描述了代理未來的行動序列,幫助保持行為的一致性。反應(yīng)則是代理在感知到環(huán)境變化時采取的行動。對話生成則是基于代理之間的記憶來進(jìn)行的。 實驗論文通過在一個類似《模擬人生》的沙盒環(huán)境中實現(xiàn)生成代理來驗證其架構(gòu)。具體來說, 環(huán)境:沙盒環(huán)境被稱為Smallville,包含一個小鎮(zhèn),其中有25個獨特的代理。每個代理由一個簡單的精靈頭像表示,初始記憶包括一個自然語言描述的段落。 用戶控制:用戶可以通過自然語言與代理互動,指定一個角色來感知代理。用戶也可以直接命令一個代理,使其更像代理的“內(nèi)心聲音”。 環(huán)境交互:代理在沙盒世界中移動和與環(huán)境中的對象互動。用戶可以改變代理的環(huán)境狀態(tài),例如將廚房爐子從“開啟”改為“燃燒”。 結(jié)果可控評估:在可控評估中,論文通過“采訪”代理來測試其在自我認(rèn)知、記憶、計劃、反應(yīng)和反思方面的能力。結(jié)果表明,完整的生成代理架構(gòu)生成的行為最為可信,而移除某個組件后性能會下降。 端到端評估:在端到端評估中,論文觀察了25個代理在兩天內(nèi)的自發(fā)行為。結(jié)果顯示,代理之間形成了信息傳播、關(guān)系建立和協(xié)調(diào)。具體來說,關(guān)于Sam市長競選的信息傳播范圍從1人(4%)增加到8人(32%),關(guān)于Isabella情人節(jié)派對的信息傳播范圍從1人(4%)增加到13人(52%)。 總結(jié)智能體(AI Agent)可以比喻為一部高效運作的智能機(jī)器人。這部機(jī)器人由以下幾個核心部件組成: 大語言模型(LLM):相當(dāng)于機(jī)器人的大腦。它負(fù)責(zé)處理和理解語言信息,就像人類大腦處理思考、理解和溝通一樣。大語言模型使得機(jī)器人能夠理解指令、回答問題并與人類進(jìn)行流暢的對話。 記憶(Memory):相當(dāng)于機(jī)器人的存儲系統(tǒng)。它允許機(jī)器人記住過去的交互和經(jīng)驗,以便在未來的任務(wù)中加以利用。就像人類根據(jù)記憶來做出決策一樣,智能體通過記憶來提高其處理問題的能力。 規(guī)劃(Planning):相當(dāng)于機(jī)器人的導(dǎo)航系統(tǒng)。它幫助機(jī)器人制定行動方案,以實現(xiàn)既定目標(biāo)。就像我們在旅行前規(guī)劃路線一樣,智能體通過規(guī)劃來確定如何執(zhí)行任務(wù)。 工具使用(Tool Use):相當(dāng)于機(jī)器人的雙手。它使得機(jī)器人能夠使用各種工具來輔助完成任務(wù)。就像人類使用工具來提高工作效率一樣,智能體通過使用工具來擴(kuò)展其功能,解決更復(fù)雜的問題。 所以智能體(AI Agent)就像一個具備高級認(rèn)知能力、豐富經(jīng)驗、出色規(guī)劃和實際操作能力的智能機(jī)器人,能夠高效地完成各種復(fù)雜任務(wù)。 |
|
來自: 邸彥強(qiáng) > 《大模型》