一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

Google總監(jiān)提出生成式AI應(yīng)用架構(gòu)和成熟度模型,一步步指導(dǎo)進(jìn)階

 黃爸爸好 2024-06-01 發(fā)布于上海

隨著大模型技術(shù)的日漸成熟,應(yīng)用已從原型演示向企業(yè)級(jí)落地過渡。之前,我們也多次介紹過有關(guān)諸如高級(jí)RAG等生產(chǎn)級(jí)技術(shù)(LlamaIndex官方年度巨獻(xiàn):高清大圖縱覽高級(jí) RAG技術(shù),強(qiáng)烈推薦收藏),但缺少類似于MLOPS成熟度這樣的評(píng)估體系,無法衡量一個(gè)應(yīng)用在企業(yè)級(jí)層面達(dá)到了何種水平。

今天,筆者介紹Google AI/ML和GenAI總監(jiān)Ali Arsanjani提出的端到端生成式AI應(yīng)用架構(gòu)以及其成熟度的分級(jí)。

圖片

如圖可見,它將其分為UI/UX(自然語言對(duì)話交互)、Prompt Engineering(提示工程)、RAG 、Serve(服務(wù))、Adapt(適配)、Prepare & Tune Data & Models(數(shù)據(jù)準(zhǔn)備&模型微調(diào))、Ground(閉環(huán)反饋、持續(xù)監(jiān)控)、Multi-agent系統(tǒng)、Govern(倫理&合規(guī))、MLOps、Secure、Run(計(jì)算平臺(tái))等部分。

同時(shí),成熟度模型便是基于這些模塊的有無和成熟程度展開。

圖片

生成式AI應(yīng)用的成熟度是一個(gè)漸進(jìn)的過程,如上圖展示了生成式AI解決方案在基于復(fù)雜度及ROI層面從L0一直到L6的七個(gè)成熟度。涵蓋了從基本數(shù)據(jù)準(zhǔn)備和模型選擇開始,到微調(diào)、評(píng)估,最終達(dá)到多智能體系統(tǒng)、高級(jí)推理和負(fù)責(zé)任的人工智能實(shí)踐的高級(jí)階段。

以下是各個(gè)階段的詳細(xì)解讀。

L0: 數(shù)據(jù)準(zhǔn)備 

這個(gè)階段主要集中于獲取或創(chuàng)建所需要的高質(zhì)量數(shù)據(jù)集,包括數(shù)據(jù)的收集、清理、預(yù)處理、獲取使用授權(quán)、生成合成數(shù)據(jù),以及進(jìn)行數(shù)據(jù)工程和數(shù)據(jù)轉(zhuǎn)換的相關(guān)活動(dòng)。

L1: 選擇模型與提示并部署模型 

處于這個(gè)階段的企業(yè)已經(jīng)確定了合適的模型,并正在編寫有效的提示與它們交互。他們還能夠通過提示工程來引導(dǎo)模型執(zhí)行特定任務(wù),需要注意的是,相同的提示在不同的大語言模型上,可能不會(huì)產(chǎn)生相同的效果。 

模型選擇、提示工程和信息檢索:

這一過程首先是根據(jù)特定任務(wù)選擇合適的大語言模型,并用專有數(shù)據(jù)進(jìn)行微調(diào)。有效的提示工程能夠指導(dǎo)模型的行為,信息檢索機(jī)制則從內(nèi)部知識(shí)庫中提取相關(guān)信息。這個(gè)檢索步驟通常依靠企業(yè)搜索功能,使模型能夠訪問組織內(nèi)部資源中的相關(guān)文檔和數(shù)據(jù)。需要注意的是,上下文學(xué)習(xí)和多次學(xué)習(xí)可以為模型調(diào)優(yōu)提供有益幫助。詳見模型調(diào)優(yōu)部分。

L2:檢索增強(qiáng):通過信息檢索優(yōu)化提示 

在之前的基礎(chǔ)上,本階段通過生成式 AI (GenAI) 模型檢索相關(guān)信息,從而提高交互的復(fù)雜性,以便提取特定的見解或數(shù)據(jù)。此階段的重點(diǎn)是使用專有或特定領(lǐng)域的數(shù)據(jù)對(duì)生成式 AI 模型進(jìn)行微調(diào),以提高性能并更好地滿足特定需求。檢索增強(qiáng)生成 (Retrieval Augmented Generation, RAG) 框架結(jié)合了信息檢索系統(tǒng)和大語言模型 (LLM),以生成更準(zhǔn)確和信息量更大的響應(yīng)。根據(jù)檢索和集成機(jī)制的復(fù)雜性,RAG 可以分為不同級(jí)別。在初步從內(nèi)部資源檢索信息之后,RAG 會(huì)利用外部搜索功能,這包括查詢外部知識(shí)庫、網(wǎng)絡(luò)和其他相關(guān)資源,以收集更多信息,增強(qiáng)生成輸出的準(zhǔn)確性和上下文。內(nèi)部和外部搜索的結(jié)合確保了對(duì)主題的全面理解。需要指出的是,檢索增強(qiáng)本身有不同層次的復(fù)雜性。

L2.1:簡單檢索和生成 

在這個(gè)基本級(jí)別,檢索增強(qiáng)生成(RAG)會(huì)根據(jù)用戶的查詢,從知識(shí)庫或語料庫中檢索相關(guān)文檔或段落。檢索到的信息會(huì)直接傳遞給大語言模型(LLM),LLM 將這些內(nèi)容作為上下文生成響應(yīng)。這種方法比較簡單,但由于完全依賴于 LLM 理解和綜合信息的能力,因此結(jié)果可能不總是最準(zhǔn)確或最相關(guān)。

L2.2:上下文檢索和生成(Contextual Retrieval and Generation)

這個(gè)級(jí)別引入了更復(fù)雜的檢索機(jī)制,能夠考慮用戶查詢的上下文。它不僅依賴關(guān)鍵字匹配,還可能使用語義搜索或查詢擴(kuò)展等技術(shù)來找到更相關(guān)的信息。檢索到的信息會(huì)在傳遞給 LLM 之前經(jīng)過過濾和排名,以確保最佳相關(guān)性和重要性。這有助于提高生成響應(yīng)的質(zhì)量,使其更加集中和上下文相關(guān)。

L2.3:動(dòng)態(tài)檢索和生成(Dynamic Retrieval and Generation)

這一級(jí)別在生成過程中動(dòng)態(tài)檢索信息更進(jìn)一步。LLM 不再一次性獲取所有信息,而是可以在生成過程中根據(jù)需要反復(fù)請(qǐng)求更多信息,從而生成更加全面和準(zhǔn)確的響應(yīng)。這種方法允許對(duì)話更加互動(dòng)和細(xì)致,LLM 可以主動(dòng)尋找額外的信息,解決模糊點(diǎn)或填補(bǔ)知識(shí)空白。

L2.4:多源檢索和生成(Multi-Source Retrieval and Generation)

這一高級(jí)別涉及從多個(gè)來源檢索信息,例如不同的知識(shí)庫、數(shù)據(jù)庫,甚至實(shí)時(shí)數(shù)據(jù)流。挑戰(zhàn)在于如何有效整合這些不同來源的信息,它們可能具有不同的格式、結(jié)構(gòu)或可靠性。需要復(fù)雜的檢索和融合技術(shù),以確保生成的響應(yīng)是連貫、準(zhǔn)確且最新的。

L2.5:知識(shí)感知生成(Knowledge-Aware Generation)

在這個(gè)最高級(jí)別,RAG 結(jié)合了知識(shí)圖譜或其他結(jié)構(gòu)化知識(shí)表示,以增強(qiáng) LLM 對(duì)檢索信息的理解。這使得 LLM 能夠推理檢索到的知識(shí),識(shí)別概念間的關(guān)系,并生成更加有見地的響應(yīng)。這種方法特別適用于需要深入領(lǐng)域知識(shí)或復(fù)雜推理能力的任務(wù)。

L3:使用特定領(lǐng)域數(shù)據(jù)微調(diào)模型

在這一階段,通過使用參數(shù)高效微調(diào)、人類反饋強(qiáng)化學(xué)習(xí)(RLHF)、監(jiān)督微調(diào)(SFT)或完全微調(diào)(FFT)來進(jìn)行模型調(diào)整。這些方法的復(fù)雜度和應(yīng)用范圍會(huì)隨著成熟度的提高而變化。這使得模型可以基于特定行業(yè)或領(lǐng)域的數(shù)據(jù)進(jìn)行訓(xùn)練。每個(gè)企業(yè)都有自己多年積累的私有領(lǐng)域數(shù)據(jù),這些數(shù)據(jù)在該垂直領(lǐng)域內(nèi)具有獨(dú)特的價(jià)值。另一方面,也要通過訓(xùn)練模型,使其熟悉特定領(lǐng)域如零售、醫(yī)療保健、金融服務(wù)等行業(yè)所包含的術(shù)語及相關(guān)知識(shí)。

微調(diào) AI 模型的方法多種多樣,復(fù)雜性和應(yīng)用范圍各不相同,從簡單的上下文調(diào)整到高級(jí)的強(qiáng)化學(xué)習(xí)。

以下是按照成熟度和復(fù)雜性排列的詳細(xì)方法概述:

3.1. 上下文學(xué)習(xí)(In-Context Learning,ICL)

成熟度水平:基礎(chǔ) 
相對(duì)成本:低 
所需數(shù)據(jù)量:最小(零樣本或少樣本例子)
描述:模型完全基于在提示中提供的上下文進(jìn)行預(yù)測(cè),而無需更新其參數(shù)。它依賴于在其預(yù)訓(xùn)練階段獲得的知識(shí)。

用例:基于給定例子或提示,快速高效地生成文本或其他輸出。適合需要快速適應(yīng)而無需重新訓(xùn)練整個(gè)模型的場景。

3.2. Multi-shot (使用大上下文窗口)

成熟度水平:中級(jí) 
相對(duì)成本:適中 
所需數(shù)據(jù)量:最小到適中(少樣本到多樣本的例子與廣泛的上下文)
描述:這種方法通過利用非常大的上下文窗口來構(gòu)建標(biāo)準(zhǔn)的在上下文中學(xué)習(xí)。它使模型能夠處理來自提示和周圍文本的大量信息。這不僅提高了對(duì)復(fù)雜任務(wù)的理解,還允許Multi-shot在上下文中學(xué)習(xí),模型可以學(xué)習(xí)上下文窗口中提供的多個(gè)示例。
用例:適合需要深入上下文理解的任務(wù),例如:
  • 長篇本文生成

  • 復(fù)雜的問題回答

  • 文檔摘要

  • 多步驟推理任務(wù)

  • 多個(gè)例子可以指導(dǎo)模型輸出的任務(wù)

DeepMind 對(duì)“Many-Shot In-Context Learning”的研究表明,在上下文窗口中提供的示例數(shù)量增加時(shí)顯示出顯著的性能提升。這突出了利用大上下文窗口的潛力,不僅僅是為了提高理解,還為了使模型能夠有效地從多個(gè)演示中學(xué)習(xí)。

3.3. 小型語言模型的預(yù)訓(xùn)練 

成熟度水平:中級(jí) 

相對(duì)成本:適中 

所需數(shù)據(jù)量:適中到大(取決于模型大小和所需性能) 

描述:這涉及從零開始訓(xùn)練較小的語言模型,或在有限數(shù)量的數(shù)據(jù)上訓(xùn)練。這些模型通常用于特定應(yīng)用,其中大型通用模型不切實(shí)際,因?yàn)橛?jì)算限制或領(lǐng)域特定要求。

用例:用于專門領(lǐng)域的任務(wù),這些領(lǐng)域具有特定詞匯或有限的計(jì)算資源。也可以用作進(jìn)一步微調(diào)或適應(yīng)的基礎(chǔ)。

3.4. 適配器調(diào)整(Adaptor Tuning)

成熟度水平:中級(jí) 
相對(duì)成本:低到適中 
所需數(shù)據(jù)量:小到適中(特定于任務(wù)的數(shù)據(jù)) 
描述:這種技術(shù)在預(yù)訓(xùn)練的語言模型中引入了小型、可訓(xùn)練的適配器模塊。這些模塊專門設(shè)計(jì)為在新任務(wù)上進(jìn)行微調(diào),同時(shí)保持大部分原始模型參數(shù)凍結(jié)。這導(dǎo)致了高效的特定于任務(wù)的改編,計(jì)算開銷很小[4]。

用例:非常適合借助有限資源將大模型適應(yīng)于特定任務(wù)。保持原始模型的效率和知識(shí),同時(shí)允許快速和有針對(duì)性的微調(diào)。

3.5. 低秩適應(yīng)(LoRA) 

成熟度水平:中級(jí)到高級(jí) 

相對(duì)成本:適中 

所需數(shù)據(jù)量:小到適中(特定于任務(wù)的數(shù)據(jù)) 

描述:LoRA 通過調(diào)整其權(quán)重矩陣的低秩逼近來微調(diào)模型。這大大減少了可訓(xùn)練參數(shù)的數(shù)量,使其比全部微調(diào)的效率要高得多。

用例:適用于各種任務(wù),包括自然語言處理和計(jì)算機(jī)視覺,在這些任務(wù)中你需要將大模型適應(yīng)于特定任務(wù),而不會(huì)產(chǎn)生訓(xùn)練所有參數(shù)的全部計(jì)算成本。

3.6. 其他參數(shù)高效的微調(diào)方法 

成熟度水平:中級(jí)到高級(jí) 

相對(duì)成本:適中 
所需數(shù)據(jù)量:小到適中(特定于任務(wù)的數(shù)據(jù)) 
描述:這一類別包括了幾種技術(shù),如prefix-tuning, prompt-tuning, and bitfit。它們都旨在通過調(diào)整模型的一小部分參數(shù)或輸入來微調(diào)模型,顯著減少了計(jì)算負(fù)擔(dān)。

用例:非常適合快速適應(yīng)新任務(wù)或計(jì)算資源有限的場景。這些方法在高效性和調(diào)整模型行為能力之間提供了一個(gè)平衡。

3.7. 領(lǐng)域特定的預(yù)訓(xùn)練 

成熟度水平:高級(jí) 
相對(duì)成本:高 
所需數(shù)據(jù)量:大(特定于領(lǐng)域的語料庫) 
描述:這涉及在特定領(lǐng)域(例如,法律、醫(yī)療或金融)的大型文本語料庫上預(yù)訓(xùn)練模型。這有助于模型捕獲該領(lǐng)域獨(dú)特的細(xì)微差別、詞匯和知識(shí)結(jié)構(gòu)。

用例:在通用模型可能缺乏必要領(lǐng)域?qū)I(yè)知識(shí)的專業(yè)領(lǐng)域極其寶貴??梢宰鳛檫M(jìn)一步微調(diào)或適應(yīng)該領(lǐng)域內(nèi)的起點(diǎn)。

3.8. 監(jiān)督微調(diào) 

成熟度水平:高級(jí)
相對(duì)成本:高 
所需數(shù)據(jù)量:大(標(biāo)記的特定于任務(wù)的數(shù)據(jù)) 
描述:這是經(jīng)典的微調(diào)方法,即整個(gè)模型在特定任務(wù)的標(biāo)記數(shù)據(jù)集上進(jìn)行訓(xùn)練。所有模型參數(shù)都更新以優(yōu)化其在該任務(wù)上的性能。

用例:適用于有大量標(biāo)記數(shù)據(jù)的任務(wù),如文本分類、情感分析、命名實(shí)體識(shí)別和問題回答。

3.9. 全參數(shù)微微調(diào) 

成熟度水平:高級(jí) 
相對(duì)成本:非常高 
所需數(shù)據(jù)量:大到非常大(標(biāo)記的特定于任務(wù)的數(shù)據(jù)) 
描述:這種方法是微調(diào)的最廣泛形式,在新任務(wù)特定數(shù)據(jù)集上訓(xùn)練期間調(diào)整預(yù)訓(xùn)練模型的所有參數(shù)。

用例:通常保留給在特定任務(wù)上的最大性能至關(guān)重要的情況,并且你能夠使用大量的計(jì)算資源和大型高質(zhì)量數(shù)據(jù)集。

3.10. 指令微調(diào)

成熟度水平:高級(jí) 
相對(duì)成本:高到非常高 
所需數(shù)據(jù)量:大(多樣化的基于指導(dǎo)的數(shù)據(jù)集)
描述:這種方法涉及對(duì)模型進(jìn)行微調(diào),以便遵循廣泛的指導(dǎo)并完成各種任務(wù)。模型在包含指導(dǎo)及其相應(yīng)期望輸出的多樣化數(shù)據(jù)集上進(jìn)行訓(xùn)練。

用例:增強(qiáng)模型理解和執(zhí)行復(fù)雜指導(dǎo)的能力,使其適合通用人工智能助手、聊天機(jī)器人和其他需要靈活任務(wù)執(zhí)行的應(yīng)用程序。

3.11. 結(jié)合人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)

成熟度水平:前沿 
相對(duì)成本:非常高 
所需數(shù)據(jù)量:可變,但往往大(人類反饋數(shù)據(jù)) 
描述:RLHF 結(jié)合了強(qiáng)化學(xué)習(xí)技術(shù)和人類用戶的反饋。模型通過根據(jù)其行為和所收到的反饋接收獎(jiǎng)勵(lì)或懲罰來學(xué)習(xí),旨在根據(jù)人類偏好優(yōu)化其行為[10]。

用例:在人類偏好至關(guān)重要的情況下應(yīng)用,如對(duì)話代理、推薦系統(tǒng)和其他直接與用戶互動(dòng)的應(yīng)用程序。

3.12. 直接優(yōu)先級(jí)優(yōu)化(DPO) 

成熟度水平:實(shí)驗(yàn)性 
相對(duì)成本:非常高
所需數(shù)據(jù)量:可變(用戶偏好數(shù)據(jù)) 
描述:DPO 專注于根據(jù)用戶的反饋和偏好直接優(yōu)化模型。這通常涉及技術(shù),如梯度下降來調(diào)整模型的參數(shù),使其與觀察到的用戶偏好保持一致[10]。

用例:特別適合用戶滿意度至關(guān)重要的應(yīng)用程序,偏好可以直接測(cè)量和優(yōu)化。示例包括個(gè)性化內(nèi)容推薦系統(tǒng)和用戶界面設(shè)計(jì)。

3.13. 多任務(wù)微調(diào)

成熟度水平:高級(jí) 
相對(duì)成本:高到非常高 
所需數(shù)據(jù)量:大(多個(gè)任務(wù)的標(biāo)記數(shù)據(jù)) 
描述:在多任務(wù)微調(diào)中,模型同時(shí)在多個(gè)相關(guān)任務(wù)上進(jìn)行訓(xùn)練。這允許模型在任務(wù)之間利用共享的知識(shí)和表示,可能導(dǎo)致性能和泛化能力的提高[11]。

用例:在場景中特別有益,模型需要在多種任務(wù)上表現(xiàn)良好,例如多領(lǐng)域客戶服務(wù)機(jī)器人或需要理解語言的各個(gè)方面的模型(例如,情感分析、問題回答和文本摘要)。

3.14. 元學(xué)習(xí)(學(xué)會(huì)學(xué)習(xí)) 

成熟度水平:前沿 
相對(duì)成本:非常高 
所需數(shù)據(jù)量:可變,通常大(元訓(xùn)練數(shù)據(jù))
描述:元學(xué)習(xí)專注于培訓(xùn)模型,使其能夠通過最少的數(shù)據(jù)快速適應(yīng)新任務(wù)。它涉及在培訓(xùn)階段對(duì)模型在各種任務(wù)上進(jìn)行訓(xùn)練,使其學(xué)會(huì)高效學(xué)習(xí)。

用例:在模型需要快速適應(yīng)少量示例的新任務(wù)或領(lǐng)域的情況下特別相關(guān),例如少樣本學(xué)習(xí)場景或個(gè)性化學(xué)習(xí)系統(tǒng)。

3.15. 主動(dòng)學(xué)習(xí) 

成熟度水平:高級(jí) 
相對(duì)成本:高到非常高 
所需數(shù)據(jù)量:可變,通常迭代(最初較小,隨著模型查詢更多數(shù)據(jù)而增長) 
描述:主動(dòng)學(xué)習(xí)涉及模型積極選擇最具信息量的數(shù)據(jù)點(diǎn)進(jìn)行標(biāo)記,從而優(yōu)化微調(diào)過程[13]。

用例:在標(biāo)記數(shù)據(jù)昂貴或耗時(shí)的情況下極其寶貴。通過專注于最相關(guān)的示例,主動(dòng)學(xué)習(xí)可以顯著減少有效微調(diào)所需的標(biāo)記數(shù)據(jù)量。

3.16 知識(shí)蒸餾(Knowledge Distillation) 

成熟度等級(jí):中高級(jí)
成本開銷:中到高 
數(shù)據(jù)需求量:中到大 
描述:這是一種將從大型、預(yù)先訓(xùn)練的教師模型中的知識(shí)轉(zhuǎn)移至一個(gè)體積更小、效率更高的學(xué)生模型(student model)的技術(shù) [14]。 

應(yīng)用場景:特別適用于在存儲(chǔ)和計(jì)算資源有限的設(shè)備上部署模型,如手機(jī)或邊緣計(jì)算設(shè)備,同時(shí)保持較好的性能。

這些方法每一種都相較前一種在復(fù)雜性和資源需求上更進(jìn)一步,涵蓋了從簡單的上下文調(diào)整到包含人類反饋及廣泛參數(shù)調(diào)整的高級(jí)技巧。選擇適合的方法主要基于任務(wù)的特定需求、可用的資源和預(yù)期達(dá)到的性能標(biāo)準(zhǔn)。

L4 :通過搜索和引用來實(shí)現(xiàn)模型輸出的基礎(chǔ)驗(yàn)證

除了模型微調(diào),此級(jí)別還包含了生成式 AI (GenAI) 輸出的基礎(chǔ)驗(yàn)證和評(píng)估。也就是說,需要確保生成的內(nèi)容在事實(shí)上是準(zhǔn)確的、相關(guān)的,并符合倫理標(biāo)準(zhǔn)。

在生成式 AI 成熟度模型的第四級(jí),融合了多項(xiàng)能力以確保通過一個(gè)堅(jiān)固的基礎(chǔ)驗(yàn)證和評(píng)估流程來提升生成輸出的質(zhì)量和可靠性,此過程得到了內(nèi)部企業(yè)搜索及使用 Vertex AI 基礎(chǔ)驗(yàn)證服務(wù)的外部類似 Google 的搜索的增強(qiáng)。

基礎(chǔ)驗(yàn)證與評(píng)估:無論是來自內(nèi)部還是外部的信息,都將經(jīng)過徹底的基礎(chǔ)驗(yàn)證和評(píng)估過程。這包括驗(yàn)證事實(shí)的準(zhǔn)確性,識(shí)別潛在的偏誤并評(píng)估信息對(duì)生成輸出的相關(guān)性。Vertex AI 基礎(chǔ)驗(yàn)證服務(wù)在這一步中扮演了重要角色,因?yàn)樗鼮樗眯畔⑻峁┝艘煤蛥⒖嘉墨I(xiàn),增加了生成內(nèi)容的信譽(yù)度和透明度。

基礎(chǔ)驗(yàn)證后的優(yōu)化:經(jīng)過基礎(chǔ)驗(yàn)證和評(píng)估過程后,大語言模型 (LLM) 可能會(huì)根據(jù)收到的反饋調(diào)整生成的輸出。這一調(diào)整過程確保了最終的輸出不僅準(zhǔn)確、相關(guān),而且有可信源頭的支持。

模型服務(wù)化:最終,這些經(jīng)過優(yōu)化和驗(yàn)證的模型被提供給用戶或集成到應(yīng)用程序中,提供的是基于已驗(yàn)證信息的可靠且富有見解的回應(yīng)。

內(nèi)部企業(yè)搜索通過快速識(shí)別組織內(nèi)部知識(shí)庫的相關(guān)文件、數(shù)據(jù)和信息來輔助驗(yàn)證生成輸出,提供了一個(gè)寶貴的出發(fā)點(diǎn),從公司特定的知識(shí)和專業(yè)背景出發(fā)來確立生成輸出的基礎(chǔ)。例如 Vertex AI 基礎(chǔ)驗(yàn)證服務(wù)這樣的外部 Google 搜索模式則擴(kuò)大了信息檢索范圍,通過訪問大量外部資源來確保生成的輸出不僅限于組織內(nèi)部的知識(shí),還融合了來自更廣泛領(lǐng)域的最新信息和洞察。當(dāng)結(jié)合了這兩種搜索能力,生成式 AI 系統(tǒng)能夠從內(nèi)部和外部資源中尋找到引用和參考,增強(qiáng)了生成輸出的信用度和可靠性。這一基礎(chǔ)驗(yàn)證和評(píng)估流程保證了最終輸出不僅具有內(nèi)容價(jià)值,還是值得信賴和透明的。

L5:Agent系統(tǒng)

這個(gè)進(jìn)階階段引入了多智能體系統(tǒng),這里不單是一個(gè)生成式 AI (GenAI) 模型獨(dú)自工作,而是多個(gè) 生成式AI模型在一位中央大語言模型 (LLM) 的指揮下協(xié)同合作,處理需要協(xié)調(diào)和綜合多種能力的復(fù)雜任務(wù)。同時(shí),還特別強(qiáng)調(diào)了如何有效監(jiān)控和理解模型行為(可觀察性),以及如何將生成式 AI 模型的整個(gè)生命周期運(yùn)營化(LLM 運(yùn)維)。

在生成式 AI 成熟度模型的第5級(jí),多個(gè)關(guān)鍵能力結(jié)合,構(gòu)建了一個(gè)復(fù)雜的系統(tǒng),它為基于智能體和多智能體系統(tǒng)的發(fā)展奠定了基礎(chǔ)。

模型選擇、智能提示設(shè)計(jì)和信息檢索:一切從選擇一個(gè)適合特定任務(wù)的 LLM 開始,進(jìn)而通過專有數(shù)據(jù)對(duì)其進(jìn)行細(xì)致微調(diào)。高效的智能提示設(shè)計(jì)可以引導(dǎo)模型的行動(dòng),而信息檢索機(jī)制則能從多種來源抽取相關(guān)的信息,豐富 LLM 的知識(shí)庫。你可以運(yùn)用包括上下文學(xué)習(xí)、鏈?zhǔn)剿伎?、明確步驟的格式化,以及 XML 類結(jié)構(gòu)的高級(jí)智能提示設(shè)計(jì)技術(shù),甚至可以進(jìn)一步使用思考框架,結(jié)合評(píng)估 LLM 結(jié)果和基于觀察的輸出進(jìn)行推理再生成最終行動(dòng)的 ReAct 框架,以此達(dá)到更高層次的復(fù)雜性。

通過 LLM 編排:5級(jí)重要的創(chuàng)新之一是引入中心 LLM 作為協(xié)調(diào)者。它像指揮家一樣,編排其他模型或組件的行動(dòng),分配任務(wù),管理溝通,并將來自不同模型的輸出整合起來,構(gòu)建一個(gè)統(tǒng)一連貫的工作流。這標(biāo)志著邁向基于智能體系統(tǒng)的初步步驟,個(gè)別模型在這里扮演著專門的角色。

基礎(chǔ)驗(yàn)證和評(píng)估:繼上一級(jí)之后,繼續(xù)使用基礎(chǔ)驗(yàn)證來保障生成輸出的質(zhì)量和可靠性,運(yùn)用不同的機(jī)制對(duì)信息進(jìn)行驗(yàn)證并評(píng)估回應(yīng)的可能影響。評(píng)估過程則持續(xù)監(jiān)視系統(tǒng)性能,為不斷的優(yōu)化提供反饋。

評(píng)估、可觀察性和 LLMOPS:在此級(jí)別,為生成式 AI 參考架構(gòu)的每個(gè)部分引入了正式的和全面的可觀察性和評(píng)估機(jī)制。

這種對(duì)系統(tǒng)性能的持續(xù)評(píng)估和監(jiān)控對(duì)于生成式 AI 模型的不同部件至關(guān)重要,如提示、RAG輸出、模型調(diào)整的偏差或偏漂、基礎(chǔ)驗(yàn)證輸出等。可觀察性使我們能夠洞察 LLM 的行為,并對(duì)此進(jìn)行積極調(diào)整。LLMOPS則簡化了整個(gè)生成式 AI 基礎(chǔ)設(shè)施的部署、管理和監(jiān)控過程。

Agent系統(tǒng) vs MultiAgent系統(tǒng)

Agent系統(tǒng) :涉及單個(gè)大型語言模型 (LLM) 作為代理,執(zhí)行任務(wù),做出決策并與其環(huán)境交互。LLM 可以被視為具有多種功能的單一實(shí)體。

multiAgent系統(tǒng):從基于代理的系統(tǒng)發(fā)展而來,引入了多個(gè)專門的 LLM。每個(gè) LLM 作為一個(gè)獨(dú)立的代理,具有特定的角色或?qū)I(yè)知識(shí)。這些代理協(xié)作、溝通和協(xié)調(diào)他們的行動(dòng)來解決單個(gè)代理無法有效處理的復(fù)雜問題。

L5 作為邁向MultiAgent系統(tǒng)的基礎(chǔ),為編排多個(gè)模型奠定了基礎(chǔ)架構(gòu)。它使組織能夠嘗試將特定任務(wù)分配給不同的模型并評(píng)估其性能。這種實(shí)驗(yàn)為開發(fā)更復(fù)雜的MultiAgent系統(tǒng)鋪平了道路,在這些系統(tǒng)中,具有互補(bǔ)技能的不同模型可以協(xié)同工作以實(shí)現(xiàn)共同目標(biāo)。

L6:多智能體倍增器

在 AI 領(lǐng)域的最高成就之一,就是應(yīng)用如“思維樹 (Tree-of-Thought)”或“思維圖 (Graph-of-Thought)”這樣的尖端技術(shù),來提升生成式 AI(GenAI)模型的推理和規(guī)劃能力。這些方法為決策和解決問題提供了更為復(fù)雜且高級(jí)的途徑。在此級(jí)別,大語言模型(LLM)不僅自我指揮,還能控制其他 LLM,顯現(xiàn)出一個(gè)高度自主和能力強(qiáng)大的 GenAI 生態(tài)系統(tǒng)。此外,重點(diǎn)關(guān)注“負(fù)責(zé)任的 AI”,展現(xiàn)了對(duì) AI 技術(shù)倫理和公平使用的堅(jiān)定承諾。

L6反映了 GenAI 技術(shù)的顯著成熟,它巧妙地融合了尖端技術(shù)和架構(gòu),達(dá)到了產(chǎn)出高價(jià)值能力的目標(biāo)。

通過'思維樹(TOT)/思維圖(GOT)’強(qiáng)化推理能力:第 6 級(jí)充分利用了“思維樹 (ToT)”或“思維圖 (GoT)”架構(gòu)的力量。通過這些架構(gòu),LLM 能夠?qū)?fù)雜問題拆解為小而易管理的步驟,有系統(tǒng)地探索可能的解決方案,從而做出明智的決定,極大地增強(qiáng)了 GenAI 系統(tǒng)的推理、規(guī)劃和問題解決能力。

用DSPY和ReAct進(jìn)行主動(dòng)信息收集:L6 加入了像 DSPY(演示Demonstrate-搜索Search-預(yù)測(cè)Predict)和 ReAct(推理和行動(dòng))這樣的技術(shù)。DSPY 指導(dǎo) LLM 在何時(shí)尋找外部信息、預(yù)測(cè)相關(guān)查詢以及如何將檢索到的信息整合進(jìn)推理過程中。ReAct 則賦予 LLM 主動(dòng)與環(huán)境互動(dòng)的能力,依據(jù)收集到的信息進(jìn)行決策和行動(dòng)。

信息的檢索與融合:L6 采用先進(jìn)的信息檢索技術(shù),從不同來源(包括內(nèi)部知識(shí)庫和外部數(shù)據(jù)庫)獲取相關(guān)數(shù)據(jù),并將這些數(shù)據(jù)無縫融入到 LLM 的推理過程中,確保獲得的知識(shí)既最新又與上下文高度相關(guān)。

通過自定義數(shù)據(jù)調(diào)優(yōu)模型:通過專有或特定領(lǐng)域的數(shù)據(jù)對(duì) LLM 進(jìn)行精細(xì)調(diào)整,不僅優(yōu)化了其性能,也使其更適合特定的任務(wù)和領(lǐng)域需求。這保證了模型生成的響應(yīng)既準(zhǔn)確且與上下文高度貼切。

多智能體的協(xié)調(diào)與控制:L6 通過部署多智能體系統(tǒng),使得多個(gè) LLM 在一個(gè)中心 LLM 的指揮下協(xié)同工作,有效處理了那些需要協(xié)調(diào)、專業(yè)化處理和廣泛專業(yè)知識(shí)的復(fù)雜任務(wù)。

確?;A(chǔ)和評(píng)價(jià)的準(zhǔn)確性:采用嚴(yán)格的驗(yàn)證和評(píng)價(jià)機(jī)制,確保產(chǎn)出的內(nèi)容不僅事實(shí)準(zhǔn)確、高度相關(guān),還遵從倫理和安全準(zhǔn)則。這包括針對(duì)可靠來源的信息進(jìn)行核實(shí),并評(píng)估產(chǎn)出可能帶來的影響。

持續(xù)評(píng)估、可觀測(cè)性和運(yùn)維優(yōu)化:L6 特別注重對(duì) GenAI 系統(tǒng)性能的持續(xù)評(píng)估和監(jiān)控,深入了解其行為,及時(shí)進(jìn)行調(diào)整。采用了先進(jìn)的運(yùn)維實(shí)踐,簡化了 GenAI 基礎(chǔ)設(shè)施的部署、管理和監(jiān)控流程。

L6 通過將最前沿的技術(shù)手段和最佳實(shí)踐完美結(jié)合,讓 GenAI 系統(tǒng)在推理、決策與解決問題的能力上達(dá)到了前所未有的高度。這一全面的方法確保了系統(tǒng)的強(qiáng)大性、可靠性、倫理性,并能隨著需求的變化而適應(yīng)。

橫向與縱向領(lǐng)域

企業(yè)通過提升效率、生產(chǎn)力、客戶滿意度以及創(chuàng)新能力,可以顯著提高投資回報(bào)率(ROI)。為此,早期識(shí)別、測(cè)量、監(jiān)控并調(diào)整這些指標(biāo)和關(guān)鍵績效指標(biāo)(KPIs)至關(guān)重要。精細(xì)定義目標(biāo)、有效測(cè)量 KPIs 并持續(xù)調(diào)整戰(zhàn)略,對(duì)于在快速變化且不斷重組的商業(yè)環(huán)境中充分利用 GenAI 的潛力至關(guān)重要。

在橫向領(lǐng)域提高 ROI 的 GenAI 應(yīng)用 

所謂“橫向領(lǐng)域”,指的是那些貫穿不同行業(yè)和組織內(nèi)各業(yè)務(wù)單元的通用功能或流程。通過在這些領(lǐng)域應(yīng)用 GenAI,可以提升工作效率、生產(chǎn)力和整體投資回報(bào)。

  • 市場營銷與銷售:通過個(gè)性化客戶體驗(yàn)、生成精準(zhǔn)定向內(nèi)容、優(yōu)化營銷活動(dòng),提升客戶參與度、轉(zhuǎn)化率和銷售額。

  • 客戶服務(wù):利用 GenAI 驅(qū)動(dòng)的聊天機(jī)器人和虛擬助手,有效處理客戶咨詢、自動(dòng)化應(yīng)答并解決問題,提升客戶滿意度并降低支持成本。

  • 人力資源管理:簡化招聘流程、個(gè)性化員工入職體驗(yàn)、提供定制化學(xué)習(xí)和發(fā)展機(jī)會(huì),增強(qiáng)員工的參與感和生產(chǎn)力。

  • 財(cái)務(wù)與會(huì)計(jì):自動(dòng)化財(cái)務(wù)分析、識(shí)別異常和欺詐行為、優(yōu)化財(cái)務(wù)流程,提高準(zhǔn)確性、效率和風(fēng)險(xiǎn)控制水平。

  • 運(yùn)營與供應(yīng)鏈管理:優(yōu)化庫存管理、預(yù)測(cè)需求、簡化物流操作,從而降低成本、提高供應(yīng)鏈效率。

在縱向領(lǐng)域提高 ROI 的 GenAI 應(yīng)用 

“縱向領(lǐng)域”特指那些特定于某一行業(yè)或子行業(yè)的領(lǐng)域,需要針對(duì)每個(gè)行業(yè)的特定需求和挑戰(zhàn)定制解決方案。

在多個(gè)縱向領(lǐng)域部署 GenAI 同樣能夠有效推動(dòng) ROI。

  • 醫(yī)療保?。涸卺t(yī)學(xué)診斷、藥物發(fā)現(xiàn)和個(gè)性化治療計(jì)劃方面提供輔助,改善患者治療結(jié)果,降低醫(yī)療成本。

  • 金融:分析財(cái)務(wù)數(shù)據(jù)、預(yù)測(cè)市場趨勢(shì)、提出投資建議,改善決策制定和風(fēng)險(xiǎn)管理。

  • 零售:個(gè)性化商品推薦、優(yōu)化定價(jià)策略、增強(qiáng)購物體驗(yàn),提升銷售額和顧客忠誠度。

  • 制造業(yè):優(yōu)化生產(chǎn)流程、預(yù)知設(shè)備故障、提升質(zhì)量控制,降低成本、提高生產(chǎn)效率。

  • 教育:提供個(gè)性化學(xué)習(xí)體驗(yàn)、自動(dòng)化反饋和自適應(yīng)評(píng)估,提高學(xué)生的學(xué)習(xí)成果和參與感。

結(jié)束語及行動(dòng)呼吁 

理解組織、團(tuán)隊(duì)或個(gè)人當(dāng)前的成熟度和技術(shù)深度非常重要。接下來,確定目標(biāo)成熟度并發(fā)展必要的技能,滿足達(dá)到該成熟度所需的技術(shù)要求,實(shí)現(xiàn)定義好的商業(yè)影響和目標(biāo)。

組織可以規(guī)劃從當(dāng)前狀態(tài)到達(dá)目標(biāo)成熟度的路徑,通過構(gòu)建技能和能力、利用如 Google Cloud AI 這樣的

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多

    国产中文字幕一二三区| 中文字幕人妻av不卡| 99久久无色码中文字幕免费| 日本高清一道一二三区四五区 | 国产又粗又爽又猛又黄的 | 午夜久久精品福利视频| 好东西一起分享老鸭窝| 国产免费黄片一区二区| 亚洲国产成人久久99精品| 国产精品亚洲精品亚洲| 国产欧美日韩精品一区二区| 尤物久久91欧美人禽亚洲| 黄色在线免费高清观看| 视频一区二区三区自拍偷| 99秋霞在线观看视频| 国产精品欧美在线观看| 日韩精品免费一区二区三区| 亚洲欧美黑人一区二区| 午夜视频免费观看成人| 大香伊蕉欧美一区二区三区| 99热中文字幕在线精品| 国产欧美日韩综合精品二区| 欧美激情视频一区二区三区| 激情五月激情婷婷丁香| 国产丝袜女优一区二区三区| 国产精品免费福利在线| 欧美夫妻性生活一区二区| 黄色激情视频中文字幕| 国产精品免费视频久久| 日韩精品日韩激情日韩综合| 中文日韩精品视频在线| 欧美黑人巨大一区二区三区 | 熟女高潮一区二区三区| 激情三级在线观看视频| 亚洲黄色在线观看免费高清 | 亚洲综合伊人五月天中文| 久久精品少妇内射毛片| 国产又粗又猛又黄又爽视频免费| 亚洲国产精品一区二区| 十八禁日本一区二区三区| 香蕉尹人视频在线精品|