大家好,我是【同學小張】。持續學習,持續干貨輸出,關注我,跟我一起學AI大模型技術! 
本文為該課程的第二章(智能體綜述及多智能體框架介紹)筆記)。 0. 溫故而知新 - 再看 AI Agent 是什么前面文章已經介紹過我理解的 AI Agent 的概念。 再看這張經典的圖:  現在看來,中間的Agent應該換為LLM更為合適,而整張圖才能叫做Agent。也就是說:Agent是上圖中所有能力的集合,以LLM為大腦,來決定完成任務所需的步驟,規劃執行該使用哪些工具,該得到什么結果。再輔以記憶能力,讓整個過程像人一樣能夠自主決策,自主行動以自主達到目的。 1. 一個AI Agent實例介紹 - BabyAGI項目地址:https://github.com/yoheinakajima/babyagi/blob/main/README.md
其運行流程如下: (1)從任務列表中提取第一個任務 (2)將任務發送到執行代理(Execution Agent),該Agent使用LLM根據上下文完成任務。 (3)豐富結果并將其存儲在向量數據庫中 (4)創建新任務,并根據上一任務的目標和結果重新確定任務列表的優先級。 (5)重復以上步驟 其中涉及四個Agent,其中前三個Agent都利用了大模型的能力來進行任務規劃和總結: Execution Agent 接收目標和任務,調用大模型 LLM來生成任務結果。 Task Creation Agent 使用大模型LLM 根據目標和前一個任務的結果創建新任務。它的輸入是:目標,前一個任務的結果,任務描述和當前任務列表。 Prioritization Agent 使用大模型LLM對任務列表進行重新排序。它接受一個參數:當前任務的 ID Context Agent 使用向量存儲和檢索任務結果以獲取上下文。

運行起來后的過程可以參考這篇文章:babyagi: 人工智能任務管理系統https:///post/7218815501433946173 2. 多智能體框架比較對市面上多智能體框架了解的不多,目前為止,只用過 MetaGPT、AutoGPT,聽過AutoGen。想了解更多的,可以參考這篇文章 基于大語言模型的AI Agents—Part 3(https://www./article/ai-agent-part3),里面總結比較了常見的多智能體框架:  這里我只對MetaGPT和AutoGPT的使用感受做下比較和說明,自己的感受,個人觀點,歡迎批評指正。AutoGPT更多的是依賴大模型去進行規劃和行動,個人感覺有點過于依賴大模型的能力了。而目前而言,大模型的能力還遠沒有達到能自主規劃和決策行動的地步,這使得AutoGPT的執行結果非常地不可控,很難達到自己想要的效果。并且其是單智能體,能完成的工作相對比較簡單。接口也不太好用。 MetaGPT更多的是依賴事先定義好的SOP(標準作業流程),這使得任務的執行過程變得相對可控,最大限度的保證任務的正確執行。并且可以是多智能體,能執行的任務相對復雜。接口封裝也比較清晰。尤其是Team、Role和Action三個抽象,真的將Agent抽象為人。總結起來,MetaGPT的工作流程就像:SOP是制訂了一條標準化的流水線,然后Role是分布在流水線各個位置的打工人,大家各司其職,合作共贏。
3. 警告?Agent因為涉及到多個步驟,而且大模型的能力并沒有我們想象地那么強,如果不加限制,很容易陷入死循環… 這將是你財富的直接損失… 所以一定要謹慎。正如 BabyAGI里的警告: 
大家好,我是【同學小張】。持續學習,持續干貨輸出,關注我,跟我一起學AI大模型技術!
|