![]() 打開今日頭條查看圖片詳情 在第一篇《智能體:AI的下一場革命?》里,我們把Agent比作一位“個人助理”。今天,我們就把這位助理請上手術臺,拆開看看它到底靠什么“活”得這么像人。 別擔心,全程無血,只有例子和概念。讀完你會明白:Agent智能體就是一臺精密的“五件套”機器。 一臺自動咖啡機,它要:
Agent的五大模塊,跟自動咖啡機的邏輯幾乎一一對應。下面逐個拆。 01 感知模塊 – Agent的“眼睛和耳朵”感知模塊是智能體的“眼睛和耳朵”,負責從外部環境中收集各種信息,這是智能體與外界交互的第一步。它能看見什么?很多:
但是感知≠看懂。前陣子有博主測評剛剛推出的GPT-5,在“數圖中有多少個圓圈”這類任務上仍有錯誤率。可見,把像素變成意義,比人類想像的難。 中國科學院院刊2025年第3期《政策與管理研究》曾指出,英文多模態數據是中文的8倍左右,因此中文Agent的視覺“近視”更明顯。一句話,任何能塞進計算機0和1的東西,都能被Agent“感知”。 02 大腦/決策模塊 – Agent的“指揮官”神經科學里,海馬體負責記憶,額葉負責推理。LLM其實把兩者合并在了一起:
當智能體接收到用戶的任務指令后,LLM會對指令進行理解和分析。比如,用戶要求智能體寫一份行業報告,LLM會搜索最新趨勢→抓取競品數據→生成報告大綱→撰寫內容并排版。 然后,基于從海量數據中學習到的知識與經驗,LLM開始規劃在每一步中決定接下來做什么以及調用哪個工具。 ![]() 打開今日頭條查看圖片詳情 在推理過程中,LLM就會運用思維鏈等方法,將復雜問題分解為多個邏輯步驟,逐步推導得出解決方案。 順便提一下,大家都知道LLM有“幻覺”現象,即生成看似合理但與事實不符的內容。為了彌補這一不足,我們就會引入RAG、知識圖譜,為大語言模型提供更準確、結構化的知識支持,從而提升其決策的準確性與可靠性。 一句話:LLM在此并非直接“回答”問題,而是扮演“規劃師”和“調度員”的角色,強大的邏輯鏈推理能力是拆解復雜任務的關鍵。 03 規劃與執行模塊 – Agent的“手和腳”人類點外賣時會自然拆步驟:打開App→選餐廳→加購物車→結算。Agent也得把“寫一篇行業報告”拆成“搜索→讀文章→整理大綱→填充段落→校對”,并調用外部工具來完成具體操作。 LangChain的統計顯示,一個典型研究任務平均需要調用5.2個外部工具,最復雜的可到20個以上。那工具集(Toolbox)里有什么?
![]() 打開今日頭條查看圖片詳情 當智能體為用戶制定好寫報告計劃后,便進入執行階段:大腦發出“調用搜索API”指令→本模塊找到對應工具→格式化輸入參數→執行調用→獲取返回結果→送回給大腦進行下一步分析。 一句話:工具使用能力是Agent區別于純聊天機器人的分水嶺,它讓Agent的能力邊界得以無限擴展。 04 記憶模塊 – Agent的“日記本與知識庫”記憶模塊負責存儲和快速檢索信息,讓Agent擁有長期記憶和個性化上下文,避免“金魚腦”。它主要分為短期上下文記憶和長期存儲記憶兩部分。
但是,向量數據庫的檢索邏輯并非“精確匹配”,這是因為向量數據庫的核心是通過向量相似度計算來檢索數據。具體來說: 首先,所有數據(文本、圖像、音頻等)會被轉化為高維向量(通過嵌入模型,如BERT、Sentence-BERT等),向量的距離或夾角代表數據的語義相似度。 當用戶輸入查詢時,查詢也會被轉化為向量,數據庫通過計算查詢向量與庫中所有數據向量的相似度,返回“最相似”的結果。 這種邏輯決定了它的檢索結果是“語義相關”優先,而非傳統數據庫的“精確匹配”(如SQL的=或like)。因此,“準確性”在這里更偏向于“結果是否與查詢意圖相關”,而非“是否嚴格符合某個精確條件”。 下面對兩種類型數據庫做個對比: ![]() 打開今日頭條查看圖片詳情 有數據顯示,74%的企業級Agent部署了向量數據庫,但仍有46%的開發者抱怨“檢索不準”,說明長期記憶不只是“存”,還得“找得快、找得準”。 所以,在對準確性要求極高的場景,如醫療診斷、法律檢索等,需結合具體場景優化技術細節,并對檢索結果的內容進行二次驗證。 一句話:記憶模塊讓Agent能夠學習和個性化,從一個通用工具變成你的專屬助手。即使相隔數月,Agent也能“想起”你“不喜歡報告背景是黃色”或“上次項目的最終數據”。 05 學習與適應模塊 – Agent的“進化引擎”學習與適應模塊是讓Agent具備“從過去的經歷中學習,并用學到的東西應對新情況”的能力。該模塊主要通過兩大機制實現功能:學習機制(獲取新知識)和適應機制(應用知識應對變化),二者相輔相成。 常見的學習機制包括:
常見的適應機制包括:
但是,如果用戶群體單一,Agent可能學會“討好”而失真。Anthropic提出“Constitutional AI”:給Agent寫一份“行為憲法”,防止它一味迎合。 ![]() 打開今日頭條查看圖片詳情 一句話:學習與適應模塊是高級Agent的標志,使其行為不再僵化,能夠持續改進,適應復雜多變的環境。 06 Agent實戰:一個3分鐘的“訂健康餐”實戰讓我們用一個訂餐Agent的例子,看五大模塊如何流水線作業,完成“幫我訂一份健康午餐”的任務: 你只需要告訴訂餐Agent需求,它會
![]() 打開今日頭條查看圖片詳情 下期預告:智能體的“超能力”之源 你如果仔細閱讀會發現,工具使用是Agent能力的倍增器。下一篇將深度解密Agent的“工具箱”:它如何學會使用成千上萬的工具?為什么說工具生態的成熟是Agent爆發的關鍵? 作者:阿木聊AI(智能體),公眾號:Agent智能體 本文由 @阿木聊AI(智能體) 原創發布于人人都是產品經理。 題圖來自Unsplash,基于CC0協議 該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務 |
|