AI 智能體架構(gòu)企業(yè)級落地的工程化能力設計 原創(chuàng)
AI 智能體在企業(yè)業(yè)務場景落地過程中的好壞與架構(gòu)設計的工程化能力密切相關(guān),特別是:總體架構(gòu)分層設計、AI 智能體協(xié)作模式設計、MCP 工具調(diào)用標準化設計、AI 智能體編排框架設計等4個維度,本文結(jié)合我們實際落地的工程實踐視角,來展開剖析。
下文我們詳細剖析之。
一、AI 智能體總體架構(gòu)分層設計
下圖展示了 AI 大模型時代和微服務時代技術(shù)架構(gòu)分層設計的簡單對比,主要是為了明確領域?qū)雍突A設施層的架構(gòu)設計范圍。
在 AI 大模型時代,架構(gòu)設計主要包括:AI 智能體的抽象定義、Tool 的抽象定義、業(yè)務 Prompt 的設計、業(yè)務數(shù)據(jù)的供給、經(jīng)過微調(diào)的大模型以及完整的評測集。
明確這些架構(gòu)設計分層技術(shù)目的是為了讓業(yè)務產(chǎn)品的開發(fā)和接入更多地圍繞這些關(guān)鍵部分展開。AI 智能體平臺需要提供與之配套的服務能力,比如:AI 智能體注冊與編排能力、Tool 接入能力、Prompt 調(diào)試能力、大模型微調(diào)能力和測評能力。
二、AI 智能體協(xié)作模式設計
1、互聯(lián)網(wǎng)架構(gòu)的演變
如下圖所示,過去的互聯(lián)網(wǎng)架構(gòu)經(jīng)歷了從單體服務到微服務/云原生的架構(gòu)演變。這種架構(gòu)演變本質(zhì)上是對業(yè)務系統(tǒng)高內(nèi)聚低耦合的實踐。比如:一次優(yōu)惠活動的創(chuàng)建,可能涉及營銷、庫存、限購、商品等多個領域,每個領域都有不同程度的參與。隨著單個領域的業(yè)務知識不斷膨脹,以及行業(yè)需求的不斷迭代,推動了我們對系統(tǒng)和服務進行拆分。
在微服務實踐中,我們在統(tǒng)一的系統(tǒng)編排框架(比如:Spring Cloud Alibaba)下進行交互,領域之間的互聯(lián)通過服務接口進行。因此,在 AI 時代,未來的系統(tǒng)交付物可能不再是某個服務,而是某個 AI 智能體。AI 智能體與傳統(tǒng)接口的最大區(qū)別在于,它可能涉及多輪交互,而不僅僅是簡單的輸入輸出。因此,協(xié)議設計需要考慮多輪交互來完成任務。同時,像服務注冊與發(fā)現(xiàn)這類能力,仍然具有很高的參考價值。
2、AI 智能體架構(gòu)的演進路徑
在 AI 智能體系統(tǒng)的發(fā)展中,也會有類似的架構(gòu)演進路徑。最初,一個 AI 智能體可能會逐漸變得功能強大,但隨著領域知識的積累和復雜度的增加,會催生出更多的 AI 智能體來共同完成某個任務。這種從單體 AI 智能體到多 AI 智能體協(xié)作的演進是必然的。
3、多 AI 智能體協(xié)作模式
既然從單體 AI 智能體到多 AI 智能體協(xié)作是必然的演進規(guī)律,那么就有必要關(guān)注多 AI 智能體協(xié)作模式。以下是多 AI 智能體協(xié)作的核心內(nèi)容:
- 任務分配機制
a.集中式任務分配
b.分布式任務協(xié)商
c.基于角色的任務劃分
d.動態(tài)任務重分配
- 協(xié)作方式
a.平行協(xié)作:多 AI 智能體并行解決問題
b.層級協(xié)作:管理 AI 智能體統(tǒng)籌下級 AI 智能體
c.專家協(xié)作:不同領域 AI 智能體聯(lián)合解決問題
- 沖突解決
a.基于優(yōu)先級的決策
b.投票機制
c.仲裁 AI 智能體介入
d.基于規(guī)則的沖突處理
當前市面上關(guān)于多 AI 智能體協(xié)作的討論,主要圍繞任務的解決展開,包括任務分發(fā)、任務處理和任務結(jié)果回收。這也是 A2A 協(xié)議引入“任務”這個概念的原因。
4、多 AI 智能體協(xié)作架構(gòu)設計
下圖是對多 AI 智能體協(xié)作架構(gòu)設計的一個簡化理解。從業(yè)務主 AI 智能體出發(fā),需要基于任務中心恢復當前任務上下文,繼續(xù)本次任務的處理。接著通過 AI 智能體倉庫找到需要協(xié)同的 AI 智能體。我們通過多 AI 智能體交互協(xié)議與其他協(xié)作 AI 智能體交互,并在主 AI 智能體的業(yè)務流程中完成結(jié)果決策或子 AI 智能體的狀態(tài)透傳。
這套多 AI 智能體架構(gòu)設計也呼應了前面提到的,AI 智能體可以是任意一個能夠完成一定范圍內(nèi)人類任務的系統(tǒng),只要它能在我們的業(yè)務流程中參與協(xié)同并解決一類問題。它可以是“一行 Hello World 代碼”,也可以是一個復雜的交互系統(tǒng)。同樣,基于“萬物皆 AI 智能體”的思路,MCP 工具服務也可以抽象成一個 AI 智能體,并且可以在這一層做一些額外的事情,比如:鑒權(quán)、參數(shù)校驗等。
三、MCP 工具調(diào)用標準化設計
AI 智能體在企業(yè)落地中,Tool 的抽象也比較關(guān)鍵,尤其通過 Tool 來擴展和增強大模型的能力邊界。現(xiàn)在,雖然 MCP 已經(jīng)成為行業(yè)標準,但是當前 MCP 協(xié)議整體還比較薄,需要進一步工程化的架構(gòu)設計能力來增強,特別是:公網(wǎng)/內(nèi)網(wǎng)級的權(quán)限控制、用戶態(tài)的權(quán)限控制、工具快速接入能力、長工具列表優(yōu)化等工程化,如下圖所示:
1. 公網(wǎng)/內(nèi)網(wǎng)級的權(quán)限控制
單體服務向微服務轉(zhuǎn)變后,會抽象出許多只在公司內(nèi)部供給能力的領域。因此,工具和 AI 智能體需要在公網(wǎng)和內(nèi)網(wǎng)的維度進行隔離。當前的 MCP 服務是基于公網(wǎng)的協(xié)議,這意味著內(nèi)網(wǎng)的 MCP 服務需要有統(tǒng)一的網(wǎng)關(guān)層來收口,并根據(jù)請求類型提供相應的工具集。
2. 用戶態(tài)的權(quán)限控制
當前的 MCP 協(xié)議沒有用戶態(tài)信息,這會導致一些只對特定用戶開放的工具無法進行用戶級的鑒權(quán)。因此,需要在用戶態(tài)信息層面補充 MCP。對于公司來說,用戶態(tài)信息可以是多類型的,比如:電商用戶、外賣用戶、公司員工等。有了這層信息后,業(yè)務工具可以在自己的服務內(nèi)部進行鑒權(quán)行為。與傳統(tǒng)應用不同,面向大模型的服務最好在工具供給這一層就做好權(quán)限控制,用戶沒有權(quán)限的工具直接對大模型不可見,以避免請求后無法獲取數(shù)據(jù)的錯誤。
3. 工具快速接入能力
從零開發(fā)一個 MCP Server 對業(yè)務團隊來說是有一定工作量的。開發(fā)框架(比如:Spring AI Alibaba)支持零代碼一鍵轉(zhuǎn) MCP Server,這就是一種工具快速接入的能力。除了開發(fā)框架外,還有很多業(yè)務團隊常用的接入訴求,比如:SLS 日志查詢的接入、表讀取的接入、服務的接入等。這些能力可以快速支撐起一個簡單的應用場景。對于公司的 MCP 中心,如果能夠支持這種工具接入的收斂,可以提高業(yè)務應用建設的效率。
4. 長工具列表優(yōu)化
隨著業(yè)務系統(tǒng)的復雜性提升,一個 AI 智能體系統(tǒng)依賴的工具可能會顯著增加。對于業(yè)務側(cè)來說,需要讓工具更加內(nèi)聚和簡單。對于 MCP 中心來說,可以通過一些更通用的工程化手段來處理,比如:在服務發(fā)現(xiàn)的末端,基于用戶的請求前置過濾一些與本次無關(guān)的工具,可以通過向量相似性或 LLM 來處理。這種二階段工具匹配的做法不僅可以減少長任務下的上下文長度,還能提高工具匹配的準確性。
四、AI 智能體編排框架設計
下圖很好地總結(jié)了 AI 智能體編排框架的分層設計。除了前面提到 AI 智能體協(xié)作構(gòu)建模式和既定的工具調(diào)用標準(MCP),AI 智能體在企業(yè)落地過程中還需要引入問題理解、關(guān)鍵記憶召回、知識庫增強、評測等能力。
基于這些能力,AI 智能體平臺衍生出了以下關(guān)鍵模塊:知識庫的管理與干預、模型市場中心、記憶管理、鏈路追蹤、評測管理與微調(diào)能力。這些關(guān)鍵模塊每一個都可以深入剖析,改天再來詳細剖析。
本文轉(zhuǎn)載自???玄姐聊AGI?? 作者:玄姐
