AI 智能體架構(gòu)企業(yè)級落地的工程化能力設計原創(chuàng)

發(fā)布于 2025-7-16 09:36

瀏覽

0收藏

AI 智能體在企業(yè)業(yè)務場景落地過程中的好壞與架構(gòu)設計的工程化能力密切相關(guān)，特別是：總體架構(gòu)分層設計、AI 智能體協(xié)作模式設計、MCP 工具調(diào)用標準化設計、AI 智能體編排框架設計等4個維度，本文結(jié)合我們實際落地的工程實踐視角，來展開剖析。

AI 智能體架構(gòu)企業(yè)級落地的工程化能力設計-AI.x社區(qū)

下文我們詳細剖析之。

一、AI 智能體總體架構(gòu)分層設計

下圖展示了 AI 大模型時代和微服務時代技術(shù)架構(gòu)分層設計的簡單對比，主要是為了明確領域?qū)雍突A設施層的架構(gòu)設計范圍。

AI 智能體架構(gòu)企業(yè)級落地的工程化能力設計-AI.x社區(qū)

在 AI 大模型時代，架構(gòu)設計主要包括：AI 智能體的抽象定義、Tool 的抽象定義、業(yè)務 Prompt 的設計、業(yè)務數(shù)據(jù)的供給、經(jīng)過微調(diào)的大模型以及完整的評測集。

明確這些架構(gòu)設計分層技術(shù)目的是為了讓業(yè)務產(chǎn)品的開發(fā)和接入更多地圍繞這些關(guān)鍵部分展開。AI 智能體平臺需要提供與之配套的服務能力，比如：AI 智能體注冊與編排能力、Tool 接入能力、Prompt 調(diào)試能力、大模型微調(diào)能力和測評能力。

二、AI 智能體協(xié)作模式設計

1、互聯(lián)網(wǎng)架構(gòu)的演變

如下圖所示，過去的互聯(lián)網(wǎng)架構(gòu)經(jīng)歷了從單體服務到微服務/云原生的架構(gòu)演變。這種架構(gòu)演變本質(zhì)上是對業(yè)務系統(tǒng)高內(nèi)聚低耦合的實踐。比如：一次優(yōu)惠活動的創(chuàng)建，可能涉及營銷、庫存、限購、商品等多個領域，每個領域都有不同程度的參與。隨著單個領域的業(yè)務知識不斷膨脹，以及行業(yè)需求的不斷迭代，推動了我們對系統(tǒng)和服務進行拆分。

AI 智能體架構(gòu)企業(yè)級落地的工程化能力設計-AI.x社區(qū)

在微服務實踐中，我們在統(tǒng)一的系統(tǒng)編排框架（比如：Spring Cloud Alibaba）下進行交互，領域之間的互聯(lián)通過服務接口進行。因此，在 AI 時代，未來的系統(tǒng)交付物可能不再是某個服務，而是某個 AI 智能體。AI 智能體與傳統(tǒng)接口的最大區(qū)別在于，它可能涉及多輪交互，而不僅僅是簡單的輸入輸出。因此，協(xié)議設計需要考慮多輪交互來完成任務。同時，像服務注冊與發(fā)現(xiàn)這類能力，仍然具有很高的參考價值。

AI 智能體架構(gòu)企業(yè)級落地的工程化能力設計-AI.x社區(qū)

2、AI 智能體架構(gòu)的演進路徑

在 AI 智能體系統(tǒng)的發(fā)展中，也會有類似的架構(gòu)演進路徑。最初，一個 AI 智能體可能會逐漸變得功能強大，但隨著領域知識的積累和復雜度的增加，會催生出更多的 AI 智能體來共同完成某個任務。這種從單體 AI 智能體到多 AI 智能體協(xié)作的演進是必然的。

AI 智能體架構(gòu)企業(yè)級落地的工程化能力設計-AI.x社區(qū)

3、多 AI 智能體協(xié)作模式

既然從單體 AI 智能體到多 AI 智能體協(xié)作是必然的演進規(guī)律，那么就有必要關(guān)注多 AI 智能體協(xié)作模式。以下是多 AI 智能體協(xié)作的核心內(nèi)容：

任務分配機制

a.集中式任務分配

b.分布式任務協(xié)商

c.基于角色的任務劃分

d.動態(tài)任務重分配

協(xié)作方式

a.平行協(xié)作：多 AI 智能體并行解決問題

b.層級協(xié)作：管理 AI 智能體統(tǒng)籌下級 AI 智能體

c.專家協(xié)作：不同領域 AI 智能體聯(lián)合解決問題

沖突解決

a.基于優(yōu)先級的決策

b.投票機制

c.仲裁 AI 智能體介入

d.基于規(guī)則的沖突處理

當前市面上關(guān)于多 AI 智能體協(xié)作的討論，主要圍繞任務的解決展開，包括任務分發(fā)、任務處理和任務結(jié)果回收。這也是 A2A 協(xié)議引入“任務”這個概念的原因。

AI 智能體架構(gòu)企業(yè)級落地的工程化能力設計-AI.x社區(qū)

4、多 AI 智能體協(xié)作架構(gòu)設計

下圖是對多 AI 智能體協(xié)作架構(gòu)設計的一個簡化理解。從業(yè)務主 AI 智能體出發(fā)，需要基于任務中心恢復當前任務上下文，繼續(xù)本次任務的處理。接著通過 AI 智能體倉庫找到需要協(xié)同的 AI 智能體。我們通過多 AI 智能體交互協(xié)議與其他協(xié)作 AI 智能體交互，并在主 AI 智能體的業(yè)務流程中完成結(jié)果決策或子 AI 智能體的狀態(tài)透傳。

AI 智能體架構(gòu)企業(yè)級落地的工程化能力設計-AI.x社區(qū)

這套多 AI 智能體架構(gòu)設計也呼應了前面提到的，AI 智能體可以是任意一個能夠完成一定范圍內(nèi)人類任務的系統(tǒng)，只要它能在我們的業(yè)務流程中參與協(xié)同并解決一類問題。它可以是“一行 Hello World 代碼”，也可以是一個復雜的交互系統(tǒng)。同樣，基于“萬物皆 AI 智能體”的思路，MCP 工具服務也可以抽象成一個 AI 智能體，并且可以在這一層做一些額外的事情，比如：鑒權(quán)、參數(shù)校驗等。

三、MCP 工具調(diào)用標準化設計

AI 智能體在企業(yè)落地中，Tool 的抽象也比較關(guān)鍵，尤其通過 Tool 來擴展和增強大模型的能力邊界。現(xiàn)在，雖然 MCP 已經(jīng)成為行業(yè)標準，但是當前 MCP 協(xié)議整體還比較薄，需要進一步工程化的架構(gòu)設計能力來增強，特別是：公網(wǎng)/內(nèi)網(wǎng)級的權(quán)限控制、用戶態(tài)的權(quán)限控制、工具快速接入能力、長工具列表優(yōu)化等工程化，如下圖所示：

AI 智能體架構(gòu)企業(yè)級落地的工程化能力設計-AI.x社區(qū)

1. 公網(wǎng)/內(nèi)網(wǎng)級的權(quán)限控制

單體服務向微服務轉(zhuǎn)變后，會抽象出許多只在公司內(nèi)部供給能力的領域。因此，工具和 AI 智能體需要在公網(wǎng)和內(nèi)網(wǎng)的維度進行隔離。當前的 MCP 服務是基于公網(wǎng)的協(xié)議，這意味著內(nèi)網(wǎng)的 MCP 服務需要有統(tǒng)一的網(wǎng)關(guān)層來收口，并根據(jù)請求類型提供相應的工具集。

2. 用戶態(tài)的權(quán)限控制

當前的 MCP 協(xié)議沒有用戶態(tài)信息，這會導致一些只對特定用戶開放的工具無法進行用戶級的鑒權(quán)。因此，需要在用戶態(tài)信息層面補充 MCP。對于公司來說，用戶態(tài)信息可以是多類型的，比如：電商用戶、外賣用戶、公司員工等。有了這層信息后，業(yè)務工具可以在自己的服務內(nèi)部進行鑒權(quán)行為。與傳統(tǒng)應用不同，面向大模型的服務最好在工具供給這一層就做好權(quán)限控制，用戶沒有權(quán)限的工具直接對大模型不可見，以避免請求后無法獲取數(shù)據(jù)的錯誤。

3. 工具快速接入能力

從零開發(fā)一個 MCP Server 對業(yè)務團隊來說是有一定工作量的。開發(fā)框架（比如：Spring AI Alibaba）支持零代碼一鍵轉(zhuǎn) MCP Server，這就是一種工具快速接入的能力。除了開發(fā)框架外，還有很多業(yè)務團隊常用的接入訴求，比如：SLS 日志查詢的接入、表讀取的接入、服務的接入等。這些能力可以快速支撐起一個簡單的應用場景。對于公司的 MCP 中心，如果能夠支持這種工具接入的收斂，可以提高業(yè)務應用建設的效率。

4. 長工具列表優(yōu)化

隨著業(yè)務系統(tǒng)的復雜性提升，一個 AI 智能體系統(tǒng)依賴的工具可能會顯著增加。對于業(yè)務側(cè)來說，需要讓工具更加內(nèi)聚和簡單。對于 MCP 中心來說，可以通過一些更通用的工程化手段來處理，比如：在服務發(fā)現(xiàn)的末端，基于用戶的請求前置過濾一些與本次無關(guān)的工具，可以通過向量相似性或 LLM 來處理。這種二階段工具匹配的做法不僅可以減少長任務下的上下文長度，還能提高工具匹配的準確性。