多智能體系統(tǒng)架構(gòu)解析
一、問(wèn)題思考
在 AI 快速發(fā)展的今天,我們能明顯感受到不同智能系統(tǒng)的差異:有的擅長(zhǎng)自然對(duì)話,有的依托技能點(diǎn)精準(zhǔn)響應(yīng)。
deepseek(自然對(duì)話) vs 豆包(技能點(diǎn)模式):
圖片
圖片
這種技術(shù)架構(gòu)的差異,直接導(dǎo)致二者在使用方式、適配場(chǎng)景與用戶體驗(yàn)上呈現(xiàn)顯著不同。
而多智能體系統(tǒng),正是通過(guò)獨(dú)特的架構(gòu)設(shè)計(jì),讓 AI 突破單智能體的能力邊界,實(shí)現(xiàn)更復(fù)雜的任務(wù)協(xié)作。
圖片
二、多智能體系統(tǒng)介紹
2.1 概念簡(jiǎn)介
多智能體系統(tǒng)(Multi-Agent Systems, MAS)是相對(duì)單智能體系統(tǒng)(Single-agent System)而言。
多智能體組成虛擬團(tuán)隊(duì),模擬人類專業(yè)協(xié)作模式,以解決超越單智能體能力邊界的復(fù)雜問(wèn)題。
其實(shí)和人類很像,一個(gè)人的大腦裝太多信息會(huì)影響效率,單智能體面對(duì)復(fù)雜任務(wù)時(shí),穩(wěn)定性和能力都會(huì)受限。而多智能體系統(tǒng),就像組建了一個(gè)虛擬專業(yè)團(tuán)隊(duì),通過(guò)模擬人類協(xié)作模式解決復(fù)雜問(wèn)題。正所謂“術(shù)業(yè)有專攻”,一個(gè)人的力量,永遠(yuǎn)抵不過(guò)一個(gè)專業(yè)的團(tuán)隊(duì)。
這就是 MAS,即多智能體系統(tǒng)設(shè)計(jì)的初衷。
圖片
2.2 技術(shù)本質(zhì)
MAS 技術(shù)本質(zhì)是 分布式系統(tǒng)思想 的延續(xù),構(gòu)建分布式認(rèn)知網(wǎng)絡(luò),通過(guò)智能體(Agent)間的目標(biāo)驅(qū)動(dòng)協(xié)作與環(huán)境交互反饋,實(shí)現(xiàn)超越單智能體能力邊界的復(fù)雜問(wèn)題求解。
圖片
MAS 的技術(shù)獨(dú)特性:
- 功能節(jié)點(diǎn)從預(yù)定邏輯功能(eg. 數(shù)據(jù)庫(kù)節(jié)點(diǎn)、計(jì)算節(jié)點(diǎn))提升為具備意圖推導(dǎo)能力
- 通信內(nèi)容從結(jié)構(gòu)化數(shù)據(jù)升級(jí)為自然語(yǔ)言指令
- 決策機(jī)制從中心控制變?yōu)閰f(xié)商自治
基于以上三點(diǎn),讓多智能體之間像專業(yè)團(tuán)隊(duì)一樣 “各司其職、靈活協(xié)作”。
三、LangGraph 多智能體系統(tǒng)
從極具代表性的 AI 框架中汲取本質(zhì)思想(MAS 架構(gòu)的實(shí)踐典范)
3.1 多智能體架構(gòu)
在多智能體系統(tǒng)中,有幾種連接智能體的方法:
- 網(wǎng)絡(luò):每個(gè)智能體都可以與 其他所有智能體 進(jìn)行通信
- 監(jiān)管智能體:每個(gè)智能體與單個(gè)監(jiān)管智能體進(jìn)行通信
- 監(jiān)督者(工具調(diào)用):這是監(jiān)督者架構(gòu)的一種特殊情況,單個(gè)智能體可以表示為工具
- 分層式:你可以使用 超級(jí)監(jiān)督智能體 定義一個(gè)多智能體系統(tǒng)
- 自定義:每個(gè)智能體僅與一部分智能體進(jìn)行通信
image.png
3.2 核心概念
Command
LangGraph 中構(gòu)建多智能體架構(gòu)的新工具/語(yǔ)法糖
Command = 更新?tīng)顟B(tài)(節(jié)點(diǎn)) + 控制流(邊)(即 讓Agent 知道 “下一步做什么、狀態(tài)怎么更新”)
const myNode = (state: typeof StateAnnotation.State) => {
return new Command({
update: { foo: "bar" },
goto: "other_subgraph", // where `other_subgraph` is a node in the parent graph
graph: Command.PARENT,
});
};
Handoffs
多智能體交互中的一種常見(jiàn)模式,即一個(gè)智能體將控制權(quán)交接給另一個(gè)智能體。
# With type hints, you can specify the possible nodes this can go to.
def agent(state: MessagesState) -> Command[Literal[..., END]]:
...
return Command(
goto=..., # The next node(s) to go to
update={"messages": [response]} # The update to apply to the state
)
兩者的關(guān)聯(lián)
關(guān)聯(lián)代碼實(shí)現(xiàn):
// Define the nodes
const nodeASubgraph = async (_state: typeof StateAnnotation.State) => {
console.log("Called A");
// this is a replacement for a real conditional edge function
const goto = Math.random() > .5 ? "nodeB" : "nodeC";
// note how Command allows you to BOTH update the graph state AND route to the next node
return new Command({
update: {
foo: "a",
},
goto,
// this tells LangGraph to navigate to node_b or node_c in the parent graph
// NOTE: this will navigate to the closest parent graph relative to the subgraph
graph: Command.PARENT,
});
};
const subgraph = new StateGraph(StateAnnotation)
.addNode("nodeA", nodeASubgraph)
.addEdge("__start__", "nodeA")
.compile();
const parentGraph= new StateGraph(StateAnnotation)
.addNode("subgraph", subgraph, { ends: ["nodeB", "nodeC"] })
.addNode("nodeB", nodeB)
.addNode("nodeC", nodeC)
.addEdge("__start__", "subgraph")
.compile();
await parentGraph.invoke({ foo: "" });
Command 驅(qū)動(dòng) Handoffs 的發(fā)生,而 Handoffs 是 Command 在智能體間傳遞的載體和實(shí)現(xiàn)方式。
image.png
image.png
四、 其他多智能體系統(tǒng)探究
除LangGraph 框架之外,其他優(yōu)秀的多智能體框架介紹:
4.1 AutoGen(Microsoft)
AutoGen 的核心價(jià)值:讓 AI 協(xié)作 “像聊天一樣自然”
1、基類與角色分工
- 核心基類:ConversableAgent 對(duì)話引擎
- 角色分工:AssistantAgent、UserProxyAgent、GroupChatManager
2、定義Agent + 定制交互邏輯
- 定義Agent:人類代理A、助手B
- 注冊(cè)自定義回復(fù)函數(shù):讓Agent 具備智能響應(yīng)能力
3、程序運(yùn)行:對(duì)話驅(qū)動(dòng)的任務(wù)執(zhí)行
image.png
4.2 CrewAI(OpenAI)
CrewAI 既支持 “智能體自主協(xié)作”(Crew),也支持 “流程化精細(xì)編排”(Flows),覆蓋從靈活創(chuàng)新到嚴(yán)格流程的多樣化協(xié)作需求
- Crew 模式
Agent 擁有獨(dú)立能力(LLM + Tools)和共享記憶,自主分工執(zhí)行任務(wù)
- Flows 模式
通過(guò) Code 編排協(xié)作單元的交互,結(jié)合狀態(tài)管理實(shí)現(xiàn)流程級(jí)精細(xì)控制
asset.png
核心對(duì)比:
維度 | Crew 模式 | Flows 模式 |
控制粒度 | 智能體自主決策 | 代碼定義的流程級(jí)控制 |
核心優(yōu)勢(shì) | 靈活分工、自主協(xié)作 | 步驟精確、依賴清晰 |
典型場(chǎng)景 | 創(chuàng)意生成、多角色模擬 | 數(shù)據(jù)流水線、復(fù)雜工作流 |
4.3 MetaGPT(國(guó)產(chǎn))
MetaGPT 多智能體協(xié)作開(kāi)發(fā)軟件的標(biāo)準(zhǔn)流程(SOP)
- 左側(cè):軟件開(kāi)發(fā)標(biāo)準(zhǔn)流程
- 中間:智能體分工
- 右側(cè):人機(jī)交互階段
image.png
MetaGPT提出了一個(gè)通信協(xié)議,以提高角色通信效率,還實(shí)現(xiàn)了結(jié)構(gòu)化的通信接口和有效的發(fā)布-訂閱機(jī)制
- 共享消息池:協(xié)作的“神經(jīng)中樞”
發(fā)布(publish):將信息寫(xiě)入消息池(eg. PM 發(fā)布任務(wù))
訂閱(subscription):監(jiān)聽(tīng)感興趣的消息(eg. Engineer 訂閱開(kāi)發(fā)任務(wù))
image.png
4.4 小結(jié)
AutoGen、CrewAI、MetaGPT 三款 MAS 框架對(duì)比:
圖片
五、結(jié)語(yǔ)
多智能體系統(tǒng)(MAS)不僅是對(duì)人類社會(huì)協(xié)作關(guān)系的映射,其真正價(jià)值在于探索和創(chuàng)造具備超協(xié)同增益的AI群體智能。
然而,不同框架之間依然存在較高的學(xué)習(xí)和開(kāi)發(fā)門(mén)檻。隨著 LLM 能力的持續(xù)提升,未來(lái)的 Agent 框架必將朝著更簡(jiǎn)潔、高效、易用的方向演進(jìn)。