精品一区二区三区在线成人,欧美精产国品一二三区,Ji大巴进入女人66h,亚洲春色在线视频

Agent KB:讓Agent越用越聰明!

發(fā)布于 2025-7-21 06:35
瀏覽
0收藏

這個工作講的是如何沉淀Agent過去的執(zhí)行經(jīng)驗,讓Agent性能越來越好。

Agent KB:讓Agent越用越聰明!-AI.x社區(qū)

  • 論文:https://arxiv.org/pdf/2507.06229
  • 代碼:https://github.com/OPPO-PersonalAI/Agent-KB

先看結(jié)果,提升很大。 分別在GAIA、SWE 上驗證了。

Agent KB:讓Agent越用越聰明!-AI.x社區(qū)

內(nèi)容蠻簡單,但是細(xì)節(jié)很多。

沉淀Agent過去的執(zhí)行經(jīng)驗。 那首先得有個經(jīng)驗庫把,經(jīng)驗庫怎么構(gòu)造,怎么召回。

有了經(jīng)驗庫,他們又折騰了一個Multi-Agent的系統(tǒng)。然后每個Agent里邊又有一個Reason-Retrieve-Refine的流程。

對應(yīng)到下左圖,構(gòu)建經(jīng)驗庫,右圖如何解決問題。

Agent KB:讓Agent越用越聰明!-AI.x社區(qū)

他們避開了Multi-Agent這個詞,用teacher 、 student 代替了。  teacher Agent、Student Agent 分別什么意思呢?  就類似于學(xué)生寫作業(yè),老師評改作業(yè),改完學(xué)生在修正這么個步驟。

Agent KB:讓Agent越用越聰明!-AI.x社區(qū)

Reason-Retrieve-Refine 這3個詞就是字面意思。

雖然又是teacher Agent又是Student Agent,然后還 Reason-Retrieve-Refine 。但是其實挺workflow的(測試了很多,實驗出這么個pipeline)。 原文有個消融實驗,證明了每個部分都有必要。

Agent KB:讓Agent越用越聰明!-AI.x社區(qū)

那到底要怎么去沉淀經(jīng)驗庫呢?論文附錄有很長的一節(jié)講這個東西。

Agent KB:讓Agent越用越聰明!-AI.x社區(qū)

構(gòu)造過程是一個結(jié)合了人工經(jīng)驗和自動化生成的流程:

第一階段:人工制作高質(zhì)量的“種子經(jīng)驗”

  1. 團(tuán)隊組建: 招募了三名熟悉GAIA基準(zhǔn)和Agentic工作流的計算機(jī)專業(yè)的學(xué)生 。
  2. 日志分析: 他們審查了Agent在GAIA任務(wù)中成功和失敗的日志,總結(jié)出高效的、符合邏輯的行動序列和通用模式 。
  3. 編寫范例: 將這些成功的策略和對失敗的反思,手動編寫成高質(zhì)量、標(biāo)準(zhǔn)化的自然語言指令式提示(Prompt) 。
  4. 測試和篩選: 通過測試,最終篩選出表現(xiàn)最好的80個手寫經(jīng)驗作為種子。

第二階段:利用“種子經(jīng)驗”進(jìn)行自動化擴(kuò)展

  1. Few-shot 學(xué)習(xí): 使用第一階段產(chǎn)出的高質(zhì)量“種子經(jīng)驗”作為范例(Few-shot Examples),去提示大語言模型 。
  2. 批量生成: 讓大模型為來自多個不同數(shù)據(jù)集的大量新任務(wù),自動生成格式統(tǒng)一的經(jīng)驗條目 。

Agent KB:讓Agent越用越聰明!-AI.x社區(qū)

數(shù)據(jù)來源:

為GAIA構(gòu)造的經(jīng)驗庫,經(jīng)驗來源于四個數(shù)據(jù)集:BrowseComp、HopRAG、HLE (text-based subset) 和 WebWalkerQA 。

為SWE-bench構(gòu)造的知識庫,經(jīng)驗則來源于三個數(shù)據(jù)集:RepoClassBench、SWE-Gym-Raw 和 RepoEval 。

經(jīng)驗庫格式長什么樣子? 論文有個例子,翻譯了一下,放在下邊。

{
  "question": "有一個獲得多項格萊美獎的知名人物……",
"true_answer": "St. John’s Health Center(圣約翰健康中心)",
"agent_planning": "1. 解析問題,提取所有關(guān)鍵約束條件:獲得多項格萊美獎,第一張專輯發(fā)行于1969年之前,有藥物依賴問題,20歲前被學(xué)校開除,第一位人生伴侶于1997年去世,曾作為軍裝人員服役,確定死亡地點/醫(yī)院。\n2. 概念性規(guī)劃:\n- 確定所有符合以上條件的藝人候選人。\n- 對每位候選人:\n a) 驗證首張專輯發(fā)行時間(1969年之前)\n b) 檢查格萊美獲獎歷史\n c) 檢索傳記資料,確認(rèn)藥物依賴與教育背景\n d) 確認(rèn)伴侶去世年份和軍裝服役信息\n e) 鎖定匹配人物的死亡日期和具體地點/醫(yī)院。",
"search_agent_planning": "1. 從代碼代理處獲得精確的人物身份,或利用傳記線索進(jìn)行三角定位。\n2. 制定搜索查詢,確認(rèn)人物身份及其具體去世醫(yī)院。\n3. 優(yōu)先查找官方傳記、權(quán)威新聞媒體、格萊美官方記錄。\n4. 交叉核查關(guān)鍵信息點,確保人物匹配。\n5. 從訃告中提取死亡地點和醫(yī)院信息。",
"agent_experience": [
    "將復(fù)雜多條件問題拆分為小型約束檢查",
    "明確記錄并多渠道驗證傳記約束條件",
    "優(yōu)先選用高可靠性傳記和獎項數(shù)據(jù)來源",
    "在早期將具體子查詢委托給搜索代理",
    "通過依次回鏈所有事實,最終驗證答案"
  ],
"search_agent_experience": [
    "將復(fù)雜查詢分解為連續(xù)的搜索細(xì)化步驟",
    "為模糊身份設(shè)計高度具體的檢索關(guān)鍵詞",
    "優(yōu)先使用權(quán)威信息源而非娛樂/八卦內(nèi)容",
    "從多方獨立來源交叉驗證信息",
    "直接引用和明確來源,規(guī)范化結(jié)果格式"
  ]
}

本文轉(zhuǎn)載自??NLP前沿??,作者:NLP前沿


標(biāo)簽
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
主站蜘蛛池模板: 揭阳市| 应用必备| 河津市| 天长市| 东平县| 娄底市| 灵石县| 隆安县| 黎川县| 通榆县| 河北省| 云龙县| 临高县| 上高县| 元氏县| 上虞市| 自贡市| 海晏县| 陵川县| 鹿邑县| 湘阴县| 眉山市| 娄烦县| 栾城县| 光泽县| 桦南县| 潮安县| 西丰县| 读书| 攀枝花市| 安丘市| 武威市| 六枝特区| 旌德县| 正定县| 仙游县| 大足县| 伊宁县| 抚松县| 建宁县| 罗源县|