精品一区二区三区在线成人,欧美精产国品一二三区,Ji大巴进入女人66h,亚洲春色在线视频

攻克大模型「表格盲區(qū)」!ST-Raptor框架發(fā)布,實現(xiàn)復(fù)雜半結(jié)構(gòu)化表格的精準(zhǔn)理解與信息抽取

人工智能 新聞
來自上海交通大學(xué)計算機學(xué)院、西蒙菲莎大學(xué)、清華大學(xué)、中國人民大學(xué)的合作團隊,帶來基于樹形框架的智能表格問答系統(tǒng)(ST-Raptor),其不僅能精準(zhǔn)捕捉表格中的復(fù)雜布局,還能自動生成表格操作指令,并一步步執(zhí)行這些操作流程,最終準(zhǔn)確回答用戶提出的問題 —— 就像給 Excel 裝上了一個會思考的 “AI 大腦”。

本工作核心作者為湯子瑞(上海交通大學(xué))、牛博宇(上海交通大學(xué))。合作者為李帛修、周煒、王健楠、李國良、張心怡、吳帆。通訊作者為上海交通大學(xué)計算機學(xué)院博士生導(dǎo)師周煊赫。團隊長期從事人工智能與數(shù)據(jù)交叉研究。

半結(jié)構(gòu)化表格是我們?nèi)粘9ぷ髦谐R姷?“攔路虎”—— 布局五花八門、結(jié)構(gòu)復(fù)雜多變,讓自動化數(shù)據(jù)處理變得異常困難。

面對這樣的挑戰(zhàn),傳統(tǒng)的表格處理工具往往力不從心。研究發(fā)現(xiàn),現(xiàn)有的大模型以及表格理解領(lǐng)域模型在 NL2SQL / 結(jié)構(gòu)化表格已經(jīng)有了較好的效果(準(zhǔn)確率超 80%),但是在那些諸如金融報表、庫存表、企業(yè)管理表等具有合并單元格、嵌套表格、層次結(jié)構(gòu)等特征的復(fù)雜半結(jié)構(gòu)化表格上表現(xiàn)明顯退化。

為了解決這一痛點,來自上海交通大學(xué)計算機學(xué)院、西蒙菲莎大學(xué)、清華大學(xué)、中國人民大學(xué)的合作團隊,帶來基于樹形框架的智能表格問答系統(tǒng)(ST-Raptor),其不僅能精準(zhǔn)捕捉表格中的復(fù)雜布局,還能自動生成表格操作指令,并一步步執(zhí)行這些操作流程,最終準(zhǔn)確回答用戶提出的問題 —— 就像給 Excel 裝上了一個會思考的 “AI 大腦”。

目前,該論文已被數(shù)據(jù)庫領(lǐng)域國際頂尖學(xué)術(shù)會議 ACM SIGMOD 2026 接收。

  • 論文標(biāo)題:ST-Raptor: LLM-Powered Semi-Structured Table Question Answering
  • 論文鏈接:https://arxiv.org/abs/2508.18190
  • 項目倉庫:https://github.com/weAIDB/ST-Raptor

該項目發(fā)布后得到廣泛關(guān)注與轉(zhuǎn)發(fā):

現(xiàn)有的 NL2SQL 方法需要將半結(jié)構(gòu)化表格轉(zhuǎn)換為結(jié)構(gòu)化表格處理,這通常會導(dǎo)致大量的信息丟失。此外,現(xiàn)有的 NL2Code 和多模態(tài) LLM 問答都無法準(zhǔn)確捕捉半結(jié)構(gòu)化表格獨特的信息組織方法,因此無法準(zhǔn)確回答相應(yīng)的問題。下圖展示了一些基線方法在半結(jié)構(gòu)化表格問答上的表現(xiàn)。在總共 100 個問題的回答中,大模型的錯誤率均較高,且其在涉及到表格結(jié)構(gòu)理解,數(shù)據(jù)獲取,問題推理三方面表現(xiàn)均不佳。

準(zhǔn)確率低的原因主要由于以下幾點:(1)半結(jié)構(gòu)化表格結(jié)構(gòu)個性化程度高,結(jié)構(gòu)復(fù)雜多樣且隱含了部分語義信息,大模型難以捕捉到布局的微妙之處。(2)在進行表格數(shù)據(jù)檢索時,模型容易產(chǎn)生幻覺,造成失真。(3)模型對問題的理解能力不足,不能從表格里獲取解決問題需要的信息。

HO-Tree

創(chuàng)新性的半結(jié)構(gòu)化表格表示方案

為了定制解決半結(jié)構(gòu)化表格信息的復(fù)雜分布問題,本文提出了層次正交樹(HO-Tree)這一數(shù)據(jù)結(jié)構(gòu)。HO-Tree 由 Meta Tree(MTree)和 Body Tree(BTree)嵌套組合形成,其中 MTree 代表了表頭中的元數(shù)據(jù),BTree 代表了表內(nèi)容中的信息數(shù)據(jù)。

上圖展示了構(gòu)建 HO-Tree 的基本步驟。對于一個 excel 表格,首先將表內(nèi)容轉(zhuǎn)化為 HTML 格式并渲染,接著用 VLM 提取圖片中的表頭信息,在對齊后得到元信息組。接著,根據(jù)得到的元信息將表格進行分層級的區(qū)域劃分,最后根據(jù)這一層級得到 HO-Tree。通過這一步驟,半結(jié)構(gòu)化表格被轉(zhuǎn)化為了計算機易于操作的數(shù)據(jù)形式,為后續(xù)處理提供了便利。

樹上操作與流程設(shè)計

精準(zhǔn)回答問題的 “手術(shù)刀”

在建構(gòu)好 HO-Tree 之后,本文繼續(xù)設(shè)計了一套在樹上進行檢索的操作,通過迭代地使用這些操作,LLM 可以按步驟分析表格,最終獲取信息回答問題。這些操作可以分為以下四類:

  1. 數(shù)據(jù)獲取操作:可以獲取樹上子節(jié)點,父節(jié)點等信息,遞歸地進行數(shù)據(jù)獲取操作可以有效去除冗余信息,得到回答問題所必要的信息。
  2. 數(shù)據(jù)處理操作:根據(jù)問題需要的形式,將得到的數(shù)據(jù)進行處理(如求和,計數(shù),按條件篩選等)。
  3. 對齊操作:將過程中的信息和表格內(nèi)容進行對齊,增強檢索時的健壯性。
  4. 推理操作:將獲取的最終答案和問題進行對齊,得到滿足格式要求的最終答案輸出。

這些操作可以幫助 LLM 以直觀的方法獲取數(shù)據(jù),分析表格,并且以可信的方式得到最終答案。結(jié)合這些操作,可以搭建一套流水線回答問題。如下圖例子所示,在得到問題后,ST-Raptor 將其拆解為三個子問題,通過預(yù)定義的樹上操作進行搜索,處理,最后經(jīng)過推理得到答案。

實驗結(jié)論

現(xiàn)有的表格數(shù)據(jù)集大多以結(jié)構(gòu)化為主,一些半結(jié)構(gòu)化的數(shù)據(jù)集也都并不涉及復(fù)雜嵌套關(guān)系,和真實情境不符。因此,本文構(gòu)建了一個半結(jié)構(gòu)化表格數(shù)據(jù)集 SSTQA,共有 102 張復(fù)雜的真實情境表格和 764 個針對這些表格的問題,總共包含了 19 個代表性的真實場景。如下圖所示,在 SSTQA 上,ST-Raptor 相較其余方法而言,取得了很高的準(zhǔn)確率提升,尤其是在結(jié)構(gòu)復(fù)雜困難的表格上遠超其余方法。

在其余兩個半結(jié)構(gòu)化表格問題數(shù)據(jù)集 WikiTQ 和 TempTabQA 上的測試結(jié)果如下表所示,ST-Raptor 準(zhǔn)確率位于榜首,展現(xiàn)出了優(yōu)秀的泛化能力。

綜上所述,ST-Raptor 提供了一套行之有效的半結(jié)構(gòu)化表格問答解決方案,為現(xiàn)實生活中的半結(jié)構(gòu)化表格自動化處理提供了新思路。通過掛載 ST-Raptor,LLM 可以增加對半結(jié)構(gòu)化表格的理解能力和分析能力,提升表格問答的準(zhǔn)確性。在未來,可以優(yōu)化 HO-Tree 的表示和創(chuàng)建,使其囊括更多復(fù)雜表格;同時可以定制更多樹上操作,使問題回答更流暢便捷。

ST-Raptor 立足于表格結(jié)構(gòu)解析這一核心挑戰(zhàn),有效彌補了大語言模型在處理二維表格結(jié)構(gòu)時的能力短板,能夠直接支持包括 Excel 在內(nèi)的多種復(fù)雜半結(jié)構(gòu)化表格輸入。盡管如此,現(xiàn)實場景中的半結(jié)構(gòu)化表格仍普遍存在格式不規(guī)范、布局多樣、語義歧義以及跨表關(guān)聯(lián)等復(fù)雜問題,值得在模型架構(gòu)、語義理解與泛化能力等方面展開長期而深入的探索。

責(zé)任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2024-06-17 07:10:00

2024-11-07 15:30:00

2021-12-12 08:37:18

結(jié)構(gòu)化數(shù)據(jù)非結(jié)構(gòu)化數(shù)據(jù)數(shù)據(jù)

2023-11-06 07:39:36

數(shù)據(jù)處理異構(gòu)數(shù)據(jù)平臺

2024-05-27 00:32:45

2024-07-17 09:47:18

2025-01-23 16:23:30

2015-12-22 10:37:16

ENI經(jīng)濟和信息化

2022-07-04 22:08:52

結(jié)構(gòu)化數(shù)據(jù)谷歌

2023-03-20 15:54:36

2018-04-03 14:00:03

結(jié)構(gòu)化數(shù)據(jù)非結(jié)構(gòu)化數(shù)據(jù)數(shù)據(jù)庫

2025-06-05 01:22:00

2009-07-28 11:44:37

布線系統(tǒng)結(jié)構(gòu)化

2025-08-04 08:20:00

AI數(shù)據(jù)模型

2014-05-23 10:22:07

Dart SDKDart

2024-07-19 13:13:51

微軟模型電子表格

2023-12-25 15:00:18

結(jié)構(gòu)化布線光纖

2025-01-10 13:56:28

2024-10-09 11:14:37

點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 名山县| 谷城县| 兴和县| 克拉玛依市| 南投市| 肥东县| 涞水县| 荔波县| 西畴县| 普安县| 新蔡县| 安康市| 舞钢市| 体育| 济阳县| 罗平县| 陵水| 上犹县| 儋州市| 陆河县| 仁化县| 封开县| 吴堡县| 岳阳市| 烟台市| 漳平市| 朝阳市| 东海县| 屯门区| 平南县| 灵宝市| 巴林左旗| 大港区| 邹平县| 交口县| 建宁县| 亚东县| 泰和县| 安化县| 庄浪县| 轮台县|