基于小型语言模型与执行反馈的多智能体Text2SQL框架 (A Multi-agent Text2SQL Framework using Small Language Models and Execution Feedback) - 专知论文

会员服务 ·

0

SQL · Text2SQL · 语言模型 · 小型语言模型 · 智能体 ·

2025 年 12 月 21 日

A Multi-agent Text2SQL Framework using Small Language Models and Execution Feedback

翻译：基于小型语言模型与执行反馈的多智能体Text2SQL框架

Thanh Dat Hoang,Thanh Trung Huynh,Matthias Weidlich,Thanh Tam Nguyen,Tong Chen,Hongzhi Yin,Quoc Viet Hung Nguyen

Text2SQL, the task of generating SQL queries from natural language text, is a critical challenge in data engineering. Recently, Large Language Models (LLMs) have demonstrated superior performance for this task due to their advanced comprehension and generation capabilities. However, privacy and cost considerations prevent companies from using Text2SQL solutions based on external LLMs offered as a service. Rather, small LLMs (SLMs) that are openly available and can hosted in-house are adopted. These SLMs, in turn, lack the generalization capabilities of larger LLMs, which impairs their effectiveness for complex tasks such as Text2SQL. To address these limitations, we propose MATS, a novel Text2SQL framework designed specifically for SLMs. MATS uses a multi-agent mechanism that assigns specialized roles to auxiliary agents, reducing individual workloads and fostering interaction. A training scheme based on reinforcement learning aligns these agents using feedback obtained during execution, thereby maintaining competitive performance despite a limited LLM size. Evaluation results using on benchmark datasets show that MATS, deployed on a single- GPU server, yields accuracy that are on-par with large-scale LLMs when using significantly fewer parameters. Our source code and data are available at https://github.com/thanhdath/mats-sql.

翻译：Text2SQL，即从自然语言文本生成SQL查询的任务，是数据工程领域的一项关键挑战。近年来，大型语言模型（LLMs）凭借其先进的理解与生成能力，在该任务上展现出卓越性能。然而，出于隐私与成本考量，企业难以采用基于外部服务化LLMs的Text2SQL解决方案。因此，业界转而采用可公开获取且能内部部署的小型语言模型（SLMs）。但这些SLMs缺乏大型LLMs的泛化能力，导致其在处理如Text2SQL等复杂任务时效果受限。为应对这些不足，我们提出了MATS——一个专为SLMs设计的新型Text2SQL框架。MATS采用多智能体机制，为辅助智能体分配专门角色，以降低个体工作负荷并促进交互协作。通过基于强化学习的训练方案，利用执行过程中获得的反馈对这些智能体进行对齐，从而在有限模型规模下保持竞争力。在基准数据集上的评估结果表明，部署于单GPU服务器的MATS仅使用显著更少的参数，即可达到与大规模LLMs相当的准确率。我们的源代码与数据公开于https://github.com/thanhdath/mats-sql。

0

相关内容

SQL

SQL 全名是结构化查询语言，是用于数据库中的标准数据查询语言，IBM 公司最早使用在其开发的数据库系统中。

【AAAI2026】TOFA：面向视觉-语言模型的免训练一次性联邦自适应方法

【AAAI2026】TOFA：面向视觉-语言模型的免训练一次性联邦自适应方法

专知会员服务

13+阅读 · 2025年11月23日

面向具身操作的高效视觉–语言–动作模型：系统综述

面向具身操作的高效视觉–语言–动作模型：系统综述

专知会员服务

24+阅读 · 2025年10月22日

在无标注条件下适配视觉—语言模型：全面综述

在无标注条件下适配视觉—语言模型：全面综述

专知会员服务

13+阅读 · 2025年8月9日

【ICLR2025】为多模态图像-文本表示可解释性缩小信息瓶颈理论

【ICLR2025】为多模态图像-文本表示可解释性缩小信息瓶颈理论

专知会员服务

15+阅读 · 2025年2月24日

图增强生成（GraphRAG）

图增强生成（GraphRAG）

专知会员服务

34+阅读 · 2025年1月4日

【WSDM2024】数据中的恶魔：通过部分知识蒸馏学习公平的图神经网络

【WSDM2024】数据中的恶魔：通过部分知识蒸馏学习公平的图神经网络

专知会员服务

31+阅读 · 2023年12月1日

LLMCad:快速可扩展的设备上大型语言模型推理

LLMCad:快速可扩展的设备上大型语言模型推理

专知会员服务

35+阅读 · 2023年9月11日

【超越消息传递:图神经网络的物理启发范式】Beyond Message Passing: a Physics-Inspired Paradigm for Graph Neural Networks

【超越消息传递:图神经网络的物理启发范式】Beyond Message Passing: a Physics-Inspired Paradigm for Graph Neural Networks

专知会员服务

17+阅读 · 2022年5月10日

【ICML2021】图对比学习自动化

专知会员服务

41+阅读 · 2021年6月19日

【SIGMOD2020】基于本体的知识库对话系统

专知会员服务

37+阅读 · 2020年9月25日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

【ACMMM2020-北航】KBGN:用于视觉对话中自适应视觉-文本推理的知识桥图网络

【ACMMM2020-北航】KBGN:用于视觉对话中自适应视觉-文本推理的知识桥图网络

专知

10+阅读 · 2020年8月12日

Python图像处理，366页pdf，Image Operators Image Processing in Python

Python图像处理，366页pdf，Image Operators Image Processing in Python

专知

15+阅读 · 2020年7月23日

图机器学习 2.2-2.4 Properties of Networks, Random Graph

图机器学习 2.2-2.4 Properties of Networks, Random Graph

图与推荐

10+阅读 · 2020年3月28日

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

专知

11+阅读 · 2020年3月17日

使用 Keras Tuner 调节超参数

使用 Keras Tuner 调节超参数

TensorFlow

15+阅读 · 2020年2月6日

如何使用自然语言工具包(NLTK)在Python3中执行情感分析

如何使用自然语言工具包(NLTK)在Python3中执行情感分析

Python程序员

21+阅读 · 2019年10月28日

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

开放知识图谱

22+阅读 · 2018年9月26日

Github 项目推荐 | Nvidia 用于数据增强和 JPEG 图像解码的 GPU 加速库 DALI

Github 项目推荐 | Nvidia 用于数据增强和 JPEG 图像解码的 GPU 加速库 DALI

AI研习社

11+阅读 · 2018年6月27日

Facebook开源MUSE：多语言无监督和监督词向量库

Facebook开源MUSE：多语言无监督和监督词向量库

论智

20+阅读 · 2017年12月23日

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

基于DASH的交互式三维视频系统建模

国家自然科学基金

1+阅读 · 2015年12月31日

不确定数据流的分布并行Skyline查询技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

2D/3D视觉信息融合仿生SLAM关键问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于支撑函数的不规则形态扩展目标建模和估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

46+阅读 · 2015年12月31日

大数据环境下基于GMDH的客户分类半监督集成模型研究

国家自然科学基金

1+阅读 · 2014年12月31日

动态环境下决策单元效率评价方法与应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

语义关联的地理视频数据自适应组织方法

国家自然科学基金

1+阅读 · 2014年12月31日

Self-Adaptive Probabilistic Skyline Query Processing in Distributed Edge Computing via Deep Reinforcement Learning

Arxiv

0+阅读 · 1月29日

Prompt-R1: Collaborative Automatic Prompting Framework via End-to-end Reinforcement Learning

Arxiv

0+阅读 · 1月28日

Towards On-Device Personalization: Cloud-device Collaborative Data Augmentation for Efficient On-device Language Model

Arxiv

0+阅读 · 1月27日

An LLM-Agent-Based Framework for Age of Information Optimization in Heterogeneous Random Access Networks

Arxiv

0+阅读 · 1月26日

DataStates-LLM: Scalable Checkpointing for Transformer Models Using Composable State Providers

Arxiv

0+阅读 · 1月23日

PRISM: A Unified Framework for Post-Training LLMs Without Verifiable Rewards

Arxiv

0+阅读 · 1月19日

Bench4HLS: End-to-End Evaluation of LLMs in High-Level Synthesis Code Generation

Arxiv

0+阅读 · 1月16日

SDFLoRA: Selective Dual-Module LoRA for Federated Fine-tuning with Heterogeneous Clients

Arxiv

0+阅读 · 1月16日

On-Device Large Language Models for Sequential Recommendation

Arxiv

0+阅读 · 1月14日

Sola-Visibility-ISPM: Benchmarking Agentic AI for Identity Security Posture Management Visibility

Arxiv

0+阅读 · 1月11日

VIP会员

文章信息

相关主题

小型语言模型

相关VIP内容

【AAAI2026】TOFA：面向视觉-语言模型的免训练一次性联邦自适应方法

【AAAI2026】TOFA：面向视觉-语言模型的免训练一次性联邦自适应方法

专知会员服务

13+阅读 · 2025年11月23日

面向具身操作的高效视觉–语言–动作模型：系统综述

面向具身操作的高效视觉–语言–动作模型：系统综述

专知会员服务

24+阅读 · 2025年10月22日

在无标注条件下适配视觉—语言模型：全面综述

在无标注条件下适配视觉—语言模型：全面综述

专知会员服务

13+阅读 · 2025年8月9日

【ICLR2025】为多模态图像-文本表示可解释性缩小信息瓶颈理论

【ICLR2025】为多模态图像-文本表示可解释性缩小信息瓶颈理论

专知会员服务

15+阅读 · 2025年2月24日

图增强生成（GraphRAG）

图增强生成（GraphRAG）

专知会员服务

34+阅读 · 2025年1月4日

【WSDM2024】数据中的恶魔：通过部分知识蒸馏学习公平的图神经网络

【WSDM2024】数据中的恶魔：通过部分知识蒸馏学习公平的图神经网络

专知会员服务

31+阅读 · 2023年12月1日

LLMCad:快速可扩展的设备上大型语言模型推理

LLMCad:快速可扩展的设备上大型语言模型推理

专知会员服务

35+阅读 · 2023年9月11日

【超越消息传递:图神经网络的物理启发范式】Beyond Message Passing: a Physics-Inspired Paradigm for Graph Neural Networks

【超越消息传递:图神经网络的物理启发范式】Beyond Message Passing: a Physics-Inspired Paradigm for Graph Neural Networks

专知会员服务

17+阅读 · 2022年5月10日

【ICML2021】图对比学习自动化

专知会员服务

41+阅读 · 2021年6月19日

【SIGMOD2020】基于本体的知识库对话系统

专知会员服务

37+阅读 · 2020年9月25日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】基于自适应表征的高效视觉建模

《多域作战中融合网络、电子战与动能机动》

AI智能体时代大模型安全风险与攻防新挑战

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

相关资讯

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

【ACMMM2020-北航】KBGN:用于视觉对话中自适应视觉-文本推理的知识桥图网络

【ACMMM2020-北航】KBGN:用于视觉对话中自适应视觉-文本推理的知识桥图网络

专知

10+阅读 · 2020年8月12日

Python图像处理，366页pdf，Image Operators Image Processing in Python

Python图像处理，366页pdf，Image Operators Image Processing in Python

专知

15+阅读 · 2020年7月23日

图机器学习 2.2-2.4 Properties of Networks, Random Graph

图机器学习 2.2-2.4 Properties of Networks, Random Graph

图与推荐

10+阅读 · 2020年3月28日

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

专知

11+阅读 · 2020年3月17日

使用 Keras Tuner 调节超参数

使用 Keras Tuner 调节超参数

TensorFlow

15+阅读 · 2020年2月6日

如何使用自然语言工具包(NLTK)在Python3中执行情感分析

如何使用自然语言工具包(NLTK)在Python3中执行情感分析

Python程序员

21+阅读 · 2019年10月28日

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

开放知识图谱

22+阅读 · 2018年9月26日

Github 项目推荐 | Nvidia 用于数据增强和 JPEG 图像解码的 GPU 加速库 DALI

Github 项目推荐 | Nvidia 用于数据增强和 JPEG 图像解码的 GPU 加速库 DALI

AI研习社

11+阅读 · 2018年6月27日

Facebook开源MUSE：多语言无监督和监督词向量库

Facebook开源MUSE：多语言无监督和监督词向量库

论智

20+阅读 · 2017年12月23日

相关论文

Self-Adaptive Probabilistic Skyline Query Processing in Distributed Edge Computing via Deep Reinforcement Learning

Arxiv

0+阅读 · 1月29日

Prompt-R1: Collaborative Automatic Prompting Framework via End-to-end Reinforcement Learning

Arxiv

0+阅读 · 1月28日

Towards On-Device Personalization: Cloud-device Collaborative Data Augmentation for Efficient On-device Language Model

Arxiv

0+阅读 · 1月27日

An LLM-Agent-Based Framework for Age of Information Optimization in Heterogeneous Random Access Networks

Arxiv

0+阅读 · 1月26日

DataStates-LLM: Scalable Checkpointing for Transformer Models Using Composable State Providers

Arxiv

0+阅读 · 1月23日

PRISM: A Unified Framework for Post-Training LLMs Without Verifiable Rewards

Arxiv

0+阅读 · 1月19日

Bench4HLS: End-to-End Evaluation of LLMs in High-Level Synthesis Code Generation

Arxiv

0+阅读 · 1月16日

SDFLoRA: Selective Dual-Module LoRA for Federated Fine-tuning with Heterogeneous Clients

Arxiv

0+阅读 · 1月16日

On-Device Large Language Models for Sequential Recommendation

Arxiv

0+阅读 · 1月14日

Sola-Visibility-ISPM: Benchmarking Agentic AI for Identity Security Posture Management Visibility

Arxiv

0+阅读 · 1月11日

相关基金

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

基于DASH的交互式三维视频系统建模

国家自然科学基金

1+阅读 · 2015年12月31日

不确定数据流的分布并行Skyline查询技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

2D/3D视觉信息融合仿生SLAM关键问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于支撑函数的不规则形态扩展目标建模和估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

46+阅读 · 2015年12月31日

大数据环境下基于GMDH的客户分类半监督集成模型研究

国家自然科学基金

1+阅读 · 2014年12月31日

动态环境下决策单元效率评价方法与应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

语义关联的地理视频数据自适应组织方法

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员