Routing End User Queries to Enterprise Databases - 专知论文

会员服务 ·

0

数据库 · 结构 · SQL · 数据集构建 · 构建 ·

Routing End User Queries to Enterprise Databases

翻译：终端用户查询到企业数据库的路由

Saikrishna Sudarshan,Tanay Kulkarni,Manasi Patwardhan,Lovekesh Vig,Ashwin Srinivasan,Tanmay Tulsidas Verlekar

from arxiv, 6 pages, 2 figures

We address the task of routing natural language queries in multi-database enterprise environments. We construct realistic benchmarks by extending existing NL-to-SQL datasets. Our study shows that routing becomes increasingly challenging with larger, domain-overlapping DB repositories and ambiguous queries, motivating the need for more structured and robust reasoning-based solutions. By explicitly modelling schema coverage, structural connectivity, and fine-grained semantic alignment, the proposed modular, reasoning-driven reranking strategy consistently outperforms embedding-only and direct LLM-prompting baselines across all the metrics.

翻译：本文研究多数据库企业环境中自然语言查询的路由任务。我们通过扩展现有的自然语言转SQL数据集构建了真实场景的基准测试。研究表明，随着数据库库规模增大、领域重叠度提高以及查询歧义性增强，路由任务变得日益复杂，这凸显了对更结构化、更稳健的基于推理的解决方案的需求。通过显式建模模式覆盖度、结构连通性和细粒度语义对齐，所提出的模块化推理驱动重排序策略在所有评估指标上均持续优于纯嵌入方法和直接LLM提示基线。

0

相关内容

数据库

数据库( Database )或数据库管理系统( Database management systems )是按照数据结构来组织、存储和管理数据的仓库。目前数据管理不再仅仅是存储和管理数据，而转变成用户所需要的各种数据管理的方式。

探索大型语言模型在文本到SQL的应用：进展、挑战与机遇

探索大型语言模型在文本到SQL的应用：进展、挑战与机遇

专知会员服务

18+阅读 · 2025年6月2日

《数据基础设施和研发基础设施项目之间互联互通框架》美国国家科学技术委员会最新报告

《数据基础设施和研发基础设施项目之间互联互通框架》美国国家科学技术委员会最新报告

专知会员服务

29+阅读 · 2025年1月4日

Text2SQL 针对表格数据的自然语言接口查询与可视化：一项综述

Text2SQL 针对表格数据的自然语言接口查询与可视化：一项综述

专知会员服务

58+阅读 · 2023年10月30日

「基于深度学习的 SQL 生成」2022研究综述

「基于深度学习的 SQL 生成」2022研究综述

专知会员服务

29+阅读 · 2022年8月12日

图数据库在政府中的应用，Graphs in Government Fulfilling Your Mission with Neo4j

图数据库在政府中的应用，Graphs in Government Fulfilling Your Mission with Neo4j

专知会员服务

18+阅读 · 2022年4月8日

基于深度学习的数据库自然语言接口综述

专知会员服务

34+阅读 · 2021年9月27日

【CIKM2020】【CIKM2020-Tutorial】多模型数据查询语言与处理范式，96页ppt

【CIKM2020】【CIKM2020-Tutorial】多模型数据查询语言与处理范式，96页ppt

专知会员服务

11+阅读 · 2020年10月27日

最新《自然语言处理迁移学习》综述论文，A Survey on Transfer Learning in Natural Language Processing

最新《自然语言处理迁移学习》综述论文，A Survey on Transfer Learning in Natural Language Processing

专知会员服务

140+阅读 · 2020年7月10日

【论文推荐】自然语言处理与查询扩展综述，Natural Language Processing and Query Expansion

【论文推荐】自然语言处理与查询扩展综述，Natural Language Processing and Query Expansion

专知会员服务

44+阅读 · 2020年5月3日

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

专知会员服务

27+阅读 · 2020年3月24日

大数据数仓学习路线

大数据数仓学习路线

DataFunTalk

11+阅读 · 2020年8月5日

基于MySQL Binlog的Elasticsearch数据同步实践

基于MySQL Binlog的Elasticsearch数据同步实践

DBAplus社群

15+阅读 · 2019年9月3日

中文自然语言处理开放任务介绍、数据集、当前最佳结果分享

中文自然语言处理开放任务介绍、数据集、当前最佳结果分享

深度学习与NLP

14+阅读 · 2019年8月15日

【综述】IBM 自动机器学习网络架构搜索最新综述，附45页全文下载

【综述】IBM 自动机器学习网络架构搜索最新综述，附45页全文下载

专知

20+阅读 · 2019年5月8日

领域应用 | 到底什么时候使用图数据库？

领域应用 | 到底什么时候使用图数据库？

开放知识图谱

16+阅读 · 2019年4月19日

使用 Canal 实现数据异构

使用 Canal 实现数据异构

性能与架构

20+阅读 · 2019年3月4日

为新研究准备好一块用武之地：最全任务型对话数据调研

为新研究准备好一块用武之地：最全任务型对话数据调研

PaperWeekly

12+阅读 · 2019年2月11日

自然语言处理常见数据集、论文最全整理分享

自然语言处理常见数据集、论文最全整理分享

深度学习与NLP

11+阅读 · 2019年1月26日

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

产业智能官

12+阅读 · 2018年10月22日

【读书笔记】基于知识库的问答：生成查询图进行语义分析

【读书笔记】基于知识库的问答：生成查询图进行语义分析

专知

16+阅读 · 2018年3月25日

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

6+阅读 · 2015年12月31日

面向知识库的实体链接技术研究

国家自然科学基金

13+阅读 · 2015年12月31日

不确定数据流的分布并行Skyline查询技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于关键词的大规模链接数据搜索技术研究

国家自然科学基金

7+阅读 · 2015年12月31日

以用户为中心的电子商务大数据偏好查询处理与优化

国家自然科学基金

0+阅读 · 2015年12月31日

多租户数据管理关键技术研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向异构数据库的查询语言设计及其基础理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

数据驱动的被动协议测试方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于复杂网络的商务大数据聚类与关联应用研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于合作博弈的互联网域间多路径路由关键技术研究

国家自然科学基金

2+阅读 · 2014年12月31日

Arming Data Agents with Tribal Knowledge

Arxiv

0+阅读 · 2月17日

Arming Data Agents with Tribal Knowledge

Arxiv

0+阅读 · 2月13日

SQLAgent: Learning to Explore Before Generating as a Data Engineer

Arxiv

0+阅读 · 2月2日

Meta Engine: A Unified Semantic Query Engine on Heterogeneous LLM-Based Query Systems

Arxiv

0+阅读 · 2月2日

RAGRouter-Bench: A Dataset and Benchmark for Adaptive RAG Routing

Arxiv

0+阅读 · 1月30日

SWE-SQL: Illuminating LLM Pathways to Solve User SQL Issues in Real-World Applications

Arxiv

0+阅读 · 1月24日

TLSQL: Table Learning Structured Query Language

Arxiv

0+阅读 · 1月24日

AgentSM: Semantic Memory for Agentic Text-to-SQL

Arxiv

0+阅读 · 1月22日

A Tool for Semantic-Aware Spatial Corpus Construction

Arxiv

0+阅读 · 1月21日

CSQL: Mapping Documents into Causal Databases

Arxiv

0+阅读 · 1月13日

VIP会员

文章信息

相关主题

数据集构建

最新内容

《无人机对海面作战影响评估》

《无人机对海面作战影响评估》

专知会员服务

7+阅读 · 7月21日

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

专知会员服务

8+阅读 · 7月21日

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

专知会员服务

2+阅读 · 7月21日

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

专知会员服务

4+阅读 · 7月21日

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

专知会员服务

6+阅读 · 7月21日

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

5+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

7+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

6+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

8+阅读 · 7月20日

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

6+阅读 · 7月20日

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

8+阅读 · 7月20日

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

专知会员服务

8+阅读 · 7月20日

深入Project Maven：为何人工智能在战场上依然失灵

深入Project Maven：为何人工智能在战场上依然失灵

专知会员服务

15+阅读 · 7月19日

锻造未来士兵：外骨骼、基因工程与赛博格

锻造未来士兵：外骨骼、基因工程与赛博格

专知会员服务

7+阅读 · 7月19日

《无人机系统（UAS）通信网状网络试验性部署》50页报告

《无人机系统（UAS）通信网状网络试验性部署》50页报告

专知会员服务

10+阅读 · 7月19日

相关VIP内容

探索大型语言模型在文本到SQL的应用：进展、挑战与机遇

探索大型语言模型在文本到SQL的应用：进展、挑战与机遇

专知会员服务

18+阅读 · 2025年6月2日

《数据基础设施和研发基础设施项目之间互联互通框架》美国国家科学技术委员会最新报告

《数据基础设施和研发基础设施项目之间互联互通框架》美国国家科学技术委员会最新报告

专知会员服务

29+阅读 · 2025年1月4日

Text2SQL 针对表格数据的自然语言接口查询与可视化：一项综述

Text2SQL 针对表格数据的自然语言接口查询与可视化：一项综述

专知会员服务

58+阅读 · 2023年10月30日

「基于深度学习的 SQL 生成」2022研究综述

「基于深度学习的 SQL 生成」2022研究综述

专知会员服务

29+阅读 · 2022年8月12日

图数据库在政府中的应用，Graphs in Government Fulfilling Your Mission with Neo4j

图数据库在政府中的应用，Graphs in Government Fulfilling Your Mission with Neo4j

专知会员服务

18+阅读 · 2022年4月8日

基于深度学习的数据库自然语言接口综述

专知会员服务

34+阅读 · 2021年9月27日

【CIKM2020】【CIKM2020-Tutorial】多模型数据查询语言与处理范式，96页ppt

【CIKM2020】【CIKM2020-Tutorial】多模型数据查询语言与处理范式，96页ppt

专知会员服务

11+阅读 · 2020年10月27日

最新《自然语言处理迁移学习》综述论文，A Survey on Transfer Learning in Natural Language Processing

最新《自然语言处理迁移学习》综述论文，A Survey on Transfer Learning in Natural Language Processing

专知会员服务

140+阅读 · 2020年7月10日

【论文推荐】自然语言处理与查询扩展综述，Natural Language Processing and Query Expansion

【论文推荐】自然语言处理与查询扩展综述，Natural Language Processing and Query Expansion

专知会员服务

44+阅读 · 2020年5月3日

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

专知会员服务

27+阅读 · 2020年3月24日

热门VIP内容

开通专知VIP会员享更多权益服务

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

《无人机对海面作战影响评估》

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

相关资讯

大数据数仓学习路线

大数据数仓学习路线

DataFunTalk

11+阅读 · 2020年8月5日

基于MySQL Binlog的Elasticsearch数据同步实践

基于MySQL Binlog的Elasticsearch数据同步实践

DBAplus社群

15+阅读 · 2019年9月3日

中文自然语言处理开放任务介绍、数据集、当前最佳结果分享

中文自然语言处理开放任务介绍、数据集、当前最佳结果分享

深度学习与NLP

14+阅读 · 2019年8月15日

【综述】IBM 自动机器学习网络架构搜索最新综述，附45页全文下载

【综述】IBM 自动机器学习网络架构搜索最新综述，附45页全文下载

专知

20+阅读 · 2019年5月8日

领域应用 | 到底什么时候使用图数据库？

领域应用 | 到底什么时候使用图数据库？

开放知识图谱

16+阅读 · 2019年4月19日

使用 Canal 实现数据异构

使用 Canal 实现数据异构

性能与架构

20+阅读 · 2019年3月4日

为新研究准备好一块用武之地：最全任务型对话数据调研

为新研究准备好一块用武之地：最全任务型对话数据调研

PaperWeekly

12+阅读 · 2019年2月11日

自然语言处理常见数据集、论文最全整理分享

自然语言处理常见数据集、论文最全整理分享

深度学习与NLP

11+阅读 · 2019年1月26日

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

产业智能官

12+阅读 · 2018年10月22日

【读书笔记】基于知识库的问答：生成查询图进行语义分析

【读书笔记】基于知识库的问答：生成查询图进行语义分析

专知

16+阅读 · 2018年3月25日

相关论文

Arming Data Agents with Tribal Knowledge

Arxiv

0+阅读 · 2月17日

Arming Data Agents with Tribal Knowledge

Arxiv

0+阅读 · 2月13日

SQLAgent: Learning to Explore Before Generating as a Data Engineer

Arxiv

0+阅读 · 2月2日

Meta Engine: A Unified Semantic Query Engine on Heterogeneous LLM-Based Query Systems

Arxiv

0+阅读 · 2月2日

RAGRouter-Bench: A Dataset and Benchmark for Adaptive RAG Routing

Arxiv

0+阅读 · 1月30日

SWE-SQL: Illuminating LLM Pathways to Solve User SQL Issues in Real-World Applications

Arxiv

0+阅读 · 1月24日

TLSQL: Table Learning Structured Query Language

Arxiv

0+阅读 · 1月24日

AgentSM: Semantic Memory for Agentic Text-to-SQL

Arxiv

0+阅读 · 1月22日

A Tool for Semantic-Aware Spatial Corpus Construction

Arxiv

0+阅读 · 1月21日

CSQL: Mapping Documents into Causal Databases

Arxiv

0+阅读 · 1月13日

相关基金

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

6+阅读 · 2015年12月31日

面向知识库的实体链接技术研究

国家自然科学基金

13+阅读 · 2015年12月31日

不确定数据流的分布并行Skyline查询技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于关键词的大规模链接数据搜索技术研究

国家自然科学基金

7+阅读 · 2015年12月31日

以用户为中心的电子商务大数据偏好查询处理与优化

国家自然科学基金

0+阅读 · 2015年12月31日

多租户数据管理关键技术研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向异构数据库的查询语言设计及其基础理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

数据驱动的被动协议测试方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于复杂网络的商务大数据聚类与关联应用研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于合作博弈的互联网域间多路径路由关键技术研究

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员