OmniRetrieval: Unified Retrieval across Heterogeneous Knowledge Sources - 专知论文

会员服务 ·

0

知识 · 结构 · 异构 · 接口 · 结构性 ·

OmniRetrieval: Unified Retrieval across Heterogeneous Knowledge Sources

翻译：全知检索：异构知识源的统一检索框架

Jinheon Baek,Soyeong Jeong,Sangwoo Park,Woongyeong Yeo,Minki Kang,Patara Trirat,Heejun Lee,Sung Ju Hwang

Real-world information needs require access to structurally diverse knowledge sources, from unstructured text and relational tables to knowledge graphs and property graphs. Existing retrievers, however, operate over one source at a time under a fixed query language, leaving the broader landscape of available knowledge fragmented behind incompatible interfaces. A natural attempt at unification would collapse these sources into a shared space, but this erases the structural affordances (such as schemas, ontologies, compositional operators) that give each source its expressive power. Effective retrieval over diverse knowledge, therefore, requires not homogenization but an overarching layer that meets each source on its own terms. To achieve this, we present OmniRetrieval, a framework that takes any natural-language query, identifies appropriate knowledge sources, and dispatches source-native queries to their native execution engines. Across an extensive benchmark spanning 13 datasets and 309 distinct knowledge bases over text, relational, and graph-structured sources, OmniRetrieval exceeds single-source baselines, demonstrating that it can serve as a general-purpose interface to the heterogeneous sources while preserving the structural distinctions that make each source valuable.

翻译：现实世界的信息需求需要访问结构多样的知识源，从非结构化的文本、关系表到知识图谱和属性图。然而，现有检索器每次仅能在固定查询语言下处理单一数据源，导致可用知识的广阔格局因不兼容的接口而碎片化。一种自然的统一尝试会将不同数据源压缩至共享空间，但这会抹除支撑各数据源表达能力的结构性优势（如模式、本体、组合算子）。因此，对多样化知识的有效检索并非需要同质化，而是要构建一个能适配各数据源独特特性的全局性层面。为此，我们提出全知检索框架，该框架可接收任意自然语言查询，识别合适的知识源，并向原生执行引擎分发源特定查询。在涵盖13个数据集、309个独立知识库（覆盖文本、关系型与图结构数据源）的广泛基准测试中，全知检索超越了单数据源基线方法，证明其可作为异构数据源的通用接口，同时保留使每个数据源具有价值的结构性差异。

0

相关内容

麦考瑞大学最新知识图谱构建综述，37页内容358篇文献系统阐述大数据视野下知识图谱构建全过程方法及其最新进展

麦考瑞大学最新知识图谱构建综述，37页内容358篇文献系统阐述大数据视野下知识图谱构建全过程方法及其最新进展

专知会员服务

53+阅读 · 2023年2月27日

【知乎】超越Lexical:用于文本搜索引擎的语义检索框架

【知乎】超越Lexical:用于文本搜索引擎的语义检索框架

专知会员服务

22+阅读 · 2020年8月28日

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

专知会员服务

137+阅读 · 2020年7月29日

不可错过！斯坦福大学《知识图谱》课程，Jure等业界顶尖大牛讲述知识图谱技术进展，附PPT下载

不可错过！斯坦福大学《知识图谱》课程，Jure等业界顶尖大牛讲述知识图谱技术进展，附PPT下载

专知会员服务

91+阅读 · 2020年6月18日

【论文推荐】层次知识图谱，Hierarchical Knowledge Graphs: A Novel Information Representation for Exploratory Search Tasks

【论文推荐】层次知识图谱，Hierarchical Knowledge Graphs: A Novel Information Representation for Exploratory Search Tasks

专知会员服务

49+阅读 · 2020年5月26日

史上最全《知识图谱》2020综述论文，130页pdf，547篇参考文献

史上最全《知识图谱》2020综述论文，130页pdf，547篇参考文献

专知会员服务

461+阅读 · 2020年3月7日

数据挖掘大拿韩家炜：从非结构化文本到知识立方TextCube：自动化构建和多维探索

数据挖掘大拿韩家炜：从非结构化文本到知识立方TextCube：自动化构建和多维探索

专知会员服务

101+阅读 · 2019年12月28日

【从半结构化网页获取知识】Ceres: Harvesting Knowledge from Semi-Structured web pages，亚马逊首席科学家| Xin Luna Dong

【从半结构化网页获取知识】Ceres: Harvesting Knowledge from Semi-Structured web pages，亚马逊首席科学家| Xin Luna Dong

专知会员服务

19+阅读 · 2019年12月13日

【Svitlana博士论文以及答辩slides】基于知识的对话搜索（Knowledge-based Conversational Search），附145页pdf论文，55页ppt

【Svitlana博士论文以及答辩slides】基于知识的对话搜索（Knowledge-based Conversational Search），附145页pdf论文，55页ppt

专知会员服务

48+阅读 · 2019年11月25日

Natural Language Interface to Knowledge Graph (our experience) ，加州大学圣塔芭芭拉分校严锡峰副教授，CIPS ATT 16（2019）

Natural Language Interface to Knowledge Graph (our experience) ，加州大学圣塔芭芭拉分校严锡峰副教授，CIPS ATT 16（2019）

专知会员服务

16+阅读 · 2019年10月25日

重磅！国家标准《信息技术人工智能知识图谱技术框架》征求意见稿发布，35页pdf详细规定知识图谱技术框架

重磅！国家标准《信息技术人工智能知识图谱技术框架》征求意见稿发布，35页pdf详细规定知识图谱技术框架

专知

11+阅读 · 2022年2月19日

史上最全《知识图谱》2020综述论文，18位作者, 130页pdf，547篇参考文献

史上最全《知识图谱》2020综述论文，18位作者, 130页pdf，547篇参考文献

专知

26+阅读 · 2020年3月7日

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

AINLP

75+阅读 · 2020年1月14日

《知识图谱标准化白皮书》发布，200页pdf，中国电子技术标准化研究院主编

《知识图谱标准化白皮书》发布，200页pdf，中国电子技术标准化研究院主编

专知

53+阅读 · 2019年9月16日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

【论文推荐】最新六篇知识图谱相关论文—全局关系嵌入、时序关系提取、对抗学习、远距离关系、时序知识图谱

【论文推荐】最新六篇知识图谱相关论文—全局关系嵌入、时序关系提取、对抗学习、远距离关系、时序知识图谱

专知

23+阅读 · 2018年4月24日

【论文推荐】最新七篇知识图谱相关论文—嵌入式知识、Zero-shot识别、知识图谱嵌入、网络库、变分推理、解释、弱监督

【论文推荐】最新七篇知识图谱相关论文—嵌入式知识、Zero-shot识别、知识图谱嵌入、网络库、变分推理、解释、弱监督

专知

19+阅读 · 2018年3月26日

免费 | 从文本匹配到图文匹配:所见所想所找 - 基于生成模型的多模态检索

免费 | 从文本匹配到图文匹配:所见所想所找 - 基于生成模型的多模态检索

AI研习社

44+阅读 · 2018年3月23日

【论文推荐】最新七篇知识图谱相关论文—知识表示学习、增强神经网络、链接预测、关系预测与提取、综述、递归特性生成、深度知识感知网络

【论文推荐】最新七篇知识图谱相关论文—知识表示学习、增强神经网络、链接预测、关系预测与提取、综述、递归特性生成、深度知识感知网络

专知

29+阅读 · 2018年3月6日

【知识图谱】中文知识图谱构建方法研究

【知识图谱】中文知识图谱构建方法研究

产业智能官

99+阅读 · 2017年10月26日

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

面向知识库的实体链接技术研究

国家自然科学基金

13+阅读 · 2015年12月31日

有效融合多源异构数据的集成分类器研究

国家自然科学基金

5+阅读 · 2015年12月31日

不确定知识图谱中面向结构查询的众包清洗研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向甲骨学知识图谱的实体发现及语义关系挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

关联规则集上的知识发现

国家自然科学基金

9+阅读 · 2015年12月31日

基于异构信息网络的地理共享数据个性化检索研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于空间认知常识的定性地理信息检索研究

国家自然科学基金

2+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

面向大规模知识图谱的查询处理关键技术研究

国家自然科学基金

18+阅读 · 2014年12月31日

RL-Index: Reinforcement Learning for Retrieval Index Reasoning

Arxiv

0+阅读 · 6月15日

Intelligent Multimodal Retrieval and Reasoning for Geospatial Knowledge Discovery on the I-GUIDE Platform

Arxiv

0+阅读 · 6月14日

OneFeed: A Unified Generative Framework for Feed Content Enhancement and Query Generation

Arxiv

0+阅读 · 6月14日

A Unified Structured Query Understanding Framework for Industrial Semantic Search

Arxiv

0+阅读 · 6月7日

GRASP: Plan-Guided Graph Retrieval with Adaptive Fusion and Reranking on Semi-Structured Knowledge Bases

Arxiv

0+阅读 · 5月28日

DocRetriever: A Plug-and-Play Framework for Multimodal Document Retrieval with Comprehensive Benchmark

Arxiv

0+阅读 · 5月28日

Autofocus Retrieval: An Effective Pipeline for Multi-Hop Question Answering With Semi-Structured Knowledge

Arxiv

0+阅读 · 5月14日

UniCVR: From Alignment to Reranking for Unified Zero-Shot Composed Visual Retrieval

Arxiv

0+阅读 · 4月22日

STIndex: A Context-Aware Multi-Dimensional Spatiotemporal Information Extraction System

Arxiv

0+阅读 · 4月7日

From Static Repositories to Agentic Knowledge Webs: ResearchTwin and the S-Index for Federated Human-AI Research Discovery

Arxiv

0+阅读 · 2月13日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

1+阅读 · 今天14:45

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

1+阅读 · 今天14:43

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

3+阅读 · 今天14:31

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 今天14:20

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

2+阅读 · 今天14:11

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

3+阅读 · 今天14:07

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 今天14:03

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 今天13:59

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

麦考瑞大学最新知识图谱构建综述，37页内容358篇文献系统阐述大数据视野下知识图谱构建全过程方法及其最新进展

麦考瑞大学最新知识图谱构建综述，37页内容358篇文献系统阐述大数据视野下知识图谱构建全过程方法及其最新进展

专知会员服务

53+阅读 · 2023年2月27日

【知乎】超越Lexical:用于文本搜索引擎的语义检索框架

【知乎】超越Lexical:用于文本搜索引擎的语义检索框架

专知会员服务

22+阅读 · 2020年8月28日

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

专知会员服务

137+阅读 · 2020年7月29日

不可错过！斯坦福大学《知识图谱》课程，Jure等业界顶尖大牛讲述知识图谱技术进展，附PPT下载

不可错过！斯坦福大学《知识图谱》课程，Jure等业界顶尖大牛讲述知识图谱技术进展，附PPT下载

专知会员服务

91+阅读 · 2020年6月18日

【论文推荐】层次知识图谱，Hierarchical Knowledge Graphs: A Novel Information Representation for Exploratory Search Tasks

【论文推荐】层次知识图谱，Hierarchical Knowledge Graphs: A Novel Information Representation for Exploratory Search Tasks

专知会员服务

49+阅读 · 2020年5月26日

史上最全《知识图谱》2020综述论文，130页pdf，547篇参考文献

史上最全《知识图谱》2020综述论文，130页pdf，547篇参考文献

专知会员服务

461+阅读 · 2020年3月7日

数据挖掘大拿韩家炜：从非结构化文本到知识立方TextCube：自动化构建和多维探索

数据挖掘大拿韩家炜：从非结构化文本到知识立方TextCube：自动化构建和多维探索

专知会员服务

101+阅读 · 2019年12月28日

【从半结构化网页获取知识】Ceres: Harvesting Knowledge from Semi-Structured web pages，亚马逊首席科学家| Xin Luna Dong

【从半结构化网页获取知识】Ceres: Harvesting Knowledge from Semi-Structured web pages，亚马逊首席科学家| Xin Luna Dong

专知会员服务

19+阅读 · 2019年12月13日

【Svitlana博士论文以及答辩slides】基于知识的对话搜索（Knowledge-based Conversational Search），附145页pdf论文，55页ppt

【Svitlana博士论文以及答辩slides】基于知识的对话搜索（Knowledge-based Conversational Search），附145页pdf论文，55页ppt

专知会员服务

48+阅读 · 2019年11月25日

Natural Language Interface to Knowledge Graph (our experience) ，加州大学圣塔芭芭拉分校严锡峰副教授，CIPS ATT 16（2019）

Natural Language Interface to Knowledge Graph (our experience) ，加州大学圣塔芭芭拉分校严锡峰副教授，CIPS ATT 16（2019）

专知会员服务

16+阅读 · 2019年10月25日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

重磅！国家标准《信息技术人工智能知识图谱技术框架》征求意见稿发布，35页pdf详细规定知识图谱技术框架

重磅！国家标准《信息技术人工智能知识图谱技术框架》征求意见稿发布，35页pdf详细规定知识图谱技术框架

专知

11+阅读 · 2022年2月19日

史上最全《知识图谱》2020综述论文，18位作者, 130页pdf，547篇参考文献

史上最全《知识图谱》2020综述论文，18位作者, 130页pdf，547篇参考文献

专知

26+阅读 · 2020年3月7日

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

AINLP

75+阅读 · 2020年1月14日

《知识图谱标准化白皮书》发布，200页pdf，中国电子技术标准化研究院主编

《知识图谱标准化白皮书》发布，200页pdf，中国电子技术标准化研究院主编

专知

53+阅读 · 2019年9月16日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

【论文推荐】最新六篇知识图谱相关论文—全局关系嵌入、时序关系提取、对抗学习、远距离关系、时序知识图谱

【论文推荐】最新六篇知识图谱相关论文—全局关系嵌入、时序关系提取、对抗学习、远距离关系、时序知识图谱

专知

23+阅读 · 2018年4月24日

【论文推荐】最新七篇知识图谱相关论文—嵌入式知识、Zero-shot识别、知识图谱嵌入、网络库、变分推理、解释、弱监督

【论文推荐】最新七篇知识图谱相关论文—嵌入式知识、Zero-shot识别、知识图谱嵌入、网络库、变分推理、解释、弱监督

专知

19+阅读 · 2018年3月26日

免费 | 从文本匹配到图文匹配:所见所想所找 - 基于生成模型的多模态检索

免费 | 从文本匹配到图文匹配:所见所想所找 - 基于生成模型的多模态检索

AI研习社

44+阅读 · 2018年3月23日

【论文推荐】最新七篇知识图谱相关论文—知识表示学习、增强神经网络、链接预测、关系预测与提取、综述、递归特性生成、深度知识感知网络

【论文推荐】最新七篇知识图谱相关论文—知识表示学习、增强神经网络、链接预测、关系预测与提取、综述、递归特性生成、深度知识感知网络

专知

29+阅读 · 2018年3月6日

【知识图谱】中文知识图谱构建方法研究

【知识图谱】中文知识图谱构建方法研究

产业智能官

99+阅读 · 2017年10月26日

相关论文

RL-Index: Reinforcement Learning for Retrieval Index Reasoning

Arxiv

0+阅读 · 6月15日

Intelligent Multimodal Retrieval and Reasoning for Geospatial Knowledge Discovery on the I-GUIDE Platform

Arxiv

0+阅读 · 6月14日

OneFeed: A Unified Generative Framework for Feed Content Enhancement and Query Generation

Arxiv

0+阅读 · 6月14日

A Unified Structured Query Understanding Framework for Industrial Semantic Search

Arxiv

0+阅读 · 6月7日

GRASP: Plan-Guided Graph Retrieval with Adaptive Fusion and Reranking on Semi-Structured Knowledge Bases

Arxiv

0+阅读 · 5月28日

DocRetriever: A Plug-and-Play Framework for Multimodal Document Retrieval with Comprehensive Benchmark

Arxiv

0+阅读 · 5月28日

Autofocus Retrieval: An Effective Pipeline for Multi-Hop Question Answering With Semi-Structured Knowledge

Arxiv

0+阅读 · 5月14日

UniCVR: From Alignment to Reranking for Unified Zero-Shot Composed Visual Retrieval

Arxiv

0+阅读 · 4月22日

STIndex: A Context-Aware Multi-Dimensional Spatiotemporal Information Extraction System

Arxiv

0+阅读 · 4月7日

From Static Repositories to Agentic Knowledge Webs: ResearchTwin and the S-Index for Federated Human-AI Research Discovery

Arxiv

0+阅读 · 2月13日

相关基金

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

面向知识库的实体链接技术研究

国家自然科学基金

13+阅读 · 2015年12月31日

有效融合多源异构数据的集成分类器研究

国家自然科学基金

5+阅读 · 2015年12月31日

不确定知识图谱中面向结构查询的众包清洗研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向甲骨学知识图谱的实体发现及语义关系挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

关联规则集上的知识发现

国家自然科学基金

9+阅读 · 2015年12月31日

基于异构信息网络的地理共享数据个性化检索研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于空间认知常识的定性地理信息检索研究

国家自然科学基金

2+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

面向大规模知识图谱的查询处理关键技术研究

国家自然科学基金

18+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员