RiTeK：面向大型语言模型在医学文本知识图谱上进行复杂推理的数据集 (RiTeK: A Dataset for Large Language Models Complex Reasoning over Textual Knowledge Graphs in Medicine) - 专知论文

会员服务 ·

0

知识 · 图谱 · 结构 · 数据集 · 拓扑结构 ·

RiTeK: A Dataset for Large Language Models Complex Reasoning over Textual Knowledge Graphs in Medicine

翻译：RiTeK：面向大型语言模型在医学文本知识图谱上进行复杂推理的数据集

Jiatan Huang,Mingchen Li,Zonghai Yao,Dawei Li,Yuxin Zhang,Zhichao Yang,Yongkang Xiao,Feiyun Ouyang,Xiaohan Li,Shuo Han,Hong Yu

Answering complex real-world questions in the medical domain often requires accurate retrieval from medical Textual Knowledge Graphs (medical TKGs), as the relational path information from TKGs could enhance the inference ability of Large Language Models (LLMs). However, the main bottlenecks lie in the scarcity of existing medical TKGs, the limited expressiveness of their topological structures, and the lack of comprehensive evaluations of current retrievers for medical TKGs. To address these challenges, we first develop a Dataset1 for LLMs Complex Reasoning over medical Textual Knowledge Graphs (RiTeK), covering a broad range of topological structures. Specifically, we synthesize realistic user queries integrating diverse topological structures, relational information, and complex textual descriptions. We conduct a rigorous medical expert evaluation process to assess and validate the quality of our synthesized queries. RiTeK also serves as a comprehensive benchmark dataset for evaluating the capabilities of retrieval systems built upon LLMs. By assessing 11 representative retrievers on this benchmark, we observe that existing methods struggle to perform well, revealing notable limitations in current LLM-driven retrieval approaches. These findings highlight the pressing need for more effective retrieval systems tailored for semi-structured data in the medical domain.

翻译：回答医学领域的复杂现实问题通常需要从医学文本知识图谱（medical TKGs）中进行精确检索，因为TKG中的关系路径信息能够增强大型语言模型（LLMs）的推理能力。然而，主要瓶颈在于现有医学TKGs的稀缺性、其拓扑结构表达能力的局限性，以及当前针对医学TKGs的检索系统缺乏全面评估。为应对这些挑战，我们首先开发了一个面向LLMs在医学文本知识图谱上进行复杂推理的数据集（RiTeK），该数据集涵盖了广泛的拓扑结构。具体而言，我们通过融合多样化的拓扑结构、关系信息和复杂的文本描述，合成了贴近现实的用户查询。我们实施了严格的医学专家评估流程，以评估和验证所合成查询的质量。RiTeK还可作为评估基于LLMs构建的检索系统能力的综合性基准数据集。通过在该基准上评估11种代表性检索模型，我们发现现有方法表现欠佳，揭示了当前LLM驱动检索方法的显著局限性。这些发现凸显了为医学领域半结构化数据定制更有效检索系统的迫切需求。

0

相关内容

【AAAI2026】NeSTR：一种用于大型语言模型的神经-符号可溯因框架，用于时间推理

【AAAI2026】NeSTR：一种用于大型语言模型的神经-符号可溯因框架，用于时间推理

专知会员服务

17+阅读 · 2025年12月10日

大型语言模型（LLM）赋能的知识图谱构建：综述

大型语言模型（LLM）赋能的知识图谱构建：综述

专知会员服务

54+阅读 · 2025年10月24日

医学领域大型语言模型的新进展

医学领域大型语言模型的新进展

专知会员服务

25+阅读 · 2025年10月5日

探索大型语言模型在文本到SQL的应用：进展、挑战与机遇

探索大型语言模型在文本到SQL的应用：进展、挑战与机遇

专知会员服务

18+阅读 · 2025年6月2日

如何将领域知识注入大模型？最新《将领域特定知识注入大语言模型》综述

如何将领域知识注入大模型？最新《将领域特定知识注入大语言模型》综述

专知会员服务

79+阅读 · 2025年2月24日

大型语言模型在表格推理中的应用综述

大型语言模型在表格推理中的应用综述

专知会员服务

47+阅读 · 2024年2月14日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

110+阅读 · 2023年12月19日

大模型和图如何结合？最新《图遇见大型语言模型》综述，详述最新进展

大模型和图如何结合？最新《图遇见大型语言模型》综述，详述最新进展

专知会员服务

79+阅读 · 2023年11月25日

Nat. Med. | 医学中的大型语言模型

Nat. Med. | 医学中的大型语言模型

专知会员服务

58+阅读 · 2023年9月19日

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

专知会员服务

137+阅读 · 2020年7月29日

哈佛大学｜构建知识图谱PrimeKG以实现精准医疗--数据与代码全部公开，帮你从零开始复现知识图谱

哈佛大学｜构建知识图谱PrimeKG以实现精准医疗--数据与代码全部公开，帮你从零开始复现知识图谱

GenomicAI

29+阅读 · 2022年5月4日

【唐建博士】知识图谱上的神经和符号逻辑推理，99页ppt

【唐建博士】知识图谱上的神经和符号逻辑推理，99页ppt

专知

19+阅读 · 2020年12月17日

基于多来源文本的中文医学知识图谱的构建

基于多来源文本的中文医学知识图谱的构建

专知

13+阅读 · 2020年8月21日

医疗健康领域的短文本解析探索----文本纠错

医疗健康领域的短文本解析探索----文本纠错

深度学习自然语言处理

10+阅读 · 2020年8月5日

论文浅尝 | 基于深度强化学习将图注意力机制融入知识图谱推理

论文浅尝 | 基于深度强化学习将图注意力机制融入知识图谱推理

开放知识图谱

18+阅读 · 2019年12月31日

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

专知

42+阅读 · 2019年4月9日

图神经网络最近这么火，不妨看看我们精选的这七篇

图神经网络最近这么火，不妨看看我们精选的这七篇

人工智能前沿讲习班

37+阅读 · 2018年12月10日

【论文推荐】最新七篇知识图谱相关论文—知识表示学习、增强神经网络、链接预测、关系预测与提取、综述、递归特性生成、深度知识感知网络

【论文推荐】最新七篇知识图谱相关论文—知识表示学习、增强神经网络、链接预测、关系预测与提取、综述、递归特性生成、深度知识感知网络

专知

29+阅读 · 2018年3月6日

【知识图谱】医学知识图谱构建技术与研究进展

【知识图谱】医学知识图谱构建技术与研究进展

产业智能官

44+阅读 · 2017年11月16日

医学知识图谱构建技术与研究进展

医学知识图谱构建技术与研究进展

全球人工智能

19+阅读 · 2017年11月13日

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

基于复杂网络理论的肺系病中医古籍本体构建与知识发现研究

国家自然科学基金

0+阅读 · 2015年12月31日

大型复杂医学领域本体质量评估理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向甲骨学知识图谱的实体发现及语义关系挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于复杂语义的个性化图像集摘要研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

复杂数据下带有形状约束的半参数模型统计推断

国家自然科学基金

3+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

面向大规模知识图谱的查询处理关键技术研究

国家自然科学基金

18+阅读 · 2014年12月31日

云平台中可优化分析操作的海量医学图像存储管理技术

国家自然科学基金

0+阅读 · 2014年12月31日

Wikontic: Constructing Wikidata-Aligned, Ontology-Aware Knowledge Graphs with Large Language Models

Arxiv

0+阅读 · 1月29日

Harnessing Large Language Models for Precision Querying and Retrieval-Augmented Knowledge Extraction in Clinical Data Science

Arxiv

0+阅读 · 1月28日

STaR: Towards Effective and Stable Table Reasoning via Slow-Thinking Large Language Models

Arxiv

0+阅读 · 1月26日

PairSem: LLM-Guided Pairwise Semantic Matching for Scientific Document Retrieval

Arxiv

0+阅读 · 1月25日

ReGraM: Region-First Knowledge Graph Reasoning for Medical Question Answering

Arxiv

0+阅读 · 1月14日

GraphSearch: Agentic Search-Augmented Reasoning for Zero-Shot Graph Learning

Arxiv

0+阅读 · 1月13日

Memorization in Large Language Models in Medicine: Prevalence, Characteristics, and Implications

Arxiv

0+阅读 · 1月9日

VERUS-LM: a Versatile Framework for Combining LLMs with Symbolic Reasoning

Arxiv

0+阅读 · 1月7日

Toward Global Large Language Models in Medicine

Arxiv

0+阅读 · 1月5日

MedKGI: Iterative Differential Diagnosis with Medical Knowledge Graphs and Information-Guided Inquiring

Arxiv

0+阅读 · 1月4日

VIP会员

文章信息

相关主题

相关VIP内容

【AAAI2026】NeSTR：一种用于大型语言模型的神经-符号可溯因框架，用于时间推理

【AAAI2026】NeSTR：一种用于大型语言模型的神经-符号可溯因框架，用于时间推理

专知会员服务

17+阅读 · 2025年12月10日

大型语言模型（LLM）赋能的知识图谱构建：综述

大型语言模型（LLM）赋能的知识图谱构建：综述

专知会员服务

54+阅读 · 2025年10月24日

医学领域大型语言模型的新进展

医学领域大型语言模型的新进展

专知会员服务

25+阅读 · 2025年10月5日

探索大型语言模型在文本到SQL的应用：进展、挑战与机遇

探索大型语言模型在文本到SQL的应用：进展、挑战与机遇

专知会员服务

18+阅读 · 2025年6月2日

如何将领域知识注入大模型？最新《将领域特定知识注入大语言模型》综述

如何将领域知识注入大模型？最新《将领域特定知识注入大语言模型》综述

专知会员服务

79+阅读 · 2025年2月24日

大型语言模型在表格推理中的应用综述

大型语言模型在表格推理中的应用综述

专知会员服务

47+阅读 · 2024年2月14日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

110+阅读 · 2023年12月19日

大模型和图如何结合？最新《图遇见大型语言模型》综述，详述最新进展

大模型和图如何结合？最新《图遇见大型语言模型》综述，详述最新进展

专知会员服务

79+阅读 · 2023年11月25日

Nat. Med. | 医学中的大型语言模型

Nat. Med. | 医学中的大型语言模型

专知会员服务

58+阅读 · 2023年9月19日

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

专知会员服务

137+阅读 · 2020年7月29日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人机与战争：被忽视的环境影响及无人机保护潜力》

俄罗斯规划未来无人机驱动军队

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

《人工智能、武器与影响力：前沿模型在模拟核危机中展现复杂推理》2026最新46页报告

相关资讯

哈佛大学｜构建知识图谱PrimeKG以实现精准医疗--数据与代码全部公开，帮你从零开始复现知识图谱

哈佛大学｜构建知识图谱PrimeKG以实现精准医疗--数据与代码全部公开，帮你从零开始复现知识图谱

GenomicAI

29+阅读 · 2022年5月4日

【唐建博士】知识图谱上的神经和符号逻辑推理，99页ppt

【唐建博士】知识图谱上的神经和符号逻辑推理，99页ppt

专知

19+阅读 · 2020年12月17日

基于多来源文本的中文医学知识图谱的构建

基于多来源文本的中文医学知识图谱的构建

专知

13+阅读 · 2020年8月21日

医疗健康领域的短文本解析探索----文本纠错

医疗健康领域的短文本解析探索----文本纠错

深度学习自然语言处理

10+阅读 · 2020年8月5日

论文浅尝 | 基于深度强化学习将图注意力机制融入知识图谱推理

论文浅尝 | 基于深度强化学习将图注意力机制融入知识图谱推理

开放知识图谱

18+阅读 · 2019年12月31日

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

专知

42+阅读 · 2019年4月9日

图神经网络最近这么火，不妨看看我们精选的这七篇

图神经网络最近这么火，不妨看看我们精选的这七篇

人工智能前沿讲习班

37+阅读 · 2018年12月10日

【论文推荐】最新七篇知识图谱相关论文—知识表示学习、增强神经网络、链接预测、关系预测与提取、综述、递归特性生成、深度知识感知网络

【论文推荐】最新七篇知识图谱相关论文—知识表示学习、增强神经网络、链接预测、关系预测与提取、综述、递归特性生成、深度知识感知网络

专知

29+阅读 · 2018年3月6日

【知识图谱】医学知识图谱构建技术与研究进展

【知识图谱】医学知识图谱构建技术与研究进展

产业智能官

44+阅读 · 2017年11月16日

医学知识图谱构建技术与研究进展

医学知识图谱构建技术与研究进展

全球人工智能

19+阅读 · 2017年11月13日

相关论文

Wikontic: Constructing Wikidata-Aligned, Ontology-Aware Knowledge Graphs with Large Language Models

Arxiv

0+阅读 · 1月29日

Harnessing Large Language Models for Precision Querying and Retrieval-Augmented Knowledge Extraction in Clinical Data Science

Arxiv

0+阅读 · 1月28日

STaR: Towards Effective and Stable Table Reasoning via Slow-Thinking Large Language Models

Arxiv

0+阅读 · 1月26日

PairSem: LLM-Guided Pairwise Semantic Matching for Scientific Document Retrieval

Arxiv

0+阅读 · 1月25日

ReGraM: Region-First Knowledge Graph Reasoning for Medical Question Answering

Arxiv

0+阅读 · 1月14日

GraphSearch: Agentic Search-Augmented Reasoning for Zero-Shot Graph Learning

Arxiv

0+阅读 · 1月13日

Memorization in Large Language Models in Medicine: Prevalence, Characteristics, and Implications

Arxiv

0+阅读 · 1月9日

VERUS-LM: a Versatile Framework for Combining LLMs with Symbolic Reasoning

Arxiv

0+阅读 · 1月7日

Toward Global Large Language Models in Medicine

Arxiv

0+阅读 · 1月5日

MedKGI: Iterative Differential Diagnosis with Medical Knowledge Graphs and Information-Guided Inquiring

Arxiv

0+阅读 · 1月4日

相关基金

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

基于复杂网络理论的肺系病中医古籍本体构建与知识发现研究

国家自然科学基金

0+阅读 · 2015年12月31日

大型复杂医学领域本体质量评估理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向甲骨学知识图谱的实体发现及语义关系挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于复杂语义的个性化图像集摘要研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

复杂数据下带有形状约束的半参数模型统计推断

国家自然科学基金

3+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

面向大规模知识图谱的查询处理关键技术研究

国家自然科学基金

18+阅读 · 2014年12月31日

云平台中可优化分析操作的海量医学图像存储管理技术

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员