Biomedical knowledge graphs (KGs) treat disease associations as static facts, but temporal information is crucial for clinical reasoning, e.g., a symptom diagnostic of one disease at age 3 may imply a different disease at age 13. Existing KGs such as PrimeKG, Hetionet, and iKraph do not encode when a finding becomes clinically relevant over the course of a disease. This limits their usefulness for longitudinal clinical reasoning and retrieval augmentation. We introduce ChronoMedKG, a temporal biomedical knowledge graph that contains 460,497 evidence-linked triples (filtered from 13M raw extractions) covering 13,431 diseases. Each association is tied to temporal components like onset window or progression stage, which are backed by PMID-traceable evidence and a multi-signal credibility score. The graph is constructed through a disease-autonomous multi-agent pipeline in which multiple frontier LLMs independently extract knowledge from PubMed and PMC literature. Only those relations are kept that are supported by multi-model consensus, survive credibility filtering, as well as ontology alignment. ChronoMedKG scored 92.7% agreement against Orphadata and adds temporal grounding for 6,250 diseases absent from HPOA, Orphadata, and Phenopackets, including 1,657 Orphanet-coded rare diseases. We further introduce ChronoTQA, a benchmark of 3,341 questions across eight task types (six temporal plus two static controls), with a 12-question supplementary probe. Frontier LLMs lose roughly 30 points moving from static to temporal questions; ChronoMedKG retrieval rescues 47-65% of their long-tail failures, against 17-29% for HPOA-RAG. As such, ChronoMedKG provides a crucial temporal axis for retrieval-augmented clinical systems that was previously absent.


翻译:生物医学知识图谱将疾病关联视为静态事实,但时间信息对临床推理至关重要,例如,3岁时某种症状可诊断的疾病,到13岁时可能意味着另一种疾病。现有知识图谱(如PrimeKG、Hetionet和iKraph)未能编码发现结果在疾病进程中何时具有临床相关性,这限制了它们在纵向临床推理和检索增强中的效用。我们提出ChronoMedKG——一个包含460,497个具有证据链接的三元组(从1300万个原始提取结果中筛选)的时间约束生物医学知识图谱,涵盖13,431种疾病。每个关联都绑定时间组件(如发病窗口或进展阶段),这些组件具有PubMed ID可溯源证据和多方信号可信度评分。该图谱通过疾病自主多智能体流程构建,多个前沿大语言模型独立地从PubMed和PMC文献中提取知识,仅保留那些获得多模型共识、通过可信度筛选及本体对齐的关系。ChronoMedKG与Orphadata的一致性达到92.7%,并为HPOA、Orphadata和Phenopackets中缺失的6,250种疾病(包括1,657种Orphanet编码的罕见病)添加了时间约束。我们进一步提出ChronoTQA基准,包含3,341个问题,涵盖八种任务类型(六种时间任务加两种静态对照),并设有12个补充测试题。前沿大语言模型在处理时间问题时性能下降约30分;ChronoMedKG检索可挽救其47-65%的长尾失败,而HPOA-RAG仅挽救17-29%。因此,ChronoMedKG为先前缺失时间维度的检索增强临床系统提供了关键的时间轴。

0
下载
关闭预览

相关内容

通过学习、实践或探索所获得的认识、判断或技能。
时序知识图谱表示与推理的研究进展与趋势
专知会员服务
33+阅读 · 2024年10月14日
【博士论文】时序知识图谱嵌入与推理,178页pdf
专知会员服务
53+阅读 · 2024年1月28日
时序知识图谱表示学习
专知会员服务
154+阅读 · 2022年9月17日
医学知识图谱构建关键技术及研究进展
专知会员服务
45+阅读 · 2022年4月27日
【知识图谱】中医临床知识图谱的构建与应用
产业智能官
61+阅读 · 2017年12月18日
【知识图谱】医学知识图谱构建技术与研究进展
产业智能官
44+阅读 · 2017年11月16日
医学知识图谱构建技术与研究进展
全球人工智能
19+阅读 · 2017年11月13日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
18+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
4+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
6+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
3+阅读 · 6月17日
相关资讯
【知识图谱】中医临床知识图谱的构建与应用
产业智能官
61+阅读 · 2017年12月18日
【知识图谱】医学知识图谱构建技术与研究进展
产业智能官
44+阅读 · 2017年11月16日
医学知识图谱构建技术与研究进展
全球人工智能
19+阅读 · 2017年11月13日
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
18+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员