Historical medical archives and traditional medicines hold immense potential for drug discovery and remain a primary source for current drug development. However, pre-ontological prose and idiosyncratic taxonomies prevent the standardization and medical modernization of the data for use in current biomedical pipelines. Furthermore, no existing LLM agent system, whether tool-calling, retrieval-augmented, or agentic deep-research, can convert such text into verifiable drug-discovery leads at scale. We close this gap with DeepRoot, a multi-agent LLM system that jointly builds and utilizes a verified knowledge graph, showing that grounding and reasoning -- often conflated -- are separable axes the system can compose for therapeutic reasoning. Applied to the Shen Nong Ben Cao Jing, DeepRoot recovers $10$ of $21$ held-out compound-disease treatment pairs at R@$20$ ($47.6\%$ vs $4.8\%$ for a raw corpus LLM and $\sim\!2.4\%$ random) and dominates an LLM-as-judge audit for reasoning quality over baseline LLMs and LLMs with direct tool-call access to the same APIs DeepRoot itself queries. Tool-using LLMs hallucinate evidence on $87\%$ of claims, versus 7-10% for DeepRoot. Graph-only inference hallucinates $0\%$ but ranks lowest on reasoning coherence; DeepRoot KG+LLM is the only condition to win on both axes, pointing toward a route for systematic mining and repurposing of historical medical knowledge.


翻译:历史医学档案与传统医药蕴含着巨大的药物发现潜力,且仍是当前药物开发的主要来源。然而,前本体论风格的散文与特有的分类体系阻碍了这些数据的标准化与医学现代化进程,使其无法用于当前生物医学流程。此外,现有的大语言模型智能体系统,无论是工具调用型、检索增强型还是智能深度研究型,均无法将此类文本大规模转化为可验证的药物发现线索。我们通过DeepRoot填补了这一空白——这是一个多智能体大语言模型系统,能够联合构建并利用经过验证的知识图谱。研究表明,常被混为一谈的“基座化”与“推理”实为可分离的维度,系统可对二者进行组合以实现治疗推理。在应用于《神农本草经》时,DeepRoot在R@20指标下成功恢复了21个保留药物-疾病治疗对中的10个(召回率47.6%,原始语料大语言模型为4.8%,随机基线约为2.4%)。在推理质量审计中,DeepRoot以LLM-as-judge评估方式显著优于基线大语言模型及直接调用相同接口的工具型大语言模型。工具型大语言模型在87%的论证中产生证据幻觉,而DeepRoot仅为7-10%。纯知识图谱推理的幻觉率为0%,但推理连贯性得分最低;唯有DeepRoot的知识图谱与大语言模型联合方案在两项指标上均占优,这为系统化挖掘与再利用历史医学知识指明了路径。

0
下载
关闭预览

相关内容

深度学习药物发现综述
专知会员服务
59+阅读 · 2022年6月2日
人工智能到深度学习:药物发现的机器智能方法
专知会员服务
37+阅读 · 2022年5月6日
【Nature-MI】可解释人工智能的药物发现
专知会员服务
45+阅读 · 2020年11月1日
【AI与医学】多模态机器学习精准医疗健康
深度学习在文本分类中的应用
AI研习社
13+阅读 · 2018年1月7日
医学知识图谱构建技术与研究进展
全球人工智能
19+阅读 · 2017年11月13日
国家自然科学基金
7+阅读 · 2017年12月31日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
25+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
7+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
8+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
6+阅读 · 6月17日
相关基金
国家自然科学基金
7+阅读 · 2017年12月31日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
25+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员