BIOGEN: Evidence-Grounded Multi-Agent Reasoning Framework for Transcriptomic Interpretation in Antimicrobial Resistance - 专知论文

会员服务 ·

0

转录 · 生物 · 组学 · RNA-seq · 覆盖 ·

BIOGEN: Evidence-Grounded Multi-Agent Reasoning Framework for Transcriptomic Interpretation in Antimicrobial Resistance

翻译：《BIOGEN：面向抗菌药物耐药性转录组学解释的基于证据的多智能体推理框架》

Elias Hossain,Mehrdad Shoeibi,Ivan Garibay,Niloofar Yousefi

Interpreting gene clusters from RNA-seq remains challenging, especially in antimicrobial resistance studies where mechanistic context is essential for hypothesis generation. Conventional enrichment methods summarize co-expressed modules using predefined categories, but often return sparse results and lack cluster-specific, literature-linked explanations. We present BIOGEN, an evidence-grounded multi-agent framework for post hoc interpretation of RNA-seq transcriptional modules that integrates biomedical retrieval, structured reasoning, and multi-critic verification. BIOGEN organizes evidence from PubMed and UniProt into traceable cluster-level interpretations with explicit support and confidence tiering. On a primary Salmonella enterica dataset, BIOGEN achieved strong evidence-grounding performance while reducing hallucination from 0.67 in an unconstrained LLM setting to 0.00 under retrieval-grounded configurations. Compared with KEGG/ORA and GO/ORA, BIOGEN recovered broader biological coverage, identifying substantially more biological themes per cluster. Across four additional bacterial RNA-seq datasets, BIOGEN maintained zero hallucination and consistently outperformed KEGG/ORA in cluster-level thematic coverage. These results position BIOGEN as an interpretive support framework that complements transcriptomic workflows through improved traceability, evidential transparency, and biological coverage.

翻译：解读RNA-seq中的基因簇仍然具有挑战性，尤其是在抗菌药物耐药性研究中，机制背景对于假设生成至关重要。传统的富集方法使用预定义类别总结共表达模块，但通常返回稀疏的结果，且缺乏基因簇特异性的、基于文献的解释。我们提出了BIOGEN，一个基于证据的多智能体框架，用于RNA-seq转录模块的事后解释，该框架整合了生物医学检索、结构化推理和多评论者验证。BIOGEN将来自PubMed和UniProt的证据组织成可追溯的基因簇级别解释，并附有明确的支持证据和置信度分级。在沙门氏菌主要数据集上，BIOGEN实现了强大的证据基础性能，同时将幻觉率从无约束大语言模型设置下的0.67降低到基于检索配置下的0.00。与KEGG/ORA和GO/ORA相比，BIOGEN恢复了更广泛的生物学覆盖范围，每个基因簇识别出的生物学主题显著增多。在四个额外的细菌RNA-seq数据集中，BIOGEN保持了零幻觉，并且在基因簇级别主题覆盖方面始终优于KEGG/ORA。这些结果将BIOGEN定位为一个解释性支持框架，通过改进的可追溯性、证据透明性和生物学覆盖来补充转录组学工作流。

0

相关内容

《多智能体学习中的神经多样性研究》最新200页

《多智能体学习中的神经多样性研究》最新200页

专知会员服务

28+阅读 · 2025年9月12日

Transformer在药物发现及其他领域的应用综述

Transformer在药物发现及其他领域的应用综述

专知会员服务

17+阅读 · 2024年9月3日

大模型如何做药物发现？Mila等30多位作者发布《基础模型分子学习: 大规模多任务数据集》

大模型如何做药物发现？Mila等30多位作者发布《基础模型分子学习: 大规模多任务数据集》

专知会员服务

28+阅读 · 2023年10月10日

【普林斯顿博士论文】结构化生物医学数据的概率模型，130页pdf

【普林斯顿博士论文】结构化生物医学数据的概率模型，130页pdf

专知会员服务

24+阅读 · 2023年3月12日

Nat. Biotechnol. | 利用生成式深度学习模型发现Ⅱ型糖尿病药物-组学相关性

Nat. Biotechnol. | 利用生成式深度学习模型发现Ⅱ型糖尿病药物-组学相关性

专知会员服务

14+阅读 · 2023年1月9日

重磅！《人工智能与药物发现》白皮书发布，中国人工智能学会，158页pdf

重磅！《人工智能与药物发现》白皮书发布，中国人工智能学会，158页pdf

专知会员服务

71+阅读 · 2022年12月4日

Nat. Biotechnol. | 使用语言模型和深度学习的单序列蛋白质结构预测

Nat. Biotechnol. | 使用语言模型和深度学习的单序列蛋白质结构预测

专知会员服务

11+阅读 · 2022年10月17日

最新「图机器学习药物发现」综述论文，22页pdf245篇文献

最新「图机器学习药物发现」综述论文，22页pdf245篇文献

专知会员服务

100+阅读 · 2021年5月24日

复杂的序列数据分析：现有算法的系统文献综述，Complex Sequential Data Analysis: A Systematic Literature Review of Existing Algorithms

复杂的序列数据分析：现有算法的系统文献综述，Complex Sequential Data Analysis: A Systematic Literature Review of Existing Algorithms

专知会员服务

27+阅读 · 2020年7月24日

【学科交叉】抗生素发现的深度学习方法

【学科交叉】抗生素发现的深度学习方法

专知会员服务

25+阅读 · 2020年2月23日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【AI+生物医学】耶鲁大学最新博士论文《图先验、最优传输和深度学习在生物医学发现中的应用》231页pdf

【AI+生物医学】耶鲁大学最新博士论文《图先验、最优传输和深度学习在生物医学发现中的应用》231页pdf

专知

11+阅读 · 2022年4月29日

重磅！最新AI药物研发：白皮书、国内外技术报告、干货书、综述论文、关键技术最新论文（含实现代码）、数据集、教程课程讲解

重磅！最新AI药物研发：白皮书、国内外技术报告、干货书、综述论文、关键技术最新论文（含实现代码）、数据集、教程课程讲解

GenomicAI

14+阅读 · 2022年2月19日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

Facebook AI发布新版本FairSeq序列到序列(Seq2Seq)学习工具，可生成故事与快速推断

Facebook AI发布新版本FairSeq序列到序列(Seq2Seq)学习工具，可生成故事与快速推断

专知

23+阅读 · 2018年6月17日

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

专知

15+阅读 · 2018年6月11日

【论文推荐】最新六篇序列推荐相关论文—卷积序列嵌入学习、用户记忆网络、上下文GRU、迁移学习

【论文推荐】最新六篇序列推荐相关论文—卷积序列嵌入学习、用户记忆网络、上下文GRU、迁移学习

专知

10+阅读 · 2018年4月8日

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

专知

10+阅读 · 2018年2月1日

最新5篇生成对抗网络相关论文推荐—FusedGAN、DeblurGAN、AdvGAN、CipherGAN、MMD GANS

最新5篇生成对抗网络相关论文推荐—FusedGAN、DeblurGAN、AdvGAN、CipherGAN、MMD GANS

专知

23+阅读 · 2018年1月18日

读书报告 | Deep Learning for Extreme Multi-label Text Classification

读书报告 | Deep Learning for Extreme Multi-label Text Classification

科技创新与创业

48+阅读 · 2018年1月10日

多视角识别长非编码RNA和人类复杂疾病关联预测研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于蛋白质组学和代谢组学的mcr-1基因介导的多粘菌素耐药机制研究

国家自然科学基金

0+阅读 · 2016年12月31日

多标签学习框架下的多效抗菌肽抗菌活性预测及样本评估方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于异构网络的致病基因及其复合物预测方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于高通量测序技术的宏基因组学与宏转录组学在环境样品抗生素抗性基因全谱表征和宿主溯源中的应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多生物网络的蛋白质功能预测算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

Pseudomonas putida ND6中冗余降解基因（簇）的调控机制及分子生态学意义

国家自然科学基金

0+阅读 · 2014年12月31日

面向基因组相关性研究的迁移学习理论与方法

国家自然科学基金

0+阅读 · 2014年12月31日

基于细菌脂肪酸合成途径中多靶标的新型抗菌剂设计开发

国家自然科学基金

0+阅读 · 2014年12月31日

结核分枝杆菌中转录因子介导的耐药调控机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

BioAutoML-NAS: An End-to-End AutoML Framework for Multimodal Insect Classification via Neural Architecture Search on Large-Scale Biodiversity Data

Arxiv

0+阅读 · 6月15日

Weaving Multi-Source Evidence for Biomedical Reasoning: The BioMedHop Benchmark and BioWeave Framework

Arxiv

0+阅读 · 6月15日

Forecasting Bacterial Antimicrobial Resistance Trends Using Machine Learning on WHO GLASS Surveillance Data: A Retrieval-Augmented Generation Approach for Policy Decision Support

Arxiv

0+阅读 · 6月13日

Human genetic evidence is associated with drug approval across therapeutic areas: an observational analysis of 26,278 target-disease pairs with temporal validation and feature ablation

Arxiv

0+阅读 · 6月12日

GenAutoML: An Agentic Framework for Dynamic Architecture Generation and Optimization in Time-Series Analysis

Arxiv

0+阅读 · 6月11日

Entropy, Disagreement, and the Limits of Foundation Models in Genomics

Arxiv

0+阅读 · 6月9日

GenoMAS: A Multi-Agent Framework for Scientific Discovery via Code-Driven Gene Expression Analysis

Arxiv

0+阅读 · 5月17日

ToolMol: Evolutionary Agentic Framework for Multi-objective Drug Discovery

Arxiv

0+阅读 · 5月14日

Multi-Agent Reasoning with Consistency Verification Improves Uncertainty Calibration in Medical MCQA

Arxiv

0+阅读 · 3月25日

From Static Repositories to Agentic Knowledge Webs: ResearchTwin and the S-Index for Federated Human-AI Research Discovery

Arxiv

0+阅读 · 2月13日

VIP会员

文章信息

相关主题

最新内容

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

2+阅读 · 今天11:43

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

2+阅读 · 今天11:41

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

5+阅读 · 今天6:30

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

5+阅读 · 今天6:18

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

6+阅读 · 今天6:08

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

6+阅读 · 今天5:54

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

专知会员服务

7+阅读 · 今天5:22

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

专知会员服务

7+阅读 · 今天5:15

《国防领域敏感性分析白皮书》

《国防领域敏感性分析白皮书》

专知会员服务

7+阅读 · 今天3:42

综述 | 从问答到任务完成：Agent系统与Harness设计

综述 | 从问答到任务完成：Agent系统与Harness设计

专知会员服务

5+阅读 · 6月24日

Agentic RL：框架、实践与长程智能体训练

Agentic RL：框架、实践与长程智能体训练

专知会员服务

7+阅读 · 6月24日

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

10+阅读 · 6月24日

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

9+阅读 · 6月24日

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

7+阅读 · 6月24日

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

9+阅读 · 6月24日

相关VIP内容

《多智能体学习中的神经多样性研究》最新200页

《多智能体学习中的神经多样性研究》最新200页

专知会员服务

28+阅读 · 2025年9月12日

Transformer在药物发现及其他领域的应用综述

Transformer在药物发现及其他领域的应用综述

专知会员服务

17+阅读 · 2024年9月3日

大模型如何做药物发现？Mila等30多位作者发布《基础模型分子学习: 大规模多任务数据集》

大模型如何做药物发现？Mila等30多位作者发布《基础模型分子学习: 大规模多任务数据集》

专知会员服务

28+阅读 · 2023年10月10日

【普林斯顿博士论文】结构化生物医学数据的概率模型，130页pdf

【普林斯顿博士论文】结构化生物医学数据的概率模型，130页pdf

专知会员服务

24+阅读 · 2023年3月12日

Nat. Biotechnol. | 利用生成式深度学习模型发现Ⅱ型糖尿病药物-组学相关性

Nat. Biotechnol. | 利用生成式深度学习模型发现Ⅱ型糖尿病药物-组学相关性

专知会员服务

14+阅读 · 2023年1月9日

重磅！《人工智能与药物发现》白皮书发布，中国人工智能学会，158页pdf

重磅！《人工智能与药物发现》白皮书发布，中国人工智能学会，158页pdf

专知会员服务

71+阅读 · 2022年12月4日

Nat. Biotechnol. | 使用语言模型和深度学习的单序列蛋白质结构预测

Nat. Biotechnol. | 使用语言模型和深度学习的单序列蛋白质结构预测

专知会员服务

11+阅读 · 2022年10月17日

最新「图机器学习药物发现」综述论文，22页pdf245篇文献

最新「图机器学习药物发现」综述论文，22页pdf245篇文献

专知会员服务

100+阅读 · 2021年5月24日

复杂的序列数据分析：现有算法的系统文献综述，Complex Sequential Data Analysis: A Systematic Literature Review of Existing Algorithms

复杂的序列数据分析：现有算法的系统文献综述，Complex Sequential Data Analysis: A Systematic Literature Review of Existing Algorithms

专知会员服务

27+阅读 · 2020年7月24日

【学科交叉】抗生素发现的深度学习方法

【学科交叉】抗生素发现的深度学习方法

专知会员服务

25+阅读 · 2020年2月23日

热门VIP内容

开通专知VIP会员享更多权益服务

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

网状网络及其在军事领域的运用

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

相关资讯

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【AI+生物医学】耶鲁大学最新博士论文《图先验、最优传输和深度学习在生物医学发现中的应用》231页pdf

【AI+生物医学】耶鲁大学最新博士论文《图先验、最优传输和深度学习在生物医学发现中的应用》231页pdf

专知

11+阅读 · 2022年4月29日

重磅！最新AI药物研发：白皮书、国内外技术报告、干货书、综述论文、关键技术最新论文（含实现代码）、数据集、教程课程讲解

重磅！最新AI药物研发：白皮书、国内外技术报告、干货书、综述论文、关键技术最新论文（含实现代码）、数据集、教程课程讲解

GenomicAI

14+阅读 · 2022年2月19日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

Facebook AI发布新版本FairSeq序列到序列(Seq2Seq)学习工具，可生成故事与快速推断

Facebook AI发布新版本FairSeq序列到序列(Seq2Seq)学习工具，可生成故事与快速推断

专知

23+阅读 · 2018年6月17日

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

专知

15+阅读 · 2018年6月11日

【论文推荐】最新六篇序列推荐相关论文—卷积序列嵌入学习、用户记忆网络、上下文GRU、迁移学习

【论文推荐】最新六篇序列推荐相关论文—卷积序列嵌入学习、用户记忆网络、上下文GRU、迁移学习

专知

10+阅读 · 2018年4月8日

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

专知

10+阅读 · 2018年2月1日

最新5篇生成对抗网络相关论文推荐—FusedGAN、DeblurGAN、AdvGAN、CipherGAN、MMD GANS

最新5篇生成对抗网络相关论文推荐—FusedGAN、DeblurGAN、AdvGAN、CipherGAN、MMD GANS

专知

23+阅读 · 2018年1月18日

读书报告 | Deep Learning for Extreme Multi-label Text Classification

读书报告 | Deep Learning for Extreme Multi-label Text Classification

科技创新与创业

48+阅读 · 2018年1月10日

相关论文

BioAutoML-NAS: An End-to-End AutoML Framework for Multimodal Insect Classification via Neural Architecture Search on Large-Scale Biodiversity Data

Arxiv

0+阅读 · 6月15日

Weaving Multi-Source Evidence for Biomedical Reasoning: The BioMedHop Benchmark and BioWeave Framework

Arxiv

0+阅读 · 6月15日

Forecasting Bacterial Antimicrobial Resistance Trends Using Machine Learning on WHO GLASS Surveillance Data: A Retrieval-Augmented Generation Approach for Policy Decision Support

Arxiv

0+阅读 · 6月13日

Human genetic evidence is associated with drug approval across therapeutic areas: an observational analysis of 26,278 target-disease pairs with temporal validation and feature ablation

Arxiv

0+阅读 · 6月12日

GenAutoML: An Agentic Framework for Dynamic Architecture Generation and Optimization in Time-Series Analysis

Arxiv

0+阅读 · 6月11日

Entropy, Disagreement, and the Limits of Foundation Models in Genomics

Arxiv

0+阅读 · 6月9日

GenoMAS: A Multi-Agent Framework for Scientific Discovery via Code-Driven Gene Expression Analysis

Arxiv

0+阅读 · 5月17日

ToolMol: Evolutionary Agentic Framework for Multi-objective Drug Discovery

Arxiv

0+阅读 · 5月14日

Multi-Agent Reasoning with Consistency Verification Improves Uncertainty Calibration in Medical MCQA

Arxiv

0+阅读 · 3月25日

From Static Repositories to Agentic Knowledge Webs: ResearchTwin and the S-Index for Federated Human-AI Research Discovery

Arxiv

0+阅读 · 2月13日

相关基金

多视角识别长非编码RNA和人类复杂疾病关联预测研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于蛋白质组学和代谢组学的mcr-1基因介导的多粘菌素耐药机制研究

国家自然科学基金

0+阅读 · 2016年12月31日

多标签学习框架下的多效抗菌肽抗菌活性预测及样本评估方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于异构网络的致病基因及其复合物预测方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于高通量测序技术的宏基因组学与宏转录组学在环境样品抗生素抗性基因全谱表征和宿主溯源中的应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多生物网络的蛋白质功能预测算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

Pseudomonas putida ND6中冗余降解基因（簇）的调控机制及分子生态学意义

国家自然科学基金

0+阅读 · 2014年12月31日

面向基因组相关性研究的迁移学习理论与方法

国家自然科学基金

0+阅读 · 2014年12月31日

基于细菌脂肪酸合成途径中多靶标的新型抗菌剂设计开发

国家自然科学基金

0+阅读 · 2014年12月31日

结核分枝杆菌中转录因子介导的耐药调控机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员