Interpreting gene clusters from RNA-seq remains challenging, especially in antimicrobial resistance studies where mechanistic context is essential for hypothesis generation. Conventional enrichment methods summarize co-expressed modules using predefined categories, but often return sparse results and lack cluster-specific, literature-linked explanations. We present BIOGEN, an evidence-grounded multi-agent framework for post hoc interpretation of RNA-seq transcriptional modules that integrates biomedical retrieval, structured reasoning, and multi-critic verification. BIOGEN organizes evidence from PubMed and UniProt into traceable cluster-level interpretations with explicit support and confidence tiering. On a primary Salmonella enterica dataset, BIOGEN achieved strong evidence-grounding performance while reducing hallucination from 0.67 in an unconstrained LLM setting to 0.00 under retrieval-grounded configurations. Compared with KEGG/ORA and GO/ORA, BIOGEN recovered broader biological coverage, identifying substantially more biological themes per cluster. Across four additional bacterial RNA-seq datasets, BIOGEN maintained zero hallucination and consistently outperformed KEGG/ORA in cluster-level thematic coverage. These results position BIOGEN as an interpretive support framework that complements transcriptomic workflows through improved traceability, evidential transparency, and biological coverage.


翻译:解读RNA-seq中的基因簇仍然具有挑战性,尤其是在抗菌药物耐药性研究中,机制背景对于假设生成至关重要。传统的富集方法使用预定义类别总结共表达模块,但通常返回稀疏的结果,且缺乏基因簇特异性的、基于文献的解释。我们提出了BIOGEN,一个基于证据的多智能体框架,用于RNA-seq转录模块的事后解释,该框架整合了生物医学检索、结构化推理和多评论者验证。BIOGEN将来自PubMed和UniProt的证据组织成可追溯的基因簇级别解释,并附有明确的支持证据和置信度分级。在沙门氏菌主要数据集上,BIOGEN实现了强大的证据基础性能,同时将幻觉率从无约束大语言模型设置下的0.67降低到基于检索配置下的0.00。与KEGG/ORA和GO/ORA相比,BIOGEN恢复了更广泛的生物学覆盖范围,每个基因簇识别出的生物学主题显著增多。在四个额外的细菌RNA-seq数据集中,BIOGEN保持了零幻觉,并且在基因簇级别主题覆盖方面始终优于KEGG/ORA。这些结果将BIOGEN定位为一个解释性支持框架,通过改进的可追溯性、证据透明性和生物学覆盖来补充转录组学工作流。

0
下载
关闭预览

相关内容

《多智能体学习中的神经多样性研究》最新200页
专知会员服务
28+阅读 · 2025年9月12日
Transformer在药物发现及其他领域的应用综述
专知会员服务
17+阅读 · 2024年9月3日
最新「图机器学习药物发现」综述论文,22页pdf245篇文献
专知会员服务
100+阅读 · 2021年5月24日
【学科交叉】抗生素发现的深度学习方法
专知会员服务
25+阅读 · 2020年2月23日
读书报告 | Deep Learning for Extreme Multi-label Text Classification
科技创新与创业
48+阅读 · 2018年1月10日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
ECCV 2026 | MIMFlow:MIM与归一化流统一图像生成
专知会员服务
2+阅读 · 今天11:43
网状网络及其在军事领域的运用
专知会员服务
5+阅读 · 今天6:18
无美国参与的欧洲战争方式(万字长文)
专知会员服务
6+阅读 · 今天5:54
《国防领域敏感性分析白皮书》
专知会员服务
7+阅读 · 今天3:42
综述 | 从问答到任务完成:Agent系统与Harness设计
Agentic RL:框架、实践与长程智能体训练
专知会员服务
7+阅读 · 6月24日
重新思考无人机时代的生存能力
专知会员服务
9+阅读 · 6月24日
装甲突击旅:现代战争思考、战斗与组织
专知会员服务
7+阅读 · 6月24日
在人工智能加速决策环境中拓展OODA循环
专知会员服务
9+阅读 · 6月24日
相关资讯
读书报告 | Deep Learning for Extreme Multi-label Text Classification
科技创新与创业
48+阅读 · 2018年1月10日
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员