Efficient and Reproducible Biomedical Question Answering using Retrieval Augmented Generation - 专知论文

会员服务 ·

0

系统 · 生物 · 问答 · 自动问答 · 扩展性 ·

Efficient and Reproducible Biomedical Question Answering using Retrieval Augmented Generation

翻译：基于检索增强生成的高效可复现生物医学问答系统

Linus Stuhlmann,Michael Alexander Saxer,Jonathan Fürst

from arxiv, Minor wording corrections and updated author contact information

Biomedical question-answering (QA) systems require effective retrieval and generation components to ensure accuracy, efficiency, and scalability. This study systematically examines a Retrieval-Augmented Generation (RAG) system for biomedical QA, evaluating retrieval strategies and response time trade-offs. We first assess state-of-the-art retrieval methods, including BM25, BioBERT, MedCPT, and a hybrid approach, alongside common data stores such as Elasticsearch, MongoDB, and FAISS, on a ~10% subset of PubMed (2.4M documents) to measure indexing efficiency, retrieval latency, and retriever performance in the end-to-end RAG system. Based on these insights, we deploy the final RAG system on the full 24M PubMed corpus, comparing different retrievers' impact on overall performance. Evaluations of the retrieval depth show that retrieving 50 documents with BM25 before reranking with MedCPT optimally balances accuracy (0.90), recall (0.90), and response time (1.91s). BM25 retrieval time remains stable (82ms), while MedCPT incurs the main computational cost. These results highlight previously not well-known trade-offs in retrieval depth, efficiency, and scalability for biomedical QA. With open-source code, the system is fully reproducible and extensible.

翻译：生物医学问答系统需要高效的检索与生成组件以确保准确性、效率与可扩展性。本研究系统性地考察了一种用于生物医学问答的检索增强生成系统，评估了检索策略与响应时间的权衡关系。我们首先在PubMed约10%的子集（240万篇文献）上，评估了包括BM25、BioBERT、MedCPT及混合方法在内的前沿检索方法，以及Elasticsearch、MongoDB和FAISS等常用数据存储方案，以衡量端到端RAG系统中的索引效率、检索延迟与检索器性能。基于这些发现，我们在完整的2400万篇PubMed文献库上部署了最终RAG系统，比较了不同检索器对整体性能的影响。对检索深度的评估表明，在使用MedCPT进行重排序前，先用BM25检索50篇文献能在准确率（0.90）、召回率（0.90）和响应时间（1.91秒）之间达到最优平衡。BM25检索时间保持稳定（82毫秒），而MedCPT构成了主要计算成本。这些结果揭示了生物医学问答中检索深度、效率与可扩展性之间尚未被充分认识的权衡关系。通过开源代码，本系统具备完全的可复现性与可扩展性。

0

相关内容

生物信息学中的生成式人工智能：模型、应用与方法学进展的系统性综述

生物信息学中的生成式人工智能：模型、应用与方法学进展的系统性综述

专知会员服务

18+阅读 · 2025年11月10日

检索增强生成系统中的可信度：综述

检索增强生成系统中的可信度：综述

专知会员服务

44+阅读 · 2024年9月18日

大模型如何构建“医生级”问答？谷歌DeepMInd最新《基于大型语言模型的专家级医疗问答研究》论文，提出Med-PaLM 2

大模型如何构建“医生级”问答？谷歌DeepMInd最新《基于大型语言模型的专家级医疗问答研究》论文，提出Med-PaLM 2

专知会员服务

65+阅读 · 2023年5月21日

清华孙茂松等自然·通讯杂志发表生物医学知识计算研究《深度学习系统桥接分子结构和生物医学文本，具有与人类专业相当的理解力》

清华孙茂松等自然·通讯杂志发表生物医学知识计算研究《深度学习系统桥接分子结构和生物医学文本，具有与人类专业相当的理解力》

专知会员服务

22+阅读 · 2022年2月23日

【AAAI2022】利用神经检索器改进生物医学信息检索

【AAAI2022】利用神经检索器改进生物医学信息检索

专知会员服务

17+阅读 · 2022年1月21日

哈佛大学「生物医学网络表示学习」最新综述论文，44页pdf阐述表示学习在医学中应用

哈佛大学「生物医学网络表示学习」最新综述论文，44页pdf阐述表示学习在医学中应用

专知会员服务

61+阅读 · 2021年4月16日

【2020关键词提取】医学报告的关键词提取和结构化，Keyword extraction and structuralization of medical reports

【2020关键词提取】医学报告的关键词提取和结构化，Keyword extraction and structuralization of medical reports

专知会员服务

33+阅读 · 2020年5月2日

使用深度学习方法解析问题知识图谱存储查询知识点基于医疗垂直领域的对话系统 by Mr.Young GitHub

专知会员服务

44+阅读 · 2020年1月30日

【图机器学习论文】基于深度学习的网络生物学（Deep Learning for Network Biology）

【图机器学习论文】基于深度学习的网络生物学（Deep Learning for Network Biology）

专知会员服务

11+阅读 · 2019年12月16日

【MICCAI 2019 】Generative adversarial networks and adversarial methods in biomedical image analysis（基于生成对抗网络和对抗方法的生物医学图像分析），附223页PPT免费下载

【MICCAI 2019 】Generative adversarial networks and adversarial methods in biomedical image analysis（基于生成对抗网络和对抗方法的生物医学图像分析），附223页PPT免费下载

专知会员服务

32+阅读 · 2019年11月4日

哈佛大学｜构建知识图谱PrimeKG以实现精准医疗--数据与代码全部公开，帮你从零开始复现知识图谱

哈佛大学｜构建知识图谱PrimeKG以实现精准医疗--数据与代码全部公开，帮你从零开始复现知识图谱

GenomicAI

29+阅读 · 2022年5月4日

【AI+生物医学】耶鲁大学最新博士论文《图先验、最优传输和深度学习在生物医学发现中的应用》231页pdf

【AI+生物医学】耶鲁大学最新博士论文《图先验、最优传输和深度学习在生物医学发现中的应用》231页pdf

专知

11+阅读 · 2022年4月29日

如何搭建一个基于知识图谱的问答系统（以医疗行业为例）

如何搭建一个基于知识图谱的问答系统（以医疗行业为例）

PaperWeekly

51+阅读 · 2019年11月17日

论文浅尝 | 基于用户反馈的交互式自然语言回答系统提升机制

论文浅尝 | 基于用户反馈的交互式自然语言回答系统提升机制

开放知识图谱

20+阅读 · 2019年10月12日

【200+论文】深度强化学习、对话系统、文本生成、文本摘要、阅读理解等文献列表

【200+论文】深度强化学习、对话系统、文本生成、文本摘要、阅读理解等文献列表

专知

16+阅读 · 2019年1月14日

【论文推荐】最新八篇推荐系统相关论文—可解释推荐、上下文感知推荐系统、异构知识库嵌入、深度强化学习、移动推荐系统

【论文推荐】最新八篇推荐系统相关论文—可解释推荐、上下文感知推荐系统、异构知识库嵌入、深度强化学习、移动推荐系统

专知

17+阅读 · 2018年6月16日

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

专知

15+阅读 · 2018年6月11日

【论文推荐】最新5篇自动问答相关论文——多关系自动问答、知识图谱联合实体和关系、生物医学问题、维基百科语料数据、多句式旅游推荐

【论文推荐】最新5篇自动问答相关论文——多关系自动问答、知识图谱联合实体和关系、生物医学问题、维基百科语料数据、多句式旅游推荐

专知

23+阅读 · 2018年1月17日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

论文动态 | 基于知识图谱的问答系统关键技术研究 #02

论文动态 | 基于知识图谱的问答系统关键技术研究 #02

开放知识图谱

10+阅读 · 2017年8月6日

多级可控组装模拟生物体系的功能

国家自然科学基金

0+阅读 · 2015年12月31日

面向交互式问答的省略恢复技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

复杂纵向数据的分位回归建模及其在生物医学大数据中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

基于记忆学习与免疫系统的仿生控制研究

国家自然科学基金

7+阅读 · 2015年12月31日

医疗健康网站信息可信度与质量控制研究

国家自然科学基金

0+阅读 · 2014年12月31日

CPU和GPU混合体系结构上生物网络比对并行算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于多模态医学图像处理的多维可视化辅助诊疗关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

面向生物威胁快速反应的大数据分析关键技术

国家自然科学基金

0+阅读 · 2014年12月31日

生物网络的可计算建模

国家自然科学基金

2+阅读 · 2014年12月31日

生物神经系统的若干问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

MedVAR: Towards Scalable and Efficient Medical Image Generation via Next-scale Autoregressive Prediction

Arxiv

0+阅读 · 2月16日

MRAG: Benchmarking Retrieval-Augmented Generation for Bio-medicine

Arxiv

0+阅读 · 2月11日

Comprehensive Comparison of RAG Methods Across Multi-Domain Conversational QA

Arxiv

0+阅读 · 2月10日

BioACE: An Automated Framework for Biomedical Answer and Citation Evaluations

Arxiv

0+阅读 · 2月6日

Pursuing Best Industrial Practices for Retrieval-Augmented Generation in the Medical Domain

Arxiv

0+阅读 · 2月3日

MRAG: Benchmarking Retrieval-Augmented Generation for Bio-medicine

Arxiv

0+阅读 · 1月23日

BioProBench: Comprehensive Dataset and Benchmark in Biological Protocol Understanding and Reasoning

Arxiv

0+阅读 · 1月21日

Predicting Retrieval Utility and Answer Quality in Retrieval-Augmented Generation

Arxiv

0+阅读 · 1月20日

Incorporating Q&A Nuggets into Retrieval-Augmented Generation

Arxiv

0+阅读 · 1月19日

Utilizing Metadata for Better Retrieval-Augmented Generation

Arxiv

0+阅读 · 1月17日

VIP会员

文章信息

相关主题

最新内容

“天降毒雾”：无人机如何使化学战重返乌克兰战场

“天降毒雾”：无人机如何使化学战重返乌克兰战场

专知会员服务

0+阅读 · 41分钟前

伊朗不对称防空战略的演进

伊朗不对称防空战略的演进

专知会员服务

1+阅读 · 59分钟前

对抗环境下超视距目标打击的情报支援

对抗环境下超视距目标打击的情报支援

专知会员服务

10+阅读 · 7月22日

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

专知会员服务

4+阅读 · 7月22日

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

专知会员服务

8+阅读 · 7月22日

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

专知会员服务

8+阅读 · 7月22日

《无人机对海面作战影响评估》

《无人机对海面作战影响评估》

专知会员服务

15+阅读 · 7月21日

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

专知会员服务

13+阅读 · 7月21日

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

专知会员服务

4+阅读 · 7月21日

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

专知会员服务

6+阅读 · 7月21日

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

专知会员服务

9+阅读 · 7月21日

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

7+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

9+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

8+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

10+阅读 · 7月20日

相关VIP内容

生物信息学中的生成式人工智能：模型、应用与方法学进展的系统性综述

生物信息学中的生成式人工智能：模型、应用与方法学进展的系统性综述

专知会员服务

18+阅读 · 2025年11月10日

检索增强生成系统中的可信度：综述

检索增强生成系统中的可信度：综述

专知会员服务

44+阅读 · 2024年9月18日

大模型如何构建“医生级”问答？谷歌DeepMInd最新《基于大型语言模型的专家级医疗问答研究》论文，提出Med-PaLM 2

大模型如何构建“医生级”问答？谷歌DeepMInd最新《基于大型语言模型的专家级医疗问答研究》论文，提出Med-PaLM 2

专知会员服务

65+阅读 · 2023年5月21日

清华孙茂松等自然·通讯杂志发表生物医学知识计算研究《深度学习系统桥接分子结构和生物医学文本，具有与人类专业相当的理解力》

清华孙茂松等自然·通讯杂志发表生物医学知识计算研究《深度学习系统桥接分子结构和生物医学文本，具有与人类专业相当的理解力》

专知会员服务

22+阅读 · 2022年2月23日

【AAAI2022】利用神经检索器改进生物医学信息检索

【AAAI2022】利用神经检索器改进生物医学信息检索

专知会员服务

17+阅读 · 2022年1月21日

哈佛大学「生物医学网络表示学习」最新综述论文，44页pdf阐述表示学习在医学中应用

哈佛大学「生物医学网络表示学习」最新综述论文，44页pdf阐述表示学习在医学中应用

专知会员服务

61+阅读 · 2021年4月16日

【2020关键词提取】医学报告的关键词提取和结构化，Keyword extraction and structuralization of medical reports

【2020关键词提取】医学报告的关键词提取和结构化，Keyword extraction and structuralization of medical reports

专知会员服务

33+阅读 · 2020年5月2日

使用深度学习方法解析问题知识图谱存储查询知识点基于医疗垂直领域的对话系统 by Mr.Young GitHub

专知会员服务

44+阅读 · 2020年1月30日

【图机器学习论文】基于深度学习的网络生物学（Deep Learning for Network Biology）

【图机器学习论文】基于深度学习的网络生物学（Deep Learning for Network Biology）

专知会员服务

11+阅读 · 2019年12月16日

【MICCAI 2019 】Generative adversarial networks and adversarial methods in biomedical image analysis（基于生成对抗网络和对抗方法的生物医学图像分析），附223页PPT免费下载

【MICCAI 2019 】Generative adversarial networks and adversarial methods in biomedical image analysis（基于生成对抗网络和对抗方法的生物医学图像分析），附223页PPT免费下载

专知会员服务

32+阅读 · 2019年11月4日

热门VIP内容

开通专知VIP会员享更多权益服务

伊朗不对称防空战略的演进

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

“天降毒雾”：无人机如何使化学战重返乌克兰战场

对抗环境下超视距目标打击的情报支援

相关资讯

哈佛大学｜构建知识图谱PrimeKG以实现精准医疗--数据与代码全部公开，帮你从零开始复现知识图谱

哈佛大学｜构建知识图谱PrimeKG以实现精准医疗--数据与代码全部公开，帮你从零开始复现知识图谱

GenomicAI

29+阅读 · 2022年5月4日

【AI+生物医学】耶鲁大学最新博士论文《图先验、最优传输和深度学习在生物医学发现中的应用》231页pdf

【AI+生物医学】耶鲁大学最新博士论文《图先验、最优传输和深度学习在生物医学发现中的应用》231页pdf

专知

11+阅读 · 2022年4月29日

如何搭建一个基于知识图谱的问答系统（以医疗行业为例）

如何搭建一个基于知识图谱的问答系统（以医疗行业为例）

PaperWeekly

51+阅读 · 2019年11月17日

论文浅尝 | 基于用户反馈的交互式自然语言回答系统提升机制

论文浅尝 | 基于用户反馈的交互式自然语言回答系统提升机制

开放知识图谱

20+阅读 · 2019年10月12日

【200+论文】深度强化学习、对话系统、文本生成、文本摘要、阅读理解等文献列表

【200+论文】深度强化学习、对话系统、文本生成、文本摘要、阅读理解等文献列表

专知

16+阅读 · 2019年1月14日

【论文推荐】最新八篇推荐系统相关论文—可解释推荐、上下文感知推荐系统、异构知识库嵌入、深度强化学习、移动推荐系统

【论文推荐】最新八篇推荐系统相关论文—可解释推荐、上下文感知推荐系统、异构知识库嵌入、深度强化学习、移动推荐系统

专知

17+阅读 · 2018年6月16日

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

【论文笔记】对话模型新方法，条件DialogWAE生成多模态回答

专知

15+阅读 · 2018年6月11日

【论文推荐】最新5篇自动问答相关论文——多关系自动问答、知识图谱联合实体和关系、生物医学问题、维基百科语料数据、多句式旅游推荐

【论文推荐】最新5篇自动问答相关论文——多关系自动问答、知识图谱联合实体和关系、生物医学问题、维基百科语料数据、多句式旅游推荐

专知

23+阅读 · 2018年1月17日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

论文动态 | 基于知识图谱的问答系统关键技术研究 #02

论文动态 | 基于知识图谱的问答系统关键技术研究 #02

开放知识图谱

10+阅读 · 2017年8月6日

相关论文

MedVAR: Towards Scalable and Efficient Medical Image Generation via Next-scale Autoregressive Prediction

Arxiv

0+阅读 · 2月16日

MRAG: Benchmarking Retrieval-Augmented Generation for Bio-medicine

Arxiv

0+阅读 · 2月11日

Comprehensive Comparison of RAG Methods Across Multi-Domain Conversational QA

Arxiv

0+阅读 · 2月10日

BioACE: An Automated Framework for Biomedical Answer and Citation Evaluations

Arxiv

0+阅读 · 2月6日

Pursuing Best Industrial Practices for Retrieval-Augmented Generation in the Medical Domain

Arxiv

0+阅读 · 2月3日

MRAG: Benchmarking Retrieval-Augmented Generation for Bio-medicine

Arxiv

0+阅读 · 1月23日

BioProBench: Comprehensive Dataset and Benchmark in Biological Protocol Understanding and Reasoning

Arxiv

0+阅读 · 1月21日

Predicting Retrieval Utility and Answer Quality in Retrieval-Augmented Generation

Arxiv

0+阅读 · 1月20日

Incorporating Q&A Nuggets into Retrieval-Augmented Generation

Arxiv

0+阅读 · 1月19日

Utilizing Metadata for Better Retrieval-Augmented Generation

Arxiv

0+阅读 · 1月17日

相关基金

多级可控组装模拟生物体系的功能

国家自然科学基金

0+阅读 · 2015年12月31日

面向交互式问答的省略恢复技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

复杂纵向数据的分位回归建模及其在生物医学大数据中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

基于记忆学习与免疫系统的仿生控制研究

国家自然科学基金

7+阅读 · 2015年12月31日

医疗健康网站信息可信度与质量控制研究

国家自然科学基金

0+阅读 · 2014年12月31日

CPU和GPU混合体系结构上生物网络比对并行算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于多模态医学图像处理的多维可视化辅助诊疗关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

面向生物威胁快速反应的大数据分析关键技术

国家自然科学基金

0+阅读 · 2014年12月31日

生物网络的可计算建模

国家自然科学基金

2+阅读 · 2014年12月31日

生物神经系统的若干问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员