基于联合随机逼近的检索增强生成模型端到端训练改进 (Improving End-to-End Training of Retrieval-Augmented Generation Models via Joint Stochastic Approximation) - 专知论文

会员服务 ·

0

JSA · 端到端 · 随机逼近 · 检索增强 · 参数化 ·

Improving End-to-End Training of Retrieval-Augmented Generation Models via Joint Stochastic Approximation

翻译：基于联合随机逼近的检索增强生成模型端到端训练改进

Hongyu Cao,Yuxuan Wu,Yucheng Cai,Xianyu Zhao,Zhijian Ou

Retrieval-augmented generation (RAG) has become a widely recognized paradigm to combine parametric memory with non-parametric memories. An RAG model consists of two serial connecting components (retriever and generator). A major challenge in end-to-end optimization of the RAG model is that marginalization over relevant passages (modeled as discrete latent variables) from a knowledge base is required. Traditional top-K marginalization and variational RAG (VRAG) suffer from biased or high-variance gradient estimates. In this paper, we propose and develop joint stochastic approximation (JSA) based end-to-end training of RAG, which is referred to as JSA-RAG. The JSA algorithm is a stochastic extension of the EM (expectation-maximization) algorithm and is particularly powerful in estimating discrete latent variable models. Extensive experiments are conducted on five datasets for two tasks (open-domain question answering, knowledge-grounded dialogs) and show that JSA-RAG significantly outperforms both vanilla RAG and VRAG. Further analysis shows the efficacy of JSA-RAG from the perspectives of generation, retrieval, and low-variance gradient estimate.

翻译：检索增强生成（RAG）已成为将参数化记忆与非参数化记忆相结合的广受认可的范式。RAG模型由两个串行连接的组件（检索器与生成器）构成。对RAG模型进行端到端优化的主要挑战在于，需要从知识库中对相关段落（建模为离散隐变量）进行边缘化处理。传统的Top-K边缘化方法与变分RAG（VRAG）存在梯度估计有偏或高方差的问题。本文提出并发展了基于联合随机逼近（JSA）的RAG端到端训练方法，称为JSA-RAG。JSA算法是EM（期望最大化）算法的随机扩展，在估计离散隐变量模型方面具有显著优势。我们在两个任务（开放域问答、知识支撑对话）的五个数据集上进行了大量实验，结果表明JSA-RAG显著优于原始RAG与VRAG。进一步分析从生成质量、检索效果及低方差梯度估计等角度验证了JSA-RAG的有效性。

0

相关内容

JSA

JSA：Journal of Systems Architecture: Embedded Software Design Explanation：系统架构期刊：嵌入式软件设计。 Publisher：Elsevier。 SIT:http://dblp.uni-trier.de/db/journals/jsa/

检索增强生成（RAG）技术，261页slides

检索增强生成（RAG）技术，261页slides

专知会员服务

41+阅读 · 2025年10月16日

【SIGIR2025教程】动态与参数化检索增强生成

【SIGIR2025教程】动态与参数化检索增强生成

专知会员服务

16+阅读 · 2025年7月14日

多模态检索增强生成的综合综述

多模态检索增强生成的综合综述

专知会员服务

43+阅读 · 2025年2月17日

迈向可信的检索增强生成：大语言模型综述

迈向可信的检索增强生成：大语言模型综述

专知会员服务

29+阅读 · 2025年2月12日

定制化大型语言模型的图检索增强生成综述

定制化大型语言模型的图检索增强生成综述

专知会员服务

37+阅读 · 2025年1月28日

图增强生成（GraphRAG）

图增强生成（GraphRAG）

专知会员服务

34+阅读 · 2025年1月4日

【新书】解锁数据与生成型AI和RAG的结合：通过RAG将内部数据与大型语言模型集成，提升生成型AI系统的能力

【新书】解锁数据与生成型AI和RAG的结合：通过RAG将内部数据与大型语言模型集成，提升生成型AI系统的能力

专知会员服务

48+阅读 · 2024年12月17日

图检索增强生成研究进展

图检索增强生成研究进展

专知会员服务

36+阅读 · 2024年11月5日

检索增强生成系统中的可信度：综述

检索增强生成系统中的可信度：综述

专知会员服务

43+阅读 · 2024年9月18日

《大型语言模型中基于检索的文本生成》综述

《大型语言模型中基于检索的文本生成》综述

专知会员服务

59+阅读 · 2024年4月18日

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

最新《生成式对抗网络GAN进展》论文

最新《生成式对抗网络GAN进展》论文

专知

95+阅读 · 2019年4月5日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

AINLP

35+阅读 · 2018年11月6日

【论文推荐】最新六篇强化学习相关论文—Sublinear、机器阅读理解、加速强化学习、对抗性奖励学习、人机交互

【论文推荐】最新六篇强化学习相关论文—Sublinear、机器阅读理解、加速强化学习、对抗性奖励学习、人机交互

专知

17+阅读 · 2018年4月28日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

39+阅读 · 2015年12月31日

基于多目标优化的约束模式挖掘方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

有效融合多源异构数据的集成分类器研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于极限学习单元的多生物特征图像深度学习建模与识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

基于框架提升变换的多源图像融合研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

Use Graph When It Needs: Efficiently and Adaptively Integrating Retrieval-Augmented Generation with Graphs

Arxiv

0+阅读 · 2月3日

A-RAG: Scaling Agentic Retrieval-Augmented Generation via Hierarchical Retrieval Interfaces

Arxiv

0+阅读 · 2月3日

Towards Transparent RAG: Fostering Evidence Traceability in LLM Generation via Reinforcement Learning

Arxiv

0+阅读 · 1月29日

Predict the Retrieval! Test time adaptation for Retrieval Augmented Generation

Arxiv

0+阅读 · 1月16日

Structured Knowledge Representation through Contextual Pages for Retrieval-Augmented Generation

Arxiv

0+阅读 · 1月14日

Learning to Extract Rational Evidence via Reinforcement Learning for Retrieval-Augmented Generation

Arxiv

0+阅读 · 1月9日

OptiSet: Unified Optimizing Set Selection and Ranking for Retrieval-Augmented Generation

Arxiv

0+阅读 · 1月8日

Neurosymbolic Retrievers for Retrieval-augmented Generation

Arxiv

0+阅读 · 1月8日

After Retrieval, Before Generation: Enhancing the Trustworthiness of Large Language Models in Retrieval-Augmented Generation

Arxiv

0+阅读 · 1月7日

Improving Multi-step RAG with Hypergraph-based Memory for Long-Context Complex Relational Modeling

Arxiv

0+阅读 · 1月2日

VIP会员

文章信息

相关主题

相关VIP内容

检索增强生成（RAG）技术，261页slides

检索增强生成（RAG）技术，261页slides

专知会员服务

41+阅读 · 2025年10月16日

【SIGIR2025教程】动态与参数化检索增强生成

【SIGIR2025教程】动态与参数化检索增强生成

专知会员服务

16+阅读 · 2025年7月14日

多模态检索增强生成的综合综述

多模态检索增强生成的综合综述

专知会员服务

43+阅读 · 2025年2月17日

迈向可信的检索增强生成：大语言模型综述

迈向可信的检索增强生成：大语言模型综述

专知会员服务

29+阅读 · 2025年2月12日

定制化大型语言模型的图检索增强生成综述

定制化大型语言模型的图检索增强生成综述

专知会员服务

37+阅读 · 2025年1月28日

图增强生成（GraphRAG）

图增强生成（GraphRAG）

专知会员服务

34+阅读 · 2025年1月4日

【新书】解锁数据与生成型AI和RAG的结合：通过RAG将内部数据与大型语言模型集成，提升生成型AI系统的能力

【新书】解锁数据与生成型AI和RAG的结合：通过RAG将内部数据与大型语言模型集成，提升生成型AI系统的能力

专知会员服务

48+阅读 · 2024年12月17日

图检索增强生成研究进展

图检索增强生成研究进展

专知会员服务

36+阅读 · 2024年11月5日

检索增强生成系统中的可信度：综述

检索增强生成系统中的可信度：综述

专知会员服务

43+阅读 · 2024年9月18日

《大型语言模型中基于检索的文本生成》综述

《大型语言模型中基于检索的文本生成》综述

专知会员服务

59+阅读 · 2024年4月18日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人机与战争：被忽视的环境影响及无人机保护潜力》

俄罗斯规划未来无人机驱动军队

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

《人工智能、武器与影响力：前沿模型在模拟核危机中展现复杂推理》2026最新46页报告

相关资讯

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

港科大浙大最新《深度生成模型三维表示》综述，20页pdf全面阐述3D生成进展

专知

12+阅读 · 2022年10月31日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

最新《生成式对抗网络GAN进展》论文

最新《生成式对抗网络GAN进展》论文

专知

95+阅读 · 2019年4月5日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

AINLP

35+阅读 · 2018年11月6日

【论文推荐】最新六篇强化学习相关论文—Sublinear、机器阅读理解、加速强化学习、对抗性奖励学习、人机交互

【论文推荐】最新六篇强化学习相关论文—Sublinear、机器阅读理解、加速强化学习、对抗性奖励学习、人机交互

专知

17+阅读 · 2018年4月28日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

相关论文

Use Graph When It Needs: Efficiently and Adaptively Integrating Retrieval-Augmented Generation with Graphs

Arxiv

0+阅读 · 2月3日

A-RAG: Scaling Agentic Retrieval-Augmented Generation via Hierarchical Retrieval Interfaces

Arxiv

0+阅读 · 2月3日

Towards Transparent RAG: Fostering Evidence Traceability in LLM Generation via Reinforcement Learning

Arxiv

0+阅读 · 1月29日

Predict the Retrieval! Test time adaptation for Retrieval Augmented Generation

Arxiv

0+阅读 · 1月16日

Structured Knowledge Representation through Contextual Pages for Retrieval-Augmented Generation

Arxiv

0+阅读 · 1月14日

Learning to Extract Rational Evidence via Reinforcement Learning for Retrieval-Augmented Generation

Arxiv

0+阅读 · 1月9日

OptiSet: Unified Optimizing Set Selection and Ranking for Retrieval-Augmented Generation

Arxiv

0+阅读 · 1月8日

Neurosymbolic Retrievers for Retrieval-augmented Generation

Arxiv

0+阅读 · 1月8日

After Retrieval, Before Generation: Enhancing the Trustworthiness of Large Language Models in Retrieval-Augmented Generation

Arxiv

0+阅读 · 1月7日

Improving Multi-step RAG with Hypergraph-based Memory for Long-Context Complex Relational Modeling

Arxiv

0+阅读 · 1月2日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

39+阅读 · 2015年12月31日

基于多目标优化的约束模式挖掘方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于重要性采样的并行离策略强化学习方法研究

国家自然科学基金

23+阅读 · 2015年12月31日

有效融合多源异构数据的集成分类器研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于极限学习单元的多生物特征图像深度学习建模与识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

基于框架提升变换的多源图像融合研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员