Large language models (LLMs) exhibit enhanced capabilities in language understanding and generation. By utilizing their embedded knowledge, LLMs are increasingly used as conversational recommender systems (CRS), achieving improved performance across diverse scenarios. However, existing LLM-based methods rely on pretrained knowledge without external retrieval mechanisms for novel items. Additionally, the lack of a unified corpus poses challenges for integrating retrieval augmentation into CRS. Motivated by these challenges, we present RAR, a novel two-stage retrieval augmented conversational recommendation framework that aligns retrieval and generation to enhance both performance and factuality. To support this framework and provide a unified corpus, we construct a large-scale movie corpus, comprising over 300k movies with rich metadata, such as titles, casts and plot summaries. Leveraging this data, our primary contribution is RAR, the first framework to departs from standard two-stage CRS by dynamically bridging retrieval and generation. First, a retriever model generates candidate items based on user history; in the subsequent stage, an LLM refines the recommendations by incorporating conversational context with retrieved results. In addition, we introduce a novel reinforcement learning (RL) method that leverages LLM feedback to iteratively update the retriever. By creating a collaborative feedback loop that reinforces sampled candidate sets with higher ranking metrics, RAR effectively mitigates the misalignment between the retrieval and generation stages. Furthermore, grounding the LLM in factual metadata allows our RL-driven approach to capture subtle user intentions and generate context-aware recommendations with reduced hallucinations. We validate our approach through extensive experiments on multiple benchmarks, where RAR consistently outperforms state-of-the-art baseline methods.


翻译:大语言模型(LLMs)在语言理解与生成方面展现出更强的能力。通过利用其内置知识,LLMs越来越多地被用作对话推荐系统(CRS),在不同场景中取得了性能提升。然而,现有基于LLM的方法仅依赖预训练知识,缺乏针对新物品的外部检索机制。此外,统一语料库的缺失为将检索增强技术整合到CRS中带来了挑战。受这些挑战启发,我们提出RAR——一种新颖的两阶段检索增强对话推荐框架,通过对齐检索与生成过程来提升性能与事实正确性。为支撑该框架并提供统一语料库,我们构建了一个大规模电影语料库,包含超过30万部电影及其丰富的元数据(如标题、演员阵容和剧情简介)。基于这些数据,我们的核心贡献是RAR,这是首个突破标准两阶段CRS范式、通过动态桥接检索与生成环节的框架。首先,检索器模型根据用户历史生成候选项目;随后,大语言模型结合检索结果与对话上下文对推荐进行精炼。此外,我们提出一种创新的强化学习(RL)方法,利用LLM反馈迭代更新检索器。通过构建协作反馈循环(强化具有更高排序指标的采样候选集),RAR有效缓解了检索与生成阶段之间的对齐偏差。更关键的是,将LLM锚定于事实元数据,使得我们基于RL的方法能够捕捉用户细微意图,并生成降低幻觉的上下文感知推荐。我们在多个基准上通过大量实验验证了该方法,结果表明RAR持续优于最先进的基线方法。

0
下载
关闭预览

相关内容

大语言模型中的检索与结构化增强生成综述
专知会员服务
34+阅读 · 2025年9月17日
检索增强生成(RAG)与推理的协同作用:一项系统综述
专知会员服务
34+阅读 · 2025年4月27日
定制化大型语言模型的图检索增强生成综述
专知会员服务
38+阅读 · 2025年1月28日
大规模语言模型增强推荐系统:分类、趋势、应用与未来
专知会员服务
40+阅读 · 2024年12月22日
大型语言模型增强强化学习综述:概念、分类和方法
专知会员服务
57+阅读 · 2024年4月4日
KnowledGPT:基于知识库的检索和存储访问增强大型语言模型
【论文笔记】基于强化学习的人机对话
专知
20+阅读 · 2019年9月21日
初学者系列:推荐系统Wide & Deep Learning详解
知识在检索式对话系统的应用
微信AI
32+阅读 · 2018年9月20日
深度学习在推荐系统中的应用综述(最全)
七月在线实验室
17+阅读 · 2018年5月5日
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
40+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Arxiv
12+阅读 · 2023年5月31日
VIP会员
相关主题
最新内容
美国从乌克兰无人机战争中学习经验
专知会员服务
6+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
3+阅读 · 6月21日
学习数据的几何:形状空间分析数学综述
专知会员服务
10+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
12+阅读 · 6月17日
相关基金
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
40+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员