LLM-Enhanced Reinforcement Learning for Long-Term User Satisfaction in Interactive Recommendation - 专知论文

会员服务 ·

0

交互 · 分层 · 强化学习 · 大语言模型 · 系统 ·

LLM-Enhanced Reinforcement Learning for Long-Term User Satisfaction in Interactive Recommendation

翻译：LLM增强的强化学习在交互式推荐中提升长期用户满意度

Chongjun Xia,Yanchun Peng,Xianzhi Wang

Interactive recommender systems can dynamically adapt to user feedback, but often suffer from content homogeneity and filter bubble effects due to overfitting short-term user preferences. While recent efforts aim to improve content diversity, they predominantly operate in static or one-shot settings, neglecting the long-term evolution of user interests. Reinforcement learning provides a principled framework for optimizing long-term user satisfaction by modeling sequential decision-making processes. However, its application in recommendation is hindered by sparse, long-tailed user-item interactions and limited semantic planning capabilities. In this work, we propose LLM-Enhanced Reinforcement Learning (LERL), a novel hierarchical recommendation framework that integrates the semantic planning power of LLM with the fine-grained adaptability of RL. LERL consists of a high-level LLM-based planner that selects semantically diverse content categories, and a low-level RL policy that recommends personalized items within the selected semantic space. This hierarchical design narrows the action space, enhances planning efficiency, and mitigates overexposure to redundant content. Extensive experiments on real-world datasets demonstrate that LERL significantly improves long-term user satisfaction when compared with state-of-the-art baselines. The implementation of LERL is available at https://github.com/1163710212/LERL.

翻译：交互式推荐系统能够根据用户反馈动态调整，但由于过度拟合短期用户偏好，常面临内容同质化和信息茧房效应。尽管近期研究致力于提升内容多样性，但大多局限于静态或单次推荐场景，忽略了用户兴趣的长期演化过程。强化学习通过建模序列化决策过程，为优化长期用户满意度提供了理论框架，但其在推荐领域的应用受到稀疏、长尾的用户-物品交互以及有限语义规划能力的制约。本文提出LLM增强的强化学习框架，这是一种创新的分层推荐架构，融合了LLM的语义规划能力与RL的细粒度适应性。该框架包含高层LLM规划器（负责选择语义多样化的内容类别）和底层RL策略（在选定语义空间内推荐个性化物品）。这种分层设计通过压缩动作空间提升规划效率，并缓解冗余内容的过度曝光问题。基于真实数据集的实验表明，相较于现有先进基线方法，本框架能显著提升长期用户满意度。项目代码已开源：https://github.com/1163710212/LERL。

0

相关内容

【IJCAI2024教程】大语言模型（LLMs）时代的推荐系统

【IJCAI2024教程】大语言模型（LLMs）时代的推荐系统

专知会员服务

51+阅读 · 2024年8月5日

【阿姆斯特丹博士论文】从有偏见的用户互动中学习推荐系统，127页pdf

【阿姆斯特丹博士论文】从有偏见的用户互动中学习推荐系统，127页pdf

专知会员服务

24+阅读 · 2024年2月4日

推荐如何用多模态信息？南洋理工最新《多模态推荐系统》综述，33页pdf阐述多模态推荐系统的分类、评价和未来方向

推荐如何用多模态信息？南洋理工最新《多模态推荐系统》综述，33页pdf阐述多模态推荐系统的分类、评价和未来方向

专知会员服务

49+阅读 · 2023年2月13日

推荐如何用元学习？上海交大最新《深度元学习推荐系统综述》，40页pdf涵盖135篇文献阐述深度学习元学习推荐方法体系

推荐如何用元学习？上海交大最新《深度元学习推荐系统综述》，40页pdf涵盖135篇文献阐述深度学习元学习推荐方法体系

专知会员服务

53+阅读 · 2022年6月14日

【深度推荐系统：基础与进展】密歇根州立大学、香港理工大学、百度专家联合推出教程，Deep Recommender System: Fundamentals and Advances

【深度推荐系统：基础与进展】密歇根州立大学、香港理工大学、百度专家联合推出教程，Deep Recommender System: Fundamentals and Advances

专知会员服务

20+阅读 · 2022年2月25日

基于强化学习的推荐研究综述

基于强化学习的推荐研究综述

专知会员服务

84+阅读 · 2021年10月21日

强化学习如何用于推荐？厦大最新《强化学习推荐系统》综述论文，25页pdf156篇文献论述五种典型RL推荐方法

专知会员服务

80+阅读 · 2021年9月23日

WWW21最新「深度学习推荐系统」教程，230页PPT阐述深度强化学习、自动机器学习和GNN在推荐系统应用进展

WWW21最新「深度学习推荐系统」教程，230页PPT阐述深度强化学习、自动机器学习和GNN在推荐系统应用进展

专知会员服务

124+阅读 · 2021年4月26日

个性化推荐系统技术进展

个性化推荐系统技术进展

专知会员服务

66+阅读 · 2020年8月15日

对话推荐系统综述论文，35页pdf，A Survey on Conversational Recommender Systems

对话推荐系统综述论文，35页pdf，A Survey on Conversational Recommender Systems

专知会员服务

117+阅读 · 2020年4月3日

MSRA开源基于注意力机制的全新推荐模型，融合用户长短期偏好

MSRA开源基于注意力机制的全新推荐模型，融合用户长短期偏好

AI前线

15+阅读 · 2019年9月22日

IJCAI 2019 | 为推荐系统生成高质量的文本解释：基于互注意力机制的多任务学习模型

IJCAI 2019 | 为推荐系统生成高质量的文本解释：基于互注意力机制的多任务学习模型

微软研究院AI头条

18+阅读 · 2019年8月13日

基于深度学习的序列推荐系统：概念，算法与评估

基于深度学习的序列推荐系统：概念，算法与评估

专知

24+阅读 · 2019年6月6日

强化学习落地！京东等发布综述《深度强化学习在搜索，推荐和在线广告中的应用》

强化学习落地！京东等发布综述《深度强化学习在搜索，推荐和在线广告中的应用》

专知

26+阅读 · 2019年2月19日

推荐系统

炼数成金订阅号

28+阅读 · 2019年1月17日

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

专知

24+阅读 · 2018年9月6日

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

AI前线

11+阅读 · 2018年5月15日

深度学习在推荐系统中的应用综述（最全）

深度学习在推荐系统中的应用综述（最全）

七月在线实验室

17+阅读 · 2018年5月5日

【论文推荐】最新七篇推荐系统相关论文—影响兴趣、知识Embeddings、音乐推荐、非结构化、一致性、显式和隐式特征、知识图谱

【论文推荐】最新七篇推荐系统相关论文—影响兴趣、知识Embeddings、音乐推荐、非结构化、一致性、显式和隐式特征、知识图谱

专知

14+阅读 · 2018年3月28日

深度学习在推荐系统上的应用

深度学习在推荐系统上的应用

架构文摘

13+阅读 · 2018年2月22日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

40+阅读 · 2015年12月31日

面向推荐系统中异构隐式反馈建模的迁移学习技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于主题网络的用户内在兴趣发现及演进研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于在线消费者购买意向挖掘的个性化推荐研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于社会媒体异质关系挖掘的用户兴趣建模方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

复杂社交网络环境下基于社区演化和传递效应的推荐策略研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于文本情感和异质网络分析的社会化推荐研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于领域知识和链路预测的个性化推荐研究

国家自然科学基金

4+阅读 · 2014年12月31日

社交网络环境下基于协同过滤的上下文感知推荐系统研究

国家自然科学基金

6+阅读 · 2014年12月31日

RecBundle: A Next-Generation Geometric Paradigm for Explainable Recommender Systems

Arxiv

0+阅读 · 3月17日

LLM-driven Multimodal Recommendation

Arxiv

0+阅读 · 3月13日

Modeling Stage-wise Evolution of User Interests for News Recommendation

Arxiv

0+阅读 · 3月11日

Proactive Guiding Strategy for Item-side Fairness in Interactive Recommendation

Arxiv

0+阅读 · 3月3日

Sequential Data Augmentation for Generative Recommendation

Arxiv

0+阅读 · 2月22日

Enhancing Long-Term Welfare in Recommender Systems: An Information Revelation Approach

Arxiv

0+阅读 · 2月16日

Query-Mixed Interest Extraction and Heterogeneous Interaction: A Scalable CTR Model for Industrial Recommender Systems

Arxiv

0+阅读 · 2月10日

Can Explanations Improve Recommendations? A Joint Optimization with LLM Reasoning

Arxiv

0+阅读 · 2月10日

Towards Sample-Efficient and Stable Reinforcement Learning for LLM-based Recommendation

Arxiv

0+阅读 · 1月31日

Recommender Systems in the Era of Large Language Models (LLMs)

Arxiv

18+阅读 · 2023年8月5日

VIP会员

文章信息

相关主题

大语言模型

最新内容

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

专知会员服务

4+阅读 · 7月17日

《边缘端实时无线感知赋能现场多机器人部署》200页

《边缘端实时无线感知赋能现场多机器人部署》200页

专知会员服务

5+阅读 · 7月17日

战力倍增器：自主武器系统与乌克兰及加沙冲突

战力倍增器：自主武器系统与乌克兰及加沙冲突

专知会员服务

4+阅读 · 7月17日

人工智能赋能战场情报：提速决策进程

人工智能赋能战场情报：提速决策进程

专知会员服务

2+阅读 · 7月17日

《拥抱新兴技术：面向未来军官的教育革新》

《拥抱新兴技术：面向未来军官的教育革新》

专知会员服务

5+阅读 · 7月17日

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

专知会员服务

2+阅读 · 7月17日

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

专知会员服务

3+阅读 · 7月17日

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

专知会员服务

11+阅读 · 7月16日

《无人地面战车（UGV）的崛起》报告

《无人地面战车（UGV）的崛起》报告

专知会员服务

7+阅读 · 7月16日

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

专知会员服务

6+阅读 · 7月16日

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

专知会员服务

13+阅读 · 7月16日

美陆军任务式指挥人工智能解决方案

美陆军任务式指挥人工智能解决方案

专知会员服务

13+阅读 · 7月16日

ICML 2026 | 理论级自动形式化：从孤立命题到统一形式化知识库

ICML 2026 | 理论级自动形式化：从孤立命题到统一形式化知识库

专知会员服务

9+阅读 · 7月16日

综述 | 现代智能体自我改进，从模型更新到脚手架演化

综述 | 现代智能体自我改进，从模型更新到脚手架演化

专知会员服务

15+阅读 · 7月16日

美国陆军宣布“项目融合-顶点6”：现代化进程的关键里程碑

美国陆军宣布“项目融合-顶点6”：现代化进程的关键里程碑

专知会员服务

13+阅读 · 7月15日

相关VIP内容

【IJCAI2024教程】大语言模型（LLMs）时代的推荐系统

【IJCAI2024教程】大语言模型（LLMs）时代的推荐系统

专知会员服务

51+阅读 · 2024年8月5日

【阿姆斯特丹博士论文】从有偏见的用户互动中学习推荐系统，127页pdf

【阿姆斯特丹博士论文】从有偏见的用户互动中学习推荐系统，127页pdf

专知会员服务

24+阅读 · 2024年2月4日

推荐如何用多模态信息？南洋理工最新《多模态推荐系统》综述，33页pdf阐述多模态推荐系统的分类、评价和未来方向

推荐如何用多模态信息？南洋理工最新《多模态推荐系统》综述，33页pdf阐述多模态推荐系统的分类、评价和未来方向

专知会员服务

49+阅读 · 2023年2月13日

推荐如何用元学习？上海交大最新《深度元学习推荐系统综述》，40页pdf涵盖135篇文献阐述深度学习元学习推荐方法体系

推荐如何用元学习？上海交大最新《深度元学习推荐系统综述》，40页pdf涵盖135篇文献阐述深度学习元学习推荐方法体系

专知会员服务

53+阅读 · 2022年6月14日

【深度推荐系统：基础与进展】密歇根州立大学、香港理工大学、百度专家联合推出教程，Deep Recommender System: Fundamentals and Advances

【深度推荐系统：基础与进展】密歇根州立大学、香港理工大学、百度专家联合推出教程，Deep Recommender System: Fundamentals and Advances

专知会员服务

20+阅读 · 2022年2月25日

基于强化学习的推荐研究综述

基于强化学习的推荐研究综述

专知会员服务

84+阅读 · 2021年10月21日

强化学习如何用于推荐？厦大最新《强化学习推荐系统》综述论文，25页pdf156篇文献论述五种典型RL推荐方法

专知会员服务

80+阅读 · 2021年9月23日

WWW21最新「深度学习推荐系统」教程，230页PPT阐述深度强化学习、自动机器学习和GNN在推荐系统应用进展

WWW21最新「深度学习推荐系统」教程，230页PPT阐述深度强化学习、自动机器学习和GNN在推荐系统应用进展

专知会员服务

124+阅读 · 2021年4月26日

个性化推荐系统技术进展

个性化推荐系统技术进展

专知会员服务

66+阅读 · 2020年8月15日

对话推荐系统综述论文，35页pdf，A Survey on Conversational Recommender Systems

对话推荐系统综述论文，35页pdf，A Survey on Conversational Recommender Systems

专知会员服务

117+阅读 · 2020年4月3日

热门VIP内容

开通专知VIP会员享更多权益服务

《边缘端实时无线感知赋能现场多机器人部署》200页

人工智能赋能战场情报：提速决策进程

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

战力倍增器：自主武器系统与乌克兰及加沙冲突

相关资讯

MSRA开源基于注意力机制的全新推荐模型，融合用户长短期偏好

MSRA开源基于注意力机制的全新推荐模型，融合用户长短期偏好

AI前线

15+阅读 · 2019年9月22日

IJCAI 2019 | 为推荐系统生成高质量的文本解释：基于互注意力机制的多任务学习模型

IJCAI 2019 | 为推荐系统生成高质量的文本解释：基于互注意力机制的多任务学习模型

微软研究院AI头条

18+阅读 · 2019年8月13日

基于深度学习的序列推荐系统：概念，算法与评估

基于深度学习的序列推荐系统：概念，算法与评估

专知

24+阅读 · 2019年6月6日

强化学习落地！京东等发布综述《深度强化学习在搜索，推荐和在线广告中的应用》

强化学习落地！京东等发布综述《深度强化学习在搜索，推荐和在线广告中的应用》

专知

26+阅读 · 2019年2月19日

推荐系统

炼数成金订阅号

28+阅读 · 2019年1月17日

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

专知

24+阅读 · 2018年9月6日

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

AI前线

11+阅读 · 2018年5月15日

深度学习在推荐系统中的应用综述（最全）

深度学习在推荐系统中的应用综述（最全）

七月在线实验室

17+阅读 · 2018年5月5日

【论文推荐】最新七篇推荐系统相关论文—影响兴趣、知识Embeddings、音乐推荐、非结构化、一致性、显式和隐式特征、知识图谱

【论文推荐】最新七篇推荐系统相关论文—影响兴趣、知识Embeddings、音乐推荐、非结构化、一致性、显式和隐式特征、知识图谱

专知

14+阅读 · 2018年3月28日

深度学习在推荐系统上的应用

深度学习在推荐系统上的应用

架构文摘

13+阅读 · 2018年2月22日

相关论文

RecBundle: A Next-Generation Geometric Paradigm for Explainable Recommender Systems

Arxiv

0+阅读 · 3月17日

LLM-driven Multimodal Recommendation

Arxiv

0+阅读 · 3月13日

Modeling Stage-wise Evolution of User Interests for News Recommendation

Arxiv

0+阅读 · 3月11日

Proactive Guiding Strategy for Item-side Fairness in Interactive Recommendation

Arxiv

0+阅读 · 3月3日

Sequential Data Augmentation for Generative Recommendation

Arxiv

0+阅读 · 2月22日

Enhancing Long-Term Welfare in Recommender Systems: An Information Revelation Approach

Arxiv

0+阅读 · 2月16日

Query-Mixed Interest Extraction and Heterogeneous Interaction: A Scalable CTR Model for Industrial Recommender Systems

Arxiv

0+阅读 · 2月10日

Can Explanations Improve Recommendations? A Joint Optimization with LLM Reasoning

Arxiv

0+阅读 · 2月10日

Towards Sample-Efficient and Stable Reinforcement Learning for LLM-based Recommendation

Arxiv

0+阅读 · 1月31日

Recommender Systems in the Era of Large Language Models (LLMs)

Arxiv

18+阅读 · 2023年8月5日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

40+阅读 · 2015年12月31日

面向推荐系统中异构隐式反馈建模的迁移学习技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于主题网络的用户内在兴趣发现及演进研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于在线消费者购买意向挖掘的个性化推荐研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于社会媒体异质关系挖掘的用户兴趣建模方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

复杂社交网络环境下基于社区演化和传递效应的推荐策略研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于文本情感和异质网络分析的社会化推荐研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于领域知识和链路预测的个性化推荐研究

国家自然科学基金

4+阅读 · 2014年12月31日

社交网络环境下基于协同过滤的上下文感知推荐系统研究

国家自然科学基金

6+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员