Learning User Interests via Reasoning and Distillation for Cross-Domain News Recommendation - 专知论文

会员服务 ·

0

新闻 · 新闻推荐 · 蒸馏 · 系统 · 在线 ·

Learning User Interests via Reasoning and Distillation for Cross-Domain News Recommendation

翻译：基于推理与蒸馏的用户兴趣学习用于跨领域新闻推荐

Mengdan Zhu,Yufan Zhao,Tao Di,Yulan Yan,Liang Zhao

News recommendation plays a critical role in online news platforms by helping users discover relevant content. Cross-domain news recommendation further requires inferring user's underlying information needs from heterogeneous signals that often extend beyond direct news consumption. A key challenge lies in moving beyond surface-level behaviors to capture deeper, reusable user interests while maintaining scalability in large-scale production systems. In this paper, we present a reinforcement learning framework that trains large language models to generate high-quality lists of interest-driven news search queries from cross-domain user signals. We formulate query-list generation as a policy optimization problem and employ GRPO with multiple reward signals. We systematically study two compute dimensions: inference-time sampling and model capacity, and empirically observe consistent improvements with increased compute that exhibit scaling-like behavior. Finally, we perform on-policy distillation to transfer the learned policy from a large, compute-intensive teacher to a compact student model suitable for scalable deployment. Extensive offline experiments, ablation studies and large-scale online A/B tests in a production news recommendation system demonstrate consistent gains in both interest modeling quality and downstream recommendation performance.

翻译：新闻推荐在在线新闻平台中扮演着关键角色，帮助用户发现相关内容。跨领域新闻推荐进一步要求从通常超出直接新闻消费的异构信号中推断用户的潜在信息需求。一个核心挑战在于超越表层行为，以捕捉更深层次、可复用的用户兴趣，同时在大规模生产系统中保持可扩展性。本文提出一种强化学习框架，训练大型语言模型从跨领域用户信号中生成高质量的兴趣驱动新闻搜索查询列表。我们将查询列表生成构建为一个策略优化问题，并采用具有多重奖励信号的GRPO。我们系统地研究了两个计算维度：推理时采样与模型容量，并通过实证观察到随着计算量增加带来的持续改进呈现出类似缩放的行为。最后，我们执行同策略蒸馏，将学习到的策略从一个计算密集型的大型教师模型迁移到一个适用于可扩展部署的紧凑学生模型。在生产新闻推荐系统中进行的广泛离线实验、消融研究和大规模在线A/B测试，均证明了该方法在兴趣建模质量和下游推荐性能上的一致提升。

0

相关内容

新闻，是指报纸、电台、电视台、互联网等媒体经常使用的记录与传播信息的 [2] 一种文体，是反映时代的一种文体。新闻概念有广义与狭义之分。广义上：除了发表于报刊、广播、互联网、电视上的评论与专文外的常用文本都属于新闻，包括消息、通讯、特写、速写（有的将速写纳入特写之列）等等； [3] 狭义上：消息是用概括的叙述方式，以较简明扼要的文字，迅速及时地报道附近新近发生的、有价值的事实，使一定人群了解。新闻一般包括标题、导语、主体、背景和结语五部分。前三者是主要部分，后二者是辅助部分。写法以叙述为主兼或有议论、描写、评论等。新闻是包含海量资讯的新闻服务平台,真实反映每时每刻的重要事件。您可以搜索新闻事件、热点话题、人物动态、产品资讯等,快速了解它们的最新进展。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

推荐如何用多模态信息？南洋理工最新《多模态推荐系统》综述，33页pdf阐述多模态推荐系统的分类、评价和未来方向

推荐如何用多模态信息？南洋理工最新《多模态推荐系统》综述，33页pdf阐述多模态推荐系统的分类、评价和未来方向

专知会员服务

49+阅读 · 2023年2月13日

推荐如何用因果推理？Rutgers大学最新《推荐中的因果推理: 基础、方法与应用》综述，全面阐述推荐因果推理方法体系

推荐如何用因果推理？Rutgers大学最新《推荐中的因果推理: 基础、方法与应用》综述，全面阐述推荐因果推理方法体系

专知会员服务

53+阅读 · 2023年1月13日

因果如何用于推荐？弗吉尼亚大学最新《推荐系统中的因果推理:偏差缓解、解释和泛化策略》综述

因果如何用于推荐？弗吉尼亚大学最新《推荐系统中的因果推理:偏差缓解、解释和泛化策略》综述

专知会员服务

30+阅读 · 2023年1月4日

【深度推荐系统：基础与进展】密歇根州立大学、香港理工大学、百度专家联合推出教程，Deep Recommender System: Fundamentals and Advances

【深度推荐系统：基础与进展】密歇根州立大学、香港理工大学、百度专家联合推出教程，Deep Recommender System: Fundamentals and Advances

专知会员服务

20+阅读 · 2022年2月25日

深度学习推荐进展到哪了？看这份IJCAI2021《深度学习推荐系统：基础与进展》教程，附Slides

专知会员服务

60+阅读 · 2021年8月23日

基于深度学习的新闻推荐算法研究综述

专知会员服务

49+阅读 · 2021年6月26日

WWW21最新「深度学习推荐系统」教程，230页PPT阐述深度强化学习、自动机器学习和GNN在推荐系统应用进展

WWW21最新「深度学习推荐系统」教程，230页PPT阐述深度强化学习、自动机器学习和GNN在推荐系统应用进展

专知会员服务

124+阅读 · 2021年4月26日

跨媒体分析与推理技术研究综述

跨媒体分析与推理技术研究综述

专知会员服务

70+阅读 · 2021年3月11日

基于双注意力机制和迁移学习的跨领域推荐模型

专知会员服务

48+阅读 · 2020年10月20日

【WWW2020-清华大学】图增强表示学习的新闻推荐,Graph Enhanced RepresentationLearning

【WWW2020-清华大学】图增强表示学习的新闻推荐,Graph Enhanced RepresentationLearning

专知会员服务

59+阅读 · 2020年4月4日

【WWW2021】基于双侧深度上下文调制的社会化推荐系统

【WWW2021】基于双侧深度上下文调制的社会化推荐系统

专知

19+阅读 · 2021年1月28日

【WWW2020-清华大学】图增强表示学习的新闻推荐,Graph Enhanced RepresentationLearning

【WWW2020-清华大学】图增强表示学习的新闻推荐,Graph Enhanced RepresentationLearning

专知

34+阅读 · 2020年4月4日

【论文笔记】用于新闻推荐的深度感知网络（DKN）

【论文笔记】用于新闻推荐的深度感知网络（DKN）

专知

17+阅读 · 2019年10月7日

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

专知

23+阅读 · 2019年9月6日

论文浅尝 | DKN: 面向新闻推荐的深度知识感知网络

论文浅尝 | DKN: 面向新闻推荐的深度知识感知网络

开放知识图谱

21+阅读 · 2019年5月1日

新书推荐《推荐系统进展：方法与技术》

新书推荐《推荐系统进展：方法与技术》

LibRec智能推荐

13+阅读 · 2019年3月18日

强化学习落地！京东等发布综述《深度强化学习在搜索，推荐和在线广告中的应用》

强化学习落地！京东等发布综述《深度强化学习在搜索，推荐和在线广告中的应用》

专知

26+阅读 · 2019年2月19日

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

专知

24+阅读 · 2018年9月6日

深度学习在推荐系统中的应用综述（最全）

深度学习在推荐系统中的应用综述（最全）

七月在线实验室

17+阅读 · 2018年5月5日

【推荐系统论文笔记】DKN: 基于深度知识感知的新闻推荐网络（WWW2018 ）

【推荐系统论文笔记】DKN: 基于深度知识感知的新闻推荐网络（WWW2018 ）

专知

18+阅读 · 2018年4月2日

面向互联网大数据的用户兴趣挖掘及预测研究

国家自然科学基金

6+阅读 · 2017年12月31日

面向隐私保护的地理社交网络个性化推荐方法研究

国家自然科学基金

2+阅读 · 2017年12月31日

面向推荐系统中异构隐式反馈建模的迁移学习技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于在线消费者购买意向挖掘的个性化推荐研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于社会媒体异质关系挖掘的用户兴趣建模方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于社交媒体地理大数据的可感知情境的个性化旅游推荐研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于文本情感和异质网络分析的社会化推荐研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于领域知识和链路预测的个性化推荐研究

国家自然科学基金

4+阅读 · 2014年12月31日

跨网络社会学习对移动用户创新扩散的影响研究

国家自然科学基金

0+阅读 · 2014年12月31日

Iterative Semantic Reasoning from Individual to Group Interests for Generative Recommendation with LLMs

Arxiv

0+阅读 · 3月14日

Modeling Stage-wise Evolution of User Interests for News Recommendation

Arxiv

0+阅读 · 3月11日

Uncovering Social Network Activity Using Joint User and Topic Interaction

Arxiv

0+阅读 · 3月10日

Modeling User Preferences as Distributions for Optimal Transport-Based Cross-Domain Recommendation under Non-Overlapping Settings

Arxiv

0+阅读 · 2月28日

C$^3$: Capturing Consensus with Contrastive Learning in Group Recommendation

Arxiv

0+阅读 · 2月26日

Towards Context-aware Reasoning-enhanced Generative Searching in E-commerce

Arxiv

0+阅读 · 2月13日

Can Users Fix Algorithms? A Game-Theoretic Analysis of Collective Content Amplification in Recommender Systems

Arxiv

0+阅读 · 2月12日

Contrastive Learning for Diversity-Aware Product Recommendations in Retail

Arxiv

0+阅读 · 2月9日

Behind the Feed: A Taxonomy of User-Facing Cues for Algorithmic Transparency in Social Media

Arxiv

0+阅读 · 2月8日

Tutorial on Reasoning for IR & IR for Reasoning

Arxiv

0+阅读 · 2月3日

VIP会员

文章信息

相关主题

最新内容

《美陆军条例：陆军指挥政策（2026版）》

《美陆军条例：陆军指挥政策（2026版）》

专知会员服务

5+阅读 · 今天8:10

《提升美军全域城市作战训练最佳实践的案例研究》366页

《提升美军全域城市作战训练最佳实践的案例研究》366页

专知会员服务

6+阅读 · 今天8:06

《军用自主人工智能系统的治理与安全》

《军用自主人工智能系统的治理与安全》

专知会员服务

4+阅读 · 今天8:02

美海军数字作战负责人：如何利用数据快速生成战斗力

美海军数字作战负责人：如何利用数据快速生成战斗力

专知会员服务

3+阅读 · 今天7:32

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

10+阅读 · 4月20日

《系统簇式多域作战规划范畴论框架》

《系统簇式多域作战规划范畴论框架》

专知会员服务

7+阅读 · 4月20日

《美国防部指令6130.03，第2卷服役医疗标准：保留》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

专知会员服务

5+阅读 · 4月20日

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

专知会员服务

3+阅读 · 4月20日

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

专知会员服务

7+阅读 · 4月20日

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

专知会员服务

3+阅读 · 4月20日

高效视频扩散模型：进展与挑战

高效视频扩散模型：进展与挑战

专知会员服务

3+阅读 · 4月20日

乌克兰前线的五项创新

乌克兰前线的五项创新

专知会员服务

7+阅读 · 4月20日

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

6+阅读 · 4月20日

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

11+阅读 · 4月20日

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

5+阅读 · 4月20日

相关VIP内容

推荐如何用多模态信息？南洋理工最新《多模态推荐系统》综述，33页pdf阐述多模态推荐系统的分类、评价和未来方向

推荐如何用多模态信息？南洋理工最新《多模态推荐系统》综述，33页pdf阐述多模态推荐系统的分类、评价和未来方向

专知会员服务

49+阅读 · 2023年2月13日

推荐如何用因果推理？Rutgers大学最新《推荐中的因果推理: 基础、方法与应用》综述，全面阐述推荐因果推理方法体系

推荐如何用因果推理？Rutgers大学最新《推荐中的因果推理: 基础、方法与应用》综述，全面阐述推荐因果推理方法体系

专知会员服务

53+阅读 · 2023年1月13日

因果如何用于推荐？弗吉尼亚大学最新《推荐系统中的因果推理:偏差缓解、解释和泛化策略》综述

因果如何用于推荐？弗吉尼亚大学最新《推荐系统中的因果推理:偏差缓解、解释和泛化策略》综述

专知会员服务

30+阅读 · 2023年1月4日

【深度推荐系统：基础与进展】密歇根州立大学、香港理工大学、百度专家联合推出教程，Deep Recommender System: Fundamentals and Advances

【深度推荐系统：基础与进展】密歇根州立大学、香港理工大学、百度专家联合推出教程，Deep Recommender System: Fundamentals and Advances

专知会员服务

20+阅读 · 2022年2月25日

深度学习推荐进展到哪了？看这份IJCAI2021《深度学习推荐系统：基础与进展》教程，附Slides

专知会员服务

60+阅读 · 2021年8月23日

基于深度学习的新闻推荐算法研究综述

专知会员服务

49+阅读 · 2021年6月26日

WWW21最新「深度学习推荐系统」教程，230页PPT阐述深度强化学习、自动机器学习和GNN在推荐系统应用进展

WWW21最新「深度学习推荐系统」教程，230页PPT阐述深度强化学习、自动机器学习和GNN在推荐系统应用进展

专知会员服务

124+阅读 · 2021年4月26日

跨媒体分析与推理技术研究综述

跨媒体分析与推理技术研究综述

专知会员服务

70+阅读 · 2021年3月11日

基于双注意力机制和迁移学习的跨领域推荐模型

专知会员服务

48+阅读 · 2020年10月20日

【WWW2020-清华大学】图增强表示学习的新闻推荐,Graph Enhanced RepresentationLearning

【WWW2020-清华大学】图增强表示学习的新闻推荐,Graph Enhanced RepresentationLearning

专知会员服务

59+阅读 · 2020年4月4日

热门VIP内容

开通专知VIP会员享更多权益服务

《提升美军全域城市作战训练最佳实践的案例研究》366页

美海军数字作战负责人：如何利用数据快速生成战斗力

《美陆军条例：陆军指挥政策（2026版）》

《军用自主人工智能系统的治理与安全》

相关资讯

【WWW2021】基于双侧深度上下文调制的社会化推荐系统

【WWW2021】基于双侧深度上下文调制的社会化推荐系统

专知

19+阅读 · 2021年1月28日

【WWW2020-清华大学】图增强表示学习的新闻推荐,Graph Enhanced RepresentationLearning

【WWW2020-清华大学】图增强表示学习的新闻推荐,Graph Enhanced RepresentationLearning

专知

34+阅读 · 2020年4月4日

【论文笔记】用于新闻推荐的深度感知网络（DKN）

【论文笔记】用于新闻推荐的深度感知网络（DKN）

专知

17+阅读 · 2019年10月7日

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

专知

23+阅读 · 2019年9月6日

论文浅尝 | DKN: 面向新闻推荐的深度知识感知网络

论文浅尝 | DKN: 面向新闻推荐的深度知识感知网络

开放知识图谱

21+阅读 · 2019年5月1日

新书推荐《推荐系统进展：方法与技术》

新书推荐《推荐系统进展：方法与技术》

LibRec智能推荐

13+阅读 · 2019年3月18日

强化学习落地！京东等发布综述《深度强化学习在搜索，推荐和在线广告中的应用》

强化学习落地！京东等发布综述《深度强化学习在搜索，推荐和在线广告中的应用》

专知

26+阅读 · 2019年2月19日

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

专知

24+阅读 · 2018年9月6日

深度学习在推荐系统中的应用综述（最全）

深度学习在推荐系统中的应用综述（最全）

七月在线实验室

17+阅读 · 2018年5月5日

【推荐系统论文笔记】DKN: 基于深度知识感知的新闻推荐网络（WWW2018 ）

【推荐系统论文笔记】DKN: 基于深度知识感知的新闻推荐网络（WWW2018 ）

专知

18+阅读 · 2018年4月2日

相关论文

Iterative Semantic Reasoning from Individual to Group Interests for Generative Recommendation with LLMs

Arxiv

0+阅读 · 3月14日

Modeling Stage-wise Evolution of User Interests for News Recommendation

Arxiv

0+阅读 · 3月11日

Uncovering Social Network Activity Using Joint User and Topic Interaction

Arxiv

0+阅读 · 3月10日

Modeling User Preferences as Distributions for Optimal Transport-Based Cross-Domain Recommendation under Non-Overlapping Settings

Arxiv

0+阅读 · 2月28日

C$^3$: Capturing Consensus with Contrastive Learning in Group Recommendation

Arxiv

0+阅读 · 2月26日

Towards Context-aware Reasoning-enhanced Generative Searching in E-commerce

Arxiv

0+阅读 · 2月13日

Can Users Fix Algorithms? A Game-Theoretic Analysis of Collective Content Amplification in Recommender Systems

Arxiv

0+阅读 · 2月12日

Contrastive Learning for Diversity-Aware Product Recommendations in Retail

Arxiv

0+阅读 · 2月9日

Behind the Feed: A Taxonomy of User-Facing Cues for Algorithmic Transparency in Social Media

Arxiv

0+阅读 · 2月8日

Tutorial on Reasoning for IR & IR for Reasoning

Arxiv

0+阅读 · 2月3日

相关基金

面向互联网大数据的用户兴趣挖掘及预测研究

国家自然科学基金

6+阅读 · 2017年12月31日

面向隐私保护的地理社交网络个性化推荐方法研究

国家自然科学基金

2+阅读 · 2017年12月31日

面向推荐系统中异构隐式反馈建模的迁移学习技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于在线消费者购买意向挖掘的个性化推荐研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于社会媒体异质关系挖掘的用户兴趣建模方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于社交媒体地理大数据的可感知情境的个性化旅游推荐研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于文本情感和异质网络分析的社会化推荐研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于领域知识和链路预测的个性化推荐研究

国家自然科学基金

4+阅读 · 2014年12月31日

跨网络社会学习对移动用户创新扩散的影响研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员