Conversion objectives in large-scale recommender systems are sparse, making them difficult to optimize. Generative recommendation (GR) partially alleviates data sparsity by organizing multi-type behaviors into a unified token sequence with shared representations, but conversion signals remain insufficiently modeled. While recent behavior-aware GR models encode behavior types and employ behavior-aware attention to highlight decision-related intermediate behaviors, they still rely on standard attention over the full history and provide no additional supervision for conversions, leaving conversion sparsity largely unresolved. To address these challenges, we propose RCLRec, a reverse curriculum learning-based GR framework for sparse conversion supervision. For each conversion target, RCLRec constructs a short curriculum by selecting a subsequence of conversion-related items from the history in reverse. Their semantic tokens are fed to the decoder as a prefix, together with the target conversion tokens, under a joint generation objective. This design provides additional instance-specific intermediate supervision, alleviating conversion sparsity and focusing the model on the user's critical decision process. We further introduce a curriculum quality-aware loss to ensure that the selected curricula are informative for conversion prediction. Experiments on offline datasets and an online A/B test show that RCLRec achieves superior performance, with +2.09% advertising revenue and +1.86% orders in online deployment.


翻译:大规模推荐系统中的转化目标具有稀疏性,导致其难以优化。生成式推荐(GR)通过将多类型行为组织为统一令牌序列并共享表征,部分缓解了数据稀疏问题,但转化信号仍未被充分建模。尽管近期行为感知型GR模型对行为类型进行编码并采用行为感知注意力机制来突出与决策相关的中间行为,它们仍依赖基于完整历史序列的标准注意力机制,且未对转化过程提供额外监督,因此转化稀疏性问题尚未得到根本解决。针对上述挑战,本文提出RCLRec——一种基于反向课程学习的GR框架,用于稀疏转化监督。针对每个转化目标,RCLRec通过反向选取历史中与转化相关的物品子序列来构建短课程,将其语义令牌作为前缀与目标转化令牌共同输入解码器,并采用联合生成目标进行训练。该设计提供了额外的实例级中间监督,缓解了转化稀疏性,同时使模型聚焦于用户关键决策过程。我们进一步引入课程质量感知损失,确保所选课程包含对转化预测有价值的信息。离线数据集实验与在线A/B测试表明,RCLRec取得卓越性能,在线部署中广告收入提升2.09%,订单量提升1.86%。

0
下载
关闭预览

相关内容

【微信@CIKM2021 】 强化学习推荐模型的知识蒸馏探索之路
自动特征工程在推荐系统中的研究
DataFunTalk
10+阅读 · 2019年12月20日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
1+阅读 · 今天15:00
21世纪的无人机战争
专知会员服务
2+阅读 · 今天14:05
《量子技术的军事任务技术适配与利用》
专知会员服务
2+阅读 · 今天13:51
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关VIP内容
【微信@CIKM2021 】 强化学习推荐模型的知识蒸馏探索之路
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员