Slate recommendation, which presents users with a ranked item list in a single display, is ubiquitous across mainstream online platforms. While recent generative recommendation methods have shown strong potential in modeling item sequences with semantic IDs, directly applying them to industrial-scale slate recommendation faces a fundamental disconnect: entangled SID spaces confound high-level list planning, fine-grained autoregressive decoding over long sequences limits semantic planning efficiency, and token-level objectives misalign with holistic slate quality. In this paper, we propose HiGR, an industrial-scale hierarchical generative framework for slate recommendation that bridges this disconnect through a co-designed pipeline. First, HiGR learns structured SIDs via a Prefix-Contrastive Residual Quantized VAE (PCRQ-VAE). By enforcing high-level prefixes to capture shared semantics, PCRQ-VAE creates a controllable discrete space that acts as a prerequisite for efficient planning. Leveraging this structured space, our Hierarchical Slate Decoder (HSD) shifts autoregressive modeling from entangled token-level decoding to coarse-grained preference embeddings. This design significantly reduces inference latency while allowing explicit global slate structure planning. Finally, this stable planning space enables an ORPO-based listwise alignment mechanism to optimize triple-objective implicit feedback-ranking fidelity, genuine user interest, and diversity. Extensive offline experiments show that HiGR outperforms state-of-the-art baselines by over 10% in offline recommendation quality while achieving a $5\times$ inference speedup. Online A/B tests on Tencent platforms further improve watch time by 1.22% and video plays by 1.73%. HiGR has been deployed on multiple Tencent platform surfaces, serving hundreds of millions of users and proving its industrial-scale applicability.


翻译:摘要:候选列表推荐(Slate Recommendation)在主流在线平台中普遍存在,其通过单次展示向用户呈现排序后的项目列表。尽管近期生成式推荐方法在利用语义ID建模项目序列方面展现出强大潜力,但直接将其应用于工业级候选列表推荐面临根本性脱节:纠缠的SID空间混淆了高层次列表规划,长序列上的细粒度自回归解码限制了语义规划效率,而基于词元级别的目标与整体候选列表质量不匹配。本文提出HiGR——面向候选列表推荐的工业级层次化生成式框架,通过协同设计的流水线弥合这一脱节。首先,HiGR通过前缀对比残差量化VAE(PCRQ-VAE)学习结构化SID。通过强制高层前缀捕获共享语义,PCRQ-VAE创建了一个可控离散空间,为高效规划奠定基础。借助该结构化空间,我们的层次化候选列表解码器(HSD)将自回归建模从纠缠的词元级解码转移到粗粒度的偏好嵌入。该设计在显著降低推理延迟的同时,允许显式的全局候选列表结构规划。最后,该稳定的规划空间使基于ORPO的列表级对齐机制能够优化三重目标——隐式反馈排序保真度、真实用户兴趣及多样性。大量离线实验表明,HiGR在离线推荐质量上较最先进基线提升超10%,同时实现5倍推理加速。腾讯平台的在线A/B测试进一步提升了1.22%的观看时长和1.73%的视频播放量。HiGR已部署于腾讯多个平台界面,服务数亿用户,验证了其工业级适用性。

0
下载
关闭预览

相关内容

生成式推荐最新进展
专知会员服务
25+阅读 · 2025年1月8日
专知会员服务
57+阅读 · 2021年6月30日
推荐系统原理、工程、大厂(Youtube、BAT、TMB)架构干活分享
推荐系统资源(文献、工具、框架)整理
专知
18+阅读 · 2019年2月4日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
ICML 2026 | CFPO:用反事实策略优化提升多模态推理
专知会员服务
1+阅读 · 今天14:45
综述 | 世界动作模型:少做梦,多行动
专知会员服务
1+阅读 · 今天14:43
美以伊冲突:无人机与人工智能的运用
专知会员服务
3+阅读 · 今天14:31
《特种部队在透明战场中的生存力》最新报告
专知会员服务
2+阅读 · 今天14:11
《人工智能生成的零日漏洞:对未来作战的影响》
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关VIP内容
生成式推荐最新进展
专知会员服务
25+阅读 · 2025年1月8日
专知会员服务
57+阅读 · 2021年6月30日
相关资讯
推荐系统原理、工程、大厂(Youtube、BAT、TMB)架构干活分享
推荐系统资源(文献、工具、框架)整理
专知
18+阅读 · 2019年2月4日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员