Learning effective feature interactions is central to modern recommender systems, yet remains challenging in industrial settings due to sparse multi-field inputs and ultra-long user behavior sequences. While recent scaling efforts have improved model capacity, they often fail to construct both context-aware and context-independent user intent from the long-term and real-time behavior sequence. Meanwhile, recent work also suffers from inefficient and homogeneous interaction mechanisms, leading to suboptimal prediction performance. To address these limitations, we propose HeMix, a scalable ranking model that unifies adaptive sequence tokenization and heterogeneous interaction structure. Specifically, HeMix introduces a Query-Mixed Interest Extraction module that jointly models context-aware and context-independent user interests via dynamic and fixed queries over global and real-time behavior sequences. For interaction, we replace self-attention with the HeteroMixer block, enabling efficient, multi-granularity cross-feature interactions that adopt the multi-head token fusion, heterogeneous interaction and group-aligned reconstruction pipelines. HeMix demonstrates favorable scaling behavior, driven by the HeteroMixer block, where increasing model scale via parameter expansion leads to steady improvements in recommendation accuracy. Experiments on industrial-scale datasets show that HeMix scales effectively and consistently outperforms strong baselines. Most importantly, HeMix has been deployed on the AMAP platform, delivering significant online gains: +0.61% GMV, +2.32% PV_CTR, and +0.81% UV_CVR.


翻译:学习有效的特征交互是现代推荐系统的核心,但在工业场景中仍面临挑战,主要源于稀疏的多域输入和超长用户行为序列。尽管近期的扩展工作提升了模型容量,但它们往往难以从长期和实时行为序列中同时构建上下文感知和上下文无关的用户意图。同时,现有方法还存在交互机制效率低下且同质化的问题,导致预测性能欠佳。为应对这些局限,我们提出HeMix——一个统一自适应序列标记化与异构交互结构的可扩展排序模型。具体而言,HeMix设计了查询混合兴趣提取模块,通过全局和实时行为序列上的动态查询与固定查询,联合建模上下文感知和上下文无关的用户兴趣。在交互方面,我们以HeteroMixer模块取代自注意力机制,该模块采用多头令牌融合、异构交互和组对齐重建流程,实现了高效的多粒度跨特征交互。在HeteroMixer模块的驱动下,HeMix展现出良好的扩展特性:通过参数扩展增大模型规模能持续提升推荐准确性。在工业级数据集上的实验表明,HeMix能有效扩展并持续超越强基线模型。最重要的是,HeMix已在AMAP平台完成部署,带来显著的线上收益:商品交易总额提升0.61%,页面点击率提升2.32%,独立用户转化率提升0.81%。

0
下载
关闭预览

相关内容

情感推荐系统综述:面向个性化的态度、情绪与情境建模
推荐系统中的扩散模型:综述
专知会员服务
21+阅读 · 2025年1月22日
专知会员服务
33+阅读 · 2021年2月12日
专知会员服务
48+阅读 · 2020年10月20日
深度学习在推荐系统中的应用综述(最全)
七月在线实验室
17+阅读 · 2018年5月5日
深度学习在CTR预估中的应用 | CTR深度模型大盘点
PaperWeekly
15+阅读 · 2018年4月11日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
VIP会员
相关VIP内容
情感推荐系统综述:面向个性化的态度、情绪与情境建模
推荐系统中的扩散模型:综述
专知会员服务
21+阅读 · 2025年1月22日
专知会员服务
33+阅读 · 2021年2月12日
专知会员服务
48+阅读 · 2020年10月20日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员