Long-tail recommendation in real-world e-commerce platforms remains challenging due to severe data imbalance. Existing methods often struggle to combine content-based multimodal features with collaborative signals. Many of these methods also ignore an important asymmetry in knowledge transfer between head and tail IDs: noisy signals from tail IDs can hurt representation learning for head IDs. This paper presents AKT-Rec, a framework for Asymmetric Knowledge Transfer in long-tail Recommendation that uses LLM-generated semantic IDs. AKT-Rec uses Multimodal LLMs (MLLMs) with supervised fine-tuning to align content representations with collaborative information for both items and users, producing semantic representations. It then discretizes these representations into semantic IDs with a Residual-Quantized VAE (RQ-VAE), which yields semantic clusters of similar entities. AKT-Rec has two main components: (1) Cluster-Guided Adaptive Embedding, which decomposes each ID representation into a cluster-level embedding that captures shared semantics and an individual embedding. Through an asymmetric contrastive objective and an activity-aware gating mechanism, this module directs knowledge transfer from head to tail IDs. (2) Hierarchical Feature Aggregation, which builds parallel feature views and adaptively fuses them to optimize predictions for samples with varying activity levels. Extensive experiments on a large-scale industrial dataset and online A/B testing on the Alibaba Tmall platform demonstrate the effectiveness of AKT-Rec. AKT-Rec improves offline performance by 0.35% in AUC and 1.53% in GAUC, outperforming several competitive baselines. In online A/B testing, AKT-Rec achieves a 2.76% increase in CTR and a 3.47% increase in GMV, validating its utility in real-world production environments.


翻译:现实电商平台中的长尾推荐因严重的数据不平衡问题而极具挑战性。现有方法常难以将基于内容的多模态特征与协同信号有效结合,且许多方法忽略了头尾ID间知识迁移的一个重要非对称性:来自尾部ID的噪声信号会损害头部ID的表示学习。本文提出AKT-Rec——一种面向长尾推荐的非对称知识迁移框架,该框架利用大语言模型生成的语义ID。AKT-Rec采用多模态大语言模型(MLLMs)配合监督微调,将物品与用户的内容表征与协同信息对齐,生成语义表示;随后通过残差量化变分自编码器(RQ-VAE)将这些表示离散化为语义ID,形成相似实体的语义聚类。AKT-Rec包含两个核心组件:(1) 聚类引导自适应嵌入模块:将每个ID表示分解为捕获共享语义的聚类级嵌入与个体嵌入,通过非对称对比目标和活动感知门控机制引导知识从头至尾ID迁移;(2) 分层特征聚合模块:构建并行特征视图并自适应融合,优化不同活动水平样本的预测性能。基于大规模工业数据集和阿里巴巴天猫平台的在线A/B测试验证了AKT-Rec的有效性:离线性能提升AUC 0.35%、GAUC 1.53%,优于多个强力基线模型;在线A/B测试中CTR提升2.76%、GMV提升3.47%,验证了其在真实生产环境中的实用价值。

0
下载
关闭预览

相关内容

通过学习、实践或探索所获得的认识、判断或技能。
深度长尾学习研究综述
专知会员服务
29+阅读 · 2025年2月12日
《长尾学习》最新2024年综述
专知会员服务
31+阅读 · 2024年8月3日
【CVPR2023】自异构融合知识挖掘的长尾视觉识别
专知会员服务
16+阅读 · 2023年4月6日
【NUS】深度长尾学习综述,20页pdf172篇文献
专知会员服务
59+阅读 · 2021年10月14日
Query 理解和语义召回在知乎搜索中的应用
DataFunTalk
25+阅读 · 2020年1月2日
长文本表示学习概述
云栖社区
15+阅读 · 2019年5月9日
迁移学习之Domain Adaptation
全球人工智能
18+阅读 · 2018年4月11日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
11+阅读 · 2023年3月8日
VIP会员
最新内容
综述 | 世界动作模型:少做梦,多行动
专知会员服务
4+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
7+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
4+阅读 · 6月23日
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员