E-commerce campaign ranking models require large-scale training labels indicating which users purchased due to campaign influence. However, generating these labels is challenging because campaigns use creative, thematic language that does not directly map to product purchases. Without clear product-level attribution, supervised learning for campaign optimization remains limited. We present Campaign-2-PT-RAG, a scalable label generation framework that constructs user-campaign purchase labels by inferring which product types (PTs) each campaign promotes. The framework first interprets campaign content using large language models (LLMs) to capture implicit intent, then retrieves candidate PTs through semantic search over the platform taxonomy. A structured LLM-based classifier evaluates each PT's relevance, producing a campaign-specific product coverage set. User purchases matching these PTs generate positive training labels for downstream ranking models. This approach reframes the ambiguous attribution problem into a tractable semantic alignment task, enabling scalable and consistent supervision for downstream tasks such as campaign ranking optimization in production e-commerce environments. Experiments on internal and synthetic datasets, validated against expert-annotated campaign-PT mappings, show that our LLM-assisted approach generates high-quality labels with 78-90% precision while maintaining over 99% recall.


翻译:电子商务营销活动排序模型需要大规模的训练标签,用以指示哪些用户是因营销活动影响而产生的购买行为。然而,生成这些标签具有挑战性,因为营销活动通常使用富有创意和主题性的语言,这些语言并不直接映射到具体的产品购买。由于缺乏清晰的产品级归因,用于营销活动优化的监督学习仍然受限。我们提出了Campaign-2-PT-RAG,一个可扩展的标签生成框架,它通过推断每个营销活动所推广的产品类型(PT)来构建用户-营销活动购买标签。该框架首先利用大语言模型(LLMs)解读营销活动内容以捕捉其隐含意图,然后通过语义搜索平台分类体系来检索候选产品类型。一个基于大语言模型的结构化分类器评估每个产品类型的相关性,从而生成一个针对特定营销活动的产品覆盖集合。与这些产品类型匹配的用户购买行为,即为下游排序模型生成正向训练标签。此方法将模糊的归因问题重构为一个可处理的语义对齐任务,从而为生产环境中的电子商务营销活动排序优化等下游任务提供了可扩展且一致的监督信号。在内部数据集和合成数据集上的实验,以及对照专家标注的营销活动-产品类型映射进行的验证表明,我们的大语言模型辅助方法能够生成高质量的标签,其精确度达到78-90%,同时保持超过99%的召回率。

0
下载
关闭预览

相关内容

用来满足人们需求和欲望的物体或无形的载体。好的产品大家都喜欢
【博士论文】电商搜索中的排序学习
专知会员服务
13+阅读 · 2025年11月15日
大模型在兵力推荐中的应用与思考
专知会员服务
30+阅读 · 2025年5月7日
大语言模型在序列推荐中的应用
专知会员服务
19+阅读 · 2024年11月12日
【KDD2023】学习语言表示用于序列推荐
专知会员服务
11+阅读 · 2023年5月27日
LinkedIn《贝叶斯优化推荐系统》,IJCAI报告,142页ppt
专知会员服务
52+阅读 · 2021年1月11日
推荐系统
炼数成金订阅号
28+阅读 · 2019年1月17日
从Seq2seq到Attention模型到Self Attention(一)
量化投资与机器学习
76+阅读 · 2018年10月8日
推荐算法:Match与Rank模型的交织配合
从0到1
15+阅读 · 2017年12月18日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员