Traditional ads recommendation systems have primarily focused on optimizing for prediction accuracy of click or conversion events using canonical metrics such as recall or normalized discounted cumulative gain (NDCG). With the hyper-growth of ads inventory and liquidity with generative AI technologies, the prediction stability and predictability is becoming increasingly critical. Intuitively, prediction stability and predictability can be defined to quantify system robustness with respect to minor/noisy input (ads, creatives) perturbations, the lack of which could lead to advertiser perceivable problems such as repeatability, cold start and under-exploration. In this paper, we introduce a new evaluation framework for quantifying stability and predictability of an ads recommender system, and present an online validated semantic candidate generation framework powered by fine-tuned Large Language Models (LLMs) that showed significant improvement along these metrics by fundamentally improving the semantic-awareness of the system. The approach extracts hierarchical semantic attributes from ad creatives to obtain LLM representations, which serve as the foundation for graph-based expansion, ensuring the retrieved candidates encapsulate semantic variants of an ad, guaranteeing that small creative variants from the advertiser yield consistent and explainable delivery results to the user. We tested this LLM ads retrieval framework in a large-scale industrial ads recommendation system, demonstrating significant improvements across offline and online A/B experiments, showcasing gains in both predictability and traditional performance metrics. Although evaluated in the ads stack, this is a general framework that can be applied broadly to any large-scale recommendation and retrieval systems facing similar scaling and predictability challenges.


翻译:传统广告推荐系统主要聚焦于使用召回率或归一化折损累计增益(NDCG)等经典指标优化点击或转化事件的预测精度。随着生成式AI技术驱动的广告库存与流动性超常增长,预测稳定性与可预测性正变得日益关键。直观而言,预测稳定性与可预测性可定义为量化系统对微小/噪声输入(广告、创意)扰动的鲁棒性,其缺失可能导致广告主可感知的问题,如重复性、冷启动和探索不足。本文提出一种用于量化广告推荐系统稳定性与可预测性的新评估框架,并介绍一种在线验证的、由精调大语言模型(LLMs)驱动的语义候选生成框架。该框架通过从根本上增强系统的语义感知能力,在这些指标上展现出显著改进。该方法从广告创意中提取层级化语义属性以获得LLM表示,这些表示作为基于图谱扩展的基础,确保检索到的候选集包含广告的语义变体,从而保证广告主提供的微小创意变体能为用户产生一致且可解释的投放结果。我们在大规模工业级广告推荐系统中测试了该LLM广告检索框架,离线与在线A/B实验均显示显著提升,在可预测性及传统性能指标上均展现出增益。尽管在广告场景中评估,但该通用框架可广泛应用于面临类似规模扩展与可预测性挑战的任何大规模推荐与检索系统。

0
下载
关闭预览

相关内容

【IJCAI2024教程】大语言模型(LLMs)时代的推荐系统
专知会员服务
51+阅读 · 2024年8月5日
无量深度学习系统在腾讯推荐类业务的应用
专知会员服务
21+阅读 · 2022年7月9日
个性化广告推荐系统及其应用研究
专知会员服务
96+阅读 · 2021年2月27日
深度 | 推荐系统评估
AI100
24+阅读 · 2019年3月16日
推荐系统
炼数成金订阅号
28+阅读 · 2019年1月17日
深度学习在推荐系统中的应用综述(最全)
七月在线实验室
17+阅读 · 2018年5月5日
深度学习在CTR预估中的应用 | CTR深度模型大盘点
PaperWeekly
15+阅读 · 2018年4月11日
深度学习在推荐系统上的应用
架构文摘
13+阅读 · 2018年2月22日
推荐算法:Match与Rank模型的交织配合
从0到1
15+阅读 · 2017年12月18日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
6+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
4+阅读 · 6月17日
相关VIP内容
【IJCAI2024教程】大语言模型(LLMs)时代的推荐系统
专知会员服务
51+阅读 · 2024年8月5日
无量深度学习系统在腾讯推荐类业务的应用
专知会员服务
21+阅读 · 2022年7月9日
个性化广告推荐系统及其应用研究
专知会员服务
96+阅读 · 2021年2月27日
相关资讯
深度 | 推荐系统评估
AI100
24+阅读 · 2019年3月16日
推荐系统
炼数成金订阅号
28+阅读 · 2019年1月17日
深度学习在推荐系统中的应用综述(最全)
七月在线实验室
17+阅读 · 2018年5月5日
深度学习在CTR预估中的应用 | CTR深度模型大盘点
PaperWeekly
15+阅读 · 2018年4月11日
深度学习在推荐系统上的应用
架构文摘
13+阅读 · 2018年2月22日
推荐算法:Match与Rank模型的交织配合
从0到1
15+阅读 · 2017年12月18日
相关基金
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员