JD-BP: A Joint-Decision Generative Framework for Auto-Bidding and Pricing - 专知论文

会员服务 ·

0

约束 · 算法 · 投资 · 模型预测 · 反馈延迟 ·

JD-BP: A Joint-Decision Generative Framework for Auto-Bidding and Pricing

翻译：JD-BP：一种联合决策的自动竞价与定价生成框架

Linghui Meng,Chun Gan,Shengsheng Niu,Chengcheng Zhang,Chenchen Li,Chuan Yang,Yi Mao,Xin Zhu,Jie He,Zhangang Lin,Ching Law

from arxiv, 10 pages, 2 figures

Auto-bidding services optimize real-time bidding strategies for advertisers under key performance indicator (KPI) constraints such as target return on investment and budget. However, uncertainties such as model prediction errors and feedback latency can cause bidding strategies to deviate from ex-post optimality, leading to inefficient allocation. To address this issue, we propose JD-BP, a Joint generative Decision framework for Bidding and Pricing. Unlike prior methods, JD-BP jointly outputs a bid value and a pricing correction term that acts additively with the payment rule such as GSP. To mitigate adverse effects of historical constraint violations, we design a memory-less Return-to-Go that encourages future value maximizing of bidding actions while the cumulated bias is handled by the pricing correction. Moreover, a trajectory augmentation algorithm is proposed to generate joint bidding-pricing trajectories from a (possibly arbitrary) base bidding policy, enabling efficient plug-and-play deployment of our algorithm from existing RL/generative bidding models. Finally, we employ an Energy-Based Direct Preference Optimization method in conjunction with a cross-attention module to enhance the joint learning performance of bidding and pricing correction. Offline experiments on the AuctionNet dataset demonstrate that JD-BP achieves state-of-the-art performance. Online A/B tests at JD.com confirm its practical effectiveness, showing a 4.70% increase in ad revenue and a 6.48% improvement in target cost.

翻译：自动竞价服务在关键绩效指标（KPI）约束下（如目标投资回报率和预算），为广告主优化实时竞价策略。然而，模型预测误差和反馈延迟等不确定性因素会导致竞价策略偏离事后最优性，从而造成分配效率低下。为解决这一问题，我们提出JD-BP——一种联合决策的竞价与定价生成框架。与先前方法不同，JD-BP联合输出竞价值和定价修正项，该修正项以可加方式作用于GSP等支付规则。为缓解历史约束违反带来的不利影响，我们设计了无记忆的“返回目标”（Return-to-Go）机制，在累积偏差由定价修正处理的同时，鼓励竞价动作的未来价值最大化。此外，我们提出轨迹增强算法，基于（任意）基础竞价策略生成联合竞价-定价轨迹，使我们的算法能够从现有强化学习/生成式竞价模型出发实现高效的即插即用部署。最后，我们采用基于能量的直接偏好优化方法，并结合交叉注意力模块，以增强竞价与定价修正的联合学习性能。在AuctionNet数据集上的离线实验表明，JD-BP达到了最先进的性能。京东在线A/B测试验证了其实用有效性，广告收入提升4.70%，目标成本改善6.48%。

0

相关内容

智能书（SmartBook）：面向情报分析师的AI辅助态势报告生成工具 | 附文献

智能书（SmartBook）：面向情报分析师的AI辅助态势报告生成工具 | 附文献

专知会员服务

53+阅读 · 2025年9月29日

北航团队提出SIDM：基于结构信息原理的通用分层决策框架

北航团队提出SIDM：基于结构信息原理的通用分层决策框架

专知会员服务

19+阅读 · 2025年5月14日

《联合飞机生存能力计划（JASP）》

《联合飞机生存能力计划（JASP）》

专知会员服务

24+阅读 · 2024年7月8日

《评估人工智能和辅助自动化指挥与控制决策辅助工具以提高任务效率的分析框架》

《评估人工智能和辅助自动化指挥与控制决策辅助工具以提高任务效率的分析框架》

专知会员服务

139+阅读 · 2023年7月10日

《美国国防部（DoD）联合能力集成与开发系统（JCIDS）报告》

《美国国防部（DoD）联合能力集成与开发系统（JCIDS）报告》

专知会员服务

111+阅读 · 2023年4月12日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知会员服务

263+阅读 · 2022年8月23日

美国哈德逊研究所国防概念与技术中心《实施以决策为中心的战争：提升指挥与控制以获得选择优势》，50页pdf

美国哈德逊研究所国防概念与技术中心《实施以决策为中心的战争：提升指挥与控制以获得选择优势》，50页pdf

专知会员服务

184+阅读 · 2022年4月11日

美国「联合全域指挥与控制 (JADC2)」战略发展最新总结报告，12页pdf，Summary of the Joint All-Domain Command and Control Strategy

美国「联合全域指挥与控制 (JADC2)」战略发展最新总结报告，12页pdf，Summary of the Joint All-Domain Command and Control Strategy

专知会员服务

272+阅读 · 2022年3月22日

【KDD2021】基于多智能体协同竞价博弈的电商搜索广告多目标竞价优化

专知会员服务

35+阅读 · 2021年6月14日

【SIGMOD2020】一个全面的主动学习方法的实体匹配基准框架，A Comprehensive Benchmark Framework for Active Learning Methods in Entity Matching

【SIGMOD2020】一个全面的主动学习方法的实体匹配基准框架，A Comprehensive Benchmark Framework for Active Learning Methods in Entity Matching

专知会员服务

24+阅读 · 2020年3月31日

《美国国防部（DoD）联合能力集成与开发系统（JCIDS）报告》

《美国国防部（DoD）联合能力集成与开发系统（JCIDS）报告》

专知

43+阅读 · 2023年4月13日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

33+阅读 · 2022年10月17日

【JADC2指南】《实现联合全域指挥与控制的JADC2基本指南》11页slides，Splunk公司产品助力JADC2实施

【JADC2指南】《实现联合全域指挥与控制的JADC2基本指南》11页slides，Splunk公司产品助力JADC2实施

专知

23+阅读 · 2022年6月3日

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

专知

69+阅读 · 2022年4月9日

美国「联合全域指挥与控制 (JADC2)」战略发展最新总结报告，12页pdf

美国「联合全域指挥与控制 (JADC2)」战略发展最新总结报告，12页pdf

专知

186+阅读 · 2022年3月23日

【PID】PID控制中P、I、D参数的作用究竟是什么？ PID控制算法精华和参数整定三大招

【PID】PID控制中P、I、D参数的作用究竟是什么？ PID控制算法精华和参数整定三大招

产业智能官

18+阅读 · 2020年6月1日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

【自动化】详解PID调节的基本概念、参数与调试方法，清晰易懂！

【自动化】详解PID调节的基本概念、参数与调试方法，清晰易懂！

产业智能官

10+阅读 · 2018年12月20日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

基于机器学习的KPI自动化异常检测系统

基于机器学习的KPI自动化异常检测系统

运维帮

13+阅读 · 2017年8月16日

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于在线双向拍卖的运输服务市场交易策略研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂网络上数据传输博弈的合作性优化与控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

信息产品与附加服务的最优定价策略研究

国家自然科学基金

1+阅读 · 2014年12月31日

跨层次、动态视角的联盟网络与企业创新绩效关系研究

国家自然科学基金

0+阅读 · 2014年12月31日

动态环境下决策单元效率评价方法与应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

统计估计与决策优化在库存和定价管理中的集成研究

国家自然科学基金

0+阅读 · 2014年12月31日

考虑共谋行为的多属性采购拍卖理论与优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

不确定需求下的拉动式合约拍卖协商机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

互联网实时竞价广告的若干关键问题研究

国家自然科学基金

2+阅读 · 2014年12月31日

RAD-DPO: Robust Adaptive Denoising Direct Preference Optimization for Generative Retrieval in E-commerce

Arxiv

0+阅读 · 4月28日

Optimas: An Intelligent Analytics-Informed Generative AI Framework for Performance Optimization

Arxiv

0+阅读 · 4月26日

Efficiency of Proportional Mechanisms in Online Auto-Bidding Advertising

Arxiv

0+阅读 · 4月24日

Adaptive Bidding Policies for First-Price Auctions with Budget Constraints under Non-stationarity

Arxiv

0+阅读 · 4月11日

Adaptive Bidding Policies for First-Price Auctions with Budget Constraints under Non-stationarity

Arxiv

0+阅读 · 4月11日

Learn then Decide: A Learning Approach for Designing Data Marketplaces

Arxiv

0+阅读 · 4月3日

Intelligent Cloud Orchestration: A Hybrid Predictive and Heuristic Framework for Cost Optimization

Arxiv

0+阅读 · 4月2日

Var-JEPA: A Variational Formulation of the Joint-Embedding Predictive Architecture -- Bridging Predictive and Generative Self-Supervised Learning

Arxiv

0+阅读 · 3月20日

GO-GenZip: Goal-Oriented Generative Sampling and Hybrid Compression

Arxiv

0+阅读 · 3月20日

AIGQ: An End-to-End Hybrid Generative Architecture for E-commerce Query Recommendation

Arxiv

0+阅读 · 3月20日

VIP会员

文章信息

相关主题

最新内容

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

1+阅读 · 今天2:42

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

1+阅读 · 今天2:37

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

2+阅读 · 今天2:23

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

5+阅读 · 今天2:21

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

2+阅读 · 今天1:46

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

5+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

4+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

4+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

8+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

7+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

7+阅读 · 7月31日

相关VIP内容

智能书（SmartBook）：面向情报分析师的AI辅助态势报告生成工具 | 附文献

智能书（SmartBook）：面向情报分析师的AI辅助态势报告生成工具 | 附文献

专知会员服务

53+阅读 · 2025年9月29日

北航团队提出SIDM：基于结构信息原理的通用分层决策框架

北航团队提出SIDM：基于结构信息原理的通用分层决策框架

专知会员服务

19+阅读 · 2025年5月14日

《联合飞机生存能力计划（JASP）》

《联合飞机生存能力计划（JASP）》

专知会员服务

24+阅读 · 2024年7月8日

《评估人工智能和辅助自动化指挥与控制决策辅助工具以提高任务效率的分析框架》

《评估人工智能和辅助自动化指挥与控制决策辅助工具以提高任务效率的分析框架》

专知会员服务

139+阅读 · 2023年7月10日

《美国国防部（DoD）联合能力集成与开发系统（JCIDS）报告》

《美国国防部（DoD）联合能力集成与开发系统（JCIDS）报告》

专知会员服务

111+阅读 · 2023年4月12日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知会员服务

263+阅读 · 2022年8月23日

美国哈德逊研究所国防概念与技术中心《实施以决策为中心的战争：提升指挥与控制以获得选择优势》，50页pdf

美国哈德逊研究所国防概念与技术中心《实施以决策为中心的战争：提升指挥与控制以获得选择优势》，50页pdf

专知会员服务

184+阅读 · 2022年4月11日

美国「联合全域指挥与控制 (JADC2)」战略发展最新总结报告，12页pdf，Summary of the Joint All-Domain Command and Control Strategy

美国「联合全域指挥与控制 (JADC2)」战略发展最新总结报告，12页pdf，Summary of the Joint All-Domain Command and Control Strategy

专知会员服务

272+阅读 · 2022年3月22日

【KDD2021】基于多智能体协同竞价博弈的电商搜索广告多目标竞价优化

专知会员服务

35+阅读 · 2021年6月14日

【SIGMOD2020】一个全面的主动学习方法的实体匹配基准框架，A Comprehensive Benchmark Framework for Active Learning Methods in Entity Matching

【SIGMOD2020】一个全面的主动学习方法的实体匹配基准框架，A Comprehensive Benchmark Framework for Active Learning Methods in Entity Matching

专知会员服务

24+阅读 · 2020年3月31日

热门VIP内容

开通专知VIP会员享更多权益服务

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

从采集到决策：美军视角下的战术情报范式重构

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

相关资讯

《美国国防部（DoD）联合能力集成与开发系统（JCIDS）报告》

《美国国防部（DoD）联合能力集成与开发系统（JCIDS）报告》

专知

43+阅读 · 2023年4月13日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

33+阅读 · 2022年10月17日

【JADC2指南】《实现联合全域指挥与控制的JADC2基本指南》11页slides，Splunk公司产品助力JADC2实施

【JADC2指南】《实现联合全域指挥与控制的JADC2基本指南》11页slides，Splunk公司产品助力JADC2实施

专知

23+阅读 · 2022年6月3日

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

专知

69+阅读 · 2022年4月9日

美国「联合全域指挥与控制 (JADC2)」战略发展最新总结报告，12页pdf

美国「联合全域指挥与控制 (JADC2)」战略发展最新总结报告，12页pdf

专知

186+阅读 · 2022年3月23日

【PID】PID控制中P、I、D参数的作用究竟是什么？ PID控制算法精华和参数整定三大招

【PID】PID控制中P、I、D参数的作用究竟是什么？ PID控制算法精华和参数整定三大招

产业智能官

18+阅读 · 2020年6月1日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

【自动化】详解PID调节的基本概念、参数与调试方法，清晰易懂！

【自动化】详解PID调节的基本概念、参数与调试方法，清晰易懂！

产业智能官

10+阅读 · 2018年12月20日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

基于机器学习的KPI自动化异常检测系统

基于机器学习的KPI自动化异常检测系统

运维帮

13+阅读 · 2017年8月16日

相关论文

RAD-DPO: Robust Adaptive Denoising Direct Preference Optimization for Generative Retrieval in E-commerce

Arxiv

0+阅读 · 4月28日

Optimas: An Intelligent Analytics-Informed Generative AI Framework for Performance Optimization

Arxiv

0+阅读 · 4月26日

Efficiency of Proportional Mechanisms in Online Auto-Bidding Advertising

Arxiv

0+阅读 · 4月24日

Adaptive Bidding Policies for First-Price Auctions with Budget Constraints under Non-stationarity

Arxiv

0+阅读 · 4月11日

Adaptive Bidding Policies for First-Price Auctions with Budget Constraints under Non-stationarity

Arxiv

0+阅读 · 4月11日

Learn then Decide: A Learning Approach for Designing Data Marketplaces

Arxiv

0+阅读 · 4月3日

Intelligent Cloud Orchestration: A Hybrid Predictive and Heuristic Framework for Cost Optimization

Arxiv

0+阅读 · 4月2日

Var-JEPA: A Variational Formulation of the Joint-Embedding Predictive Architecture -- Bridging Predictive and Generative Self-Supervised Learning

Arxiv

0+阅读 · 3月20日

GO-GenZip: Goal-Oriented Generative Sampling and Hybrid Compression

Arxiv

0+阅读 · 3月20日

AIGQ: An End-to-End Hybrid Generative Architecture for E-commerce Query Recommendation

Arxiv

0+阅读 · 3月20日

相关基金

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于在线双向拍卖的运输服务市场交易策略研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂网络上数据传输博弈的合作性优化与控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

信息产品与附加服务的最优定价策略研究

国家自然科学基金

1+阅读 · 2014年12月31日

跨层次、动态视角的联盟网络与企业创新绩效关系研究

国家自然科学基金

0+阅读 · 2014年12月31日

动态环境下决策单元效率评价方法与应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

统计估计与决策优化在库存和定价管理中的集成研究

国家自然科学基金

0+阅读 · 2014年12月31日

考虑共谋行为的多属性采购拍卖理论与优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

不确定需求下的拉动式合约拍卖协商机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

互联网实时竞价广告的若干关键问题研究

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员