Adaptive Bidding Policies for First-Price Auctions with Budget Constraints under Non-stationarity - 专知论文

会员服务 ·

0

非平稳 · 约束 · 自适应 · 最优 · 变分 ·

Adaptive Bidding Policies for First-Price Auctions with Budget Constraints under Non-stationarity

翻译：面向非平稳环境下带有预算约束的第一价格拍卖的自适应出价策略

Yige Wang,Jiashuo Jiang

In this paper, we study how a budget-constrained bidder should learn to bid adaptively in repeated first-price auctions to maximize cumulative payoff. This problem arises from the recent industry-wide shift from second-price auctions to first-price auctions in display advertising, which renders truthful bidding suboptimal. We propose a simple dual-gradient-descent-based bidding policy that maintains a dual variable for the budget constraint as the bidder consumes the budget. We analyze two settings based on the bidder's knowledge of future private values: (i) an uninformative setting where all distributional knowledge (potentially non-stationary) is entirely unknown, and (ii) an informative setting where a prediction of budget allocation is available in advance. We characterize the performance loss (regret) relative to an optimal policy with complete information. For uninformative setting, we show that the regret is ~O(sqrt(T)) plus a Wasserstein-based variation term capturing non-stationarity, which is order-optimal. In the informative setting, the variation term can be eliminated using predictions, yielding a regret of ~O(sqrt(T)) plus the prediction error. Furthermore, we go beyond the global budget constraint by introducing a refined benchmark based on a per-period budget allocation plan, achieving exactly ~O(sqrt(T)) regret. We also establish robustness guarantees when the baseline policy deviates from the planned allocation, covering both ideal and adversarial deviations.

翻译：本文研究预算受限的竞标者在重复第一价格拍卖中如何自适应学习出价以最大化累积收益。该问题源于显示广告领域近期从第二价格拍卖向第一价格拍卖的行业转型，这使得真实报价策略不再最优。我们提出一种基于双梯度下降的简单出价策略，该策略在竞标者消耗预算时维护一个针对预算约束的对偶变量。我们基于竞标者对未来私有价值的了解程度分析两种设置：（i）无信息设置，即所有分布知识（可能非平稳）完全未知；（ii）有信息设置，即预先获得预算分配的预测。我们刻画了相对于拥有完全信息的最优策略的性能损失（遗憾）。对于无信息设置，我们证明遗憾为~O(sqrt(T))加上一个刻画非平稳性的Wasserstein变分项，且该界阶最优。在有信息设置中，利用预测可消除变分项，得到~O(sqrt(T))加预测误差的遗憾界。进一步，我们超越全局预算约束，引入基于每期预算分配方案的精细化基准，实现了精确的~O(sqrt(T))遗憾界。我们还建立了基线策略偏离计划分配时的鲁棒性保证，涵盖理想情形和对抗性偏离。

0

相关内容

非平稳

《自适应智能：融合数字孪生精准性与人工智能预见力，实现实时决策》

《自适应智能：融合数字孪生精准性与人工智能预见力，实现实时决策》

专知会员服务

24+阅读 · 6月4日

【NTU博士论文】鲁棒和自适应的决策制定：从强化学习的视角，162页pdf

【NTU博士论文】鲁棒和自适应的决策制定：从强化学习的视角，162页pdf

专知会员服务

38+阅读 · 2024年1月17日

美国陆军《飞行决策和态势感知研究：决策文献综述》58页技术报告，美国陆军“飞行决策和态势感知”项目的第一个成果

美国陆军《飞行决策和态势感知研究：决策文献综述》58页技术报告，美国陆军“飞行决策和态势感知”项目的第一个成果

专知会员服务

135+阅读 · 2022年10月12日

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》普渡大学2022最新论文

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》普渡大学2022最新论文

专知会员服务

66+阅读 · 2022年9月22日

美国哈德逊研究所国防概念与技术中心《实施以决策为中心的战争：提升指挥与控制以获得选择优势》，50页pdf

美国哈德逊研究所国防概念与技术中心《实施以决策为中心的战争：提升指挥与控制以获得选择优势》，50页pdf

专知会员服务

184+阅读 · 2022年4月11日

实时竞价在展示广告中的应用研究及进展

专知会员服务

21+阅读 · 2020年10月4日

策略梯度方法的算子视图，An operator view of policy gradient methods

策略梯度方法的算子视图，An operator view of policy gradient methods

专知会员服务

11+阅读 · 2020年6月23日

【WWW2020-中科大-滴滴】层次自适应上下文赌博机的资源约束推荐

【WWW2020-中科大-滴滴】层次自适应上下文赌博机的资源约束推荐

专知会员服务

21+阅读 · 2020年4月3日

【Google-普林斯顿】从学习速率中解开自适应梯度法，Disentangling Adaptive Gradient

专知会员服务

19+阅读 · 2020年3月5日

【AAAI 2019 Tutorial】不确定性下基于知识的顺序决策（Knowledge-based Sequential Decision-Making under Uncertainty），张世琦，Mohan Sridharan

【AAAI 2019 Tutorial】不确定性下基于知识的顺序决策（Knowledge-based Sequential Decision-Making under Uncertainty），张世琦，Mohan Sridharan

专知会员服务

14+阅读 · 2019年11月18日

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

39+阅读 · 2023年4月13日

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

专知

10+阅读 · 2023年4月6日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知

17+阅读 · 2021年1月18日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

专知

16+阅读 · 2020年4月27日

苏宁易购基于机器学习预测流量波动趋势的实践经验

苏宁易购基于机器学习预测流量波动趋势的实践经验

AI前线

15+阅读 · 2019年10月17日

【资源】领域自适应相关论文、代码分享

【资源】领域自适应相关论文、代码分享

专知

32+阅读 · 2019年10月12日

市场▍ToB的SaaS服务如何收费？关于定价的 10 年经验总结

市场▍ToB的SaaS服务如何收费？关于定价的 10 年经验总结

36大数据

20+阅读 · 2019年2月24日

零售商福音：用机器学习给产品定价实现收益最大化

零售商福音：用机器学习给产品定价实现收益最大化

论智

19+阅读 · 2018年9月28日

【学科发展报告】自适应动态规划

【学科发展报告】自适应动态规划

中国自动化学会

25+阅读 · 2018年9月14日

基于在线双向拍卖的运输服务市场交易策略研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于流行品供应链的两阶段定价与广告契约研究

国家自然科学基金

1+阅读 · 2015年12月31日

考虑一般约束条件下的消费投资决策模型研究

国家自然科学基金

1+阅读 · 2014年12月31日

报价人的行为实验和拍卖机制的可实施性研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于竞争差分析的单向交易策略

国家自然科学基金

0+阅读 · 2014年12月31日

劣者淘汰两阶段自适应临床试验的设计和分析

国家自然科学基金

0+阅读 · 2014年12月31日

政府、银行和房地产的合作与冲突- - 基于动态博弈视角的房价调控均衡政策探索

国家自然科学基金

1+阅读 · 2014年12月31日

考虑共谋行为的多属性采购拍卖理论与优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

不确定需求下的拉动式合约拍卖协商机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

互联网实时竞价广告的若干关键问题研究

国家自然科学基金

2+阅读 · 2014年12月31日

Revenue Guarantees of No-Swap-Regret Dynamics in First Price Auctions

Arxiv

0+阅读 · 6月4日

Gradient Dynamics in First-Price Auctions: Iterative Strategy Elimination via Cubic Potentials

Arxiv

0+阅读 · 6月3日

Online Price Competition under Generalized Linear Demands

Arxiv

0+阅读 · 5月7日

Evaluating the Performance of Approximation Mechanisms under Budget Constraints

Arxiv

0+阅读 · 4月29日

Pricing Innovation Under Latency Constraints: A Mean-Field Analysis of Coded Payload Delivery

Arxiv

0+阅读 · 4月28日

LLM-Auction: Generative Auction towards LLM-Native Advertising

Arxiv

0+阅读 · 4月27日

Adaptive Bidding Policies for First-Price Auctions with Budget Constraints under Non-stationarity

Arxiv

0+阅读 · 4月11日

Adaptive Bidding Policies for First-Price Auctions with Budget Constraints under Non-stationarity

Arxiv

0+阅读 · 4月11日

Optimal Pricing with Unreliable Signals

Arxiv

0+阅读 · 4月3日

Adaptive Coverage Policies in Conformal Prediction

Arxiv

0+阅读 · 4月2日

VIP会员

文章信息

相关主题

最新内容

《无人机对海面作战影响评估》

《无人机对海面作战影响评估》

专知会员服务

9+阅读 · 7月21日

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

专知会员服务

8+阅读 · 7月21日

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

专知会员服务

3+阅读 · 7月21日

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

专知会员服务

5+阅读 · 7月21日

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

专知会员服务

6+阅读 · 7月21日

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

5+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

7+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

6+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

8+阅读 · 7月20日

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

7+阅读 · 7月20日

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

9+阅读 · 7月20日

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

专知会员服务

8+阅读 · 7月20日

深入Project Maven：为何人工智能在战场上依然失灵

深入Project Maven：为何人工智能在战场上依然失灵

专知会员服务

15+阅读 · 7月19日

锻造未来士兵：外骨骼、基因工程与赛博格

锻造未来士兵：外骨骼、基因工程与赛博格

专知会员服务

8+阅读 · 7月19日

《无人机系统（UAS）通信网状网络试验性部署》50页报告

《无人机系统（UAS）通信网状网络试验性部署》50页报告

专知会员服务

10+阅读 · 7月19日

相关VIP内容

《自适应智能：融合数字孪生精准性与人工智能预见力，实现实时决策》

《自适应智能：融合数字孪生精准性与人工智能预见力，实现实时决策》

专知会员服务

24+阅读 · 6月4日

【NTU博士论文】鲁棒和自适应的决策制定：从强化学习的视角，162页pdf

【NTU博士论文】鲁棒和自适应的决策制定：从强化学习的视角，162页pdf

专知会员服务

38+阅读 · 2024年1月17日

美国陆军《飞行决策和态势感知研究：决策文献综述》58页技术报告，美国陆军“飞行决策和态势感知”项目的第一个成果

美国陆军《飞行决策和态势感知研究：决策文献综述》58页技术报告，美国陆军“飞行决策和态势感知”项目的第一个成果

专知会员服务

135+阅读 · 2022年10月12日

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》普渡大学2022最新论文

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》普渡大学2022最新论文

专知会员服务

66+阅读 · 2022年9月22日

美国哈德逊研究所国防概念与技术中心《实施以决策为中心的战争：提升指挥与控制以获得选择优势》，50页pdf

美国哈德逊研究所国防概念与技术中心《实施以决策为中心的战争：提升指挥与控制以获得选择优势》，50页pdf

专知会员服务

184+阅读 · 2022年4月11日

实时竞价在展示广告中的应用研究及进展

专知会员服务

21+阅读 · 2020年10月4日

策略梯度方法的算子视图，An operator view of policy gradient methods

策略梯度方法的算子视图，An operator view of policy gradient methods

专知会员服务

11+阅读 · 2020年6月23日

【WWW2020-中科大-滴滴】层次自适应上下文赌博机的资源约束推荐

【WWW2020-中科大-滴滴】层次自适应上下文赌博机的资源约束推荐

专知会员服务

21+阅读 · 2020年4月3日

【Google-普林斯顿】从学习速率中解开自适应梯度法，Disentangling Adaptive Gradient

专知会员服务

19+阅读 · 2020年3月5日

【AAAI 2019 Tutorial】不确定性下基于知识的顺序决策（Knowledge-based Sequential Decision-Making under Uncertainty），张世琦，Mohan Sridharan

【AAAI 2019 Tutorial】不确定性下基于知识的顺序决策（Knowledge-based Sequential Decision-Making under Uncertainty），张世琦，Mohan Sridharan

专知会员服务

14+阅读 · 2019年11月18日

热门VIP内容

开通专知VIP会员享更多权益服务

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

《无人机对海面作战影响评估》

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

相关资讯

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

39+阅读 · 2023年4月13日

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

专知

10+阅读 · 2023年4月6日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知

17+阅读 · 2021年1月18日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

最新《迁移学习:域自适应理论》综述论文，128页ppt讲解迁移学习与最优传输

专知

16+阅读 · 2020年4月27日

苏宁易购基于机器学习预测流量波动趋势的实践经验

苏宁易购基于机器学习预测流量波动趋势的实践经验

AI前线

15+阅读 · 2019年10月17日

【资源】领域自适应相关论文、代码分享

【资源】领域自适应相关论文、代码分享

专知

32+阅读 · 2019年10月12日

市场▍ToB的SaaS服务如何收费？关于定价的 10 年经验总结

市场▍ToB的SaaS服务如何收费？关于定价的 10 年经验总结

36大数据

20+阅读 · 2019年2月24日

零售商福音：用机器学习给产品定价实现收益最大化

零售商福音：用机器学习给产品定价实现收益最大化

论智

19+阅读 · 2018年9月28日

【学科发展报告】自适应动态规划

【学科发展报告】自适应动态规划

中国自动化学会

25+阅读 · 2018年9月14日

相关论文

Revenue Guarantees of No-Swap-Regret Dynamics in First Price Auctions

Arxiv

0+阅读 · 6月4日

Gradient Dynamics in First-Price Auctions: Iterative Strategy Elimination via Cubic Potentials

Arxiv

0+阅读 · 6月3日

Online Price Competition under Generalized Linear Demands

Arxiv

0+阅读 · 5月7日

Evaluating the Performance of Approximation Mechanisms under Budget Constraints

Arxiv

0+阅读 · 4月29日

Pricing Innovation Under Latency Constraints: A Mean-Field Analysis of Coded Payload Delivery

Arxiv

0+阅读 · 4月28日

LLM-Auction: Generative Auction towards LLM-Native Advertising

Arxiv

0+阅读 · 4月27日

Adaptive Bidding Policies for First-Price Auctions with Budget Constraints under Non-stationarity

Arxiv

0+阅读 · 4月11日

Adaptive Bidding Policies for First-Price Auctions with Budget Constraints under Non-stationarity

Arxiv

0+阅读 · 4月11日

Optimal Pricing with Unreliable Signals

Arxiv

0+阅读 · 4月3日

Adaptive Coverage Policies in Conformal Prediction

Arxiv

0+阅读 · 4月2日

相关基金

基于在线双向拍卖的运输服务市场交易策略研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于流行品供应链的两阶段定价与广告契约研究

国家自然科学基金

1+阅读 · 2015年12月31日

考虑一般约束条件下的消费投资决策模型研究

国家自然科学基金

1+阅读 · 2014年12月31日

报价人的行为实验和拍卖机制的可实施性研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于竞争差分析的单向交易策略

国家自然科学基金

0+阅读 · 2014年12月31日

劣者淘汰两阶段自适应临床试验的设计和分析

国家自然科学基金

0+阅读 · 2014年12月31日

政府、银行和房地产的合作与冲突- - 基于动态博弈视角的房价调控均衡政策探索

国家自然科学基金

1+阅读 · 2014年12月31日

考虑共谋行为的多属性采购拍卖理论与优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

不确定需求下的拉动式合约拍卖协商机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

互联网实时竞价广告的若干关键问题研究

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员