Adaptive Bidding Policies for First-Price Auctions with Budget Constraints under Non-stationarity - 专知论文

会员服务 ·

0

非平稳 · 约束 · 自适应 · 最优 · 变分 ·

Adaptive Bidding Policies for First-Price Auctions with Budget Constraints under Non-stationarity

翻译：面向非平稳环境下预算约束的首价拍卖自适应投标策略

Yige Wang,Jiashuo Jiang

from arxiv, Previously this version appeared as arXiv:2604.03103 which was submitted as a new work by accident

We study how a budget-constrained bidder should learn to adaptively bid in repeated first-price auctions to maximize her cumulative payoff. This problem arose due to an industry-wide shift from second-price auctions to first-price auctions in display advertising recently, which renders truthful bidding (i.e., always bidding one's private value) no longer optimal. We propose a simple dual-gradient-descent-based bidding policy that maintains a dual variable for budget constraint as the bidder consumes her budget. In analysis, we consider two settings regarding the bidder's knowledge of her private values in the future: (i) an uninformative setting where all the distributional knowledge (can be non-stationary) is entirely unknown to the bidder, and (ii) an informative setting where a prediction of the budget allocation in advance. We characterize the performance loss (or regret) relative to an optimal policy with complete information on the stochasticity. For uninformative setting, We show that the regret is \tilde{O}(\sqrt{T}) plus a variation term that reflects the non-stationarity of the value distributions, and this is of optimal order. We then show that we can get rid of the variation term with the help of the prediction; specifically, the regret is \tilde{O}(\sqrt{T}) plus the prediction error term in the informative setting.

翻译：研究预算受限投标人如何在重复首价拍卖中学习自适应投标以最大化其累积收益。这一问题源于近年来展示广告行业从次价拍卖向首价拍卖的全面转型，导致真实报价策略（即始终按私人估值报价）不再最优。我们提出一种基于对偶梯度下降的简洁投标策略，该策略在投标人消耗预算时维持预算约束的对偶变量。分析中考虑投标人对未来私人估值认知程度的两种场景：（i）无信息场景，其中所有分布知识（可能呈现非平稳性）对投标人完全未知；（ii）有信息场景，其中投标人可提前获取预算分配预测。我们刻画了相对于完全了解随机性信息的最优策略的性能损失（即遗憾值）。在无信息场景下，证明遗憾值为\tilde{O}(\sqrt{T})加上反映价值分布非平稳性的变分项，且该界达到最优阶次。进一步表明，借助预测信息可消除该变分项：具体而言，有信息场景的遗憾值为\tilde{O}(\sqrt{T})加上预测误差项。

0

相关内容

非平稳

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

专知会员服务

52+阅读 · 2025年9月8日

《美国防部核心流程信息技术生命周期投资评估：前沿部署战地维修中的远距机器人技术与大语言模型》最新215页

《美国防部核心流程信息技术生命周期投资评估：前沿部署战地维修中的远距机器人技术与大语言模型》最新215页

专知会员服务

17+阅读 · 2025年7月14日

【牛津大学博士论文】不确定性量化与因果考量在非策略决策制定中的应用

【牛津大学博士论文】不确定性量化与因果考量在非策略决策制定中的应用

专知会员服务

20+阅读 · 2025年2月24日

《联合火力自动化的效应任务优化方法》2022最新30页技术报告，加拿大国防研究与发展部

《联合火力自动化的效应任务优化方法》2022最新30页技术报告，加拿大国防研究与发展部

专知会员服务

57+阅读 · 2023年1月12日

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》普渡大学2022最新论文

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》普渡大学2022最新论文

专知会员服务

66+阅读 · 2022年9月22日

【AI+军事】附论文+PPT 《国防投资组合决策：来自全国实践调查的洞察力》

【AI+军事】附论文+PPT 《国防投资组合决策：来自全国实践调查的洞察力》

专知会员服务

25+阅读 · 2022年4月17日

实时竞价在展示广告中的应用研究及进展

专知会员服务

21+阅读 · 2020年10月4日

策略梯度方法的算子视图，An operator view of policy gradient methods

策略梯度方法的算子视图，An operator view of policy gradient methods

专知会员服务

11+阅读 · 2020年6月23日

【WWW2020-中科大-滴滴】层次自适应上下文赌博机的资源约束推荐

【WWW2020-中科大-滴滴】层次自适应上下文赌博机的资源约束推荐

专知会员服务

21+阅读 · 2020年4月3日

【Google-普林斯顿】从学习速率中解开自适应梯度法，Disentangling Adaptive Gradient

专知会员服务

19+阅读 · 2020年3月5日

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

39+阅读 · 2023年4月13日

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

专知

10+阅读 · 2023年4月6日

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

专知

11+阅读 · 2020年3月17日

苏宁易购基于机器学习预测流量波动趋势的实践经验

苏宁易购基于机器学习预测流量波动趋势的实践经验

AI前线

15+阅读 · 2019年10月17日

局部学习的特征选择：Local-Learning-Based Feature Selection

局部学习的特征选择：Local-Learning-Based Feature Selection

我爱读PAMI

14+阅读 · 2019年9月20日

市场▍ToB的SaaS服务如何收费？关于定价的 10 年经验总结

市场▍ToB的SaaS服务如何收费？关于定价的 10 年经验总结

36大数据

20+阅读 · 2019年2月24日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

零售商福音：用机器学习给产品定价实现收益最大化

零售商福音：用机器学习给产品定价实现收益最大化

论智

19+阅读 · 2018年9月28日

【学科发展报告】自适应动态规划

【学科发展报告】自适应动态规划

中国自动化学会

25+阅读 · 2018年9月14日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

基于在线双向拍卖的运输服务市场交易策略研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于流行品供应链的两阶段定价与广告契约研究

国家自然科学基金

1+阅读 · 2015年12月31日

随机对策的首达目标准则及其有限逼近

国家自然科学基金

0+阅读 · 2015年12月31日

考虑一般约束条件下的消费投资决策模型研究

国家自然科学基金

1+阅读 · 2014年12月31日

报价人的行为实验和拍卖机制的可实施性研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于竞争差分析的单向交易策略

国家自然科学基金

0+阅读 · 2014年12月31日

政府、银行和房地产的合作与冲突- - 基于动态博弈视角的房价调控均衡政策探索

国家自然科学基金

1+阅读 · 2014年12月31日

考虑共谋行为的多属性采购拍卖理论与优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

不确定需求下的拉动式合约拍卖协商机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

互联网实时竞价广告的若干关键问题研究

国家自然科学基金

2+阅读 · 2014年12月31日

Comparison Patrols on Drifting Orders: Certified Rank Maintenance, Evolving Planar Maxima, and Selection under Drifting Fitness

Arxiv

0+阅读 · 6月12日

Censorship-Resistant Sealed-Bid Auctions on Blockchains

Arxiv

0+阅读 · 6月12日

DRIVE: Distributional and Retrieval-Augmented Bidding with Value Evaluation

Arxiv

0+阅读 · 6月12日

Treatment Allocation under Uncertain Costs

Arxiv

0+阅读 · 6月7日

Gradient Dynamics in First-Price Auctions: Iterative Strategy Elimination via Cubic Potentials

Arxiv

0+阅读 · 6月3日

Repeated Descent: A Framework for Online Budget-Feasible Auctions

Arxiv

0+阅读 · 5月31日

Decision Support for Marketplace Policies under Incomplete Evidence: From Replay to Launch Readiness

Arxiv

0+阅读 · 5月13日

Adaptive Multi-Round Allocation with Stochastic Arrivals

Arxiv

0+阅读 · 5月12日

Marking strategies for adaptive mesh refinement: An efficiency-focused benchmark study for steady solid and fluid mechanics problems

Arxiv

0+阅读 · 4月30日

LLM-Auction: Generative Auction towards LLM-Native Advertising

Arxiv

0+阅读 · 4月27日

VIP会员

文章信息

相关主题

最新内容

《无人机对海面作战影响评估》

《无人机对海面作战影响评估》

专知会员服务

9+阅读 · 7月21日

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

专知会员服务

8+阅读 · 7月21日

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

专知会员服务

3+阅读 · 7月21日

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

专知会员服务

5+阅读 · 7月21日

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

专知会员服务

6+阅读 · 7月21日

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

5+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

7+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

6+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

8+阅读 · 7月20日

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

7+阅读 · 7月20日

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

9+阅读 · 7月20日

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

专知会员服务

9+阅读 · 7月20日

深入Project Maven：为何人工智能在战场上依然失灵

深入Project Maven：为何人工智能在战场上依然失灵

专知会员服务

15+阅读 · 7月19日

锻造未来士兵：外骨骼、基因工程与赛博格

锻造未来士兵：外骨骼、基因工程与赛博格

专知会员服务

8+阅读 · 7月19日

《无人机系统（UAS）通信网状网络试验性部署》50页报告

《无人机系统（UAS）通信网状网络试验性部署》50页报告

专知会员服务

10+阅读 · 7月19日

相关VIP内容

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

专知会员服务

52+阅读 · 2025年9月8日

《美国防部核心流程信息技术生命周期投资评估：前沿部署战地维修中的远距机器人技术与大语言模型》最新215页

《美国防部核心流程信息技术生命周期投资评估：前沿部署战地维修中的远距机器人技术与大语言模型》最新215页

专知会员服务

17+阅读 · 2025年7月14日

【牛津大学博士论文】不确定性量化与因果考量在非策略决策制定中的应用

【牛津大学博士论文】不确定性量化与因果考量在非策略决策制定中的应用

专知会员服务

20+阅读 · 2025年2月24日

《联合火力自动化的效应任务优化方法》2022最新30页技术报告，加拿大国防研究与发展部

《联合火力自动化的效应任务优化方法》2022最新30页技术报告，加拿大国防研究与发展部

专知会员服务

57+阅读 · 2023年1月12日

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》普渡大学2022最新论文

【博士论文】《网络系统中安全资源分配的博弈论框架中行为决策效应》普渡大学2022最新论文

专知会员服务

66+阅读 · 2022年9月22日

【AI+军事】附论文+PPT 《国防投资组合决策：来自全国实践调查的洞察力》

【AI+军事】附论文+PPT 《国防投资组合决策：来自全国实践调查的洞察力》

专知会员服务

25+阅读 · 2022年4月17日

实时竞价在展示广告中的应用研究及进展

专知会员服务

21+阅读 · 2020年10月4日

策略梯度方法的算子视图，An operator view of policy gradient methods

策略梯度方法的算子视图，An operator view of policy gradient methods

专知会员服务

11+阅读 · 2020年6月23日

【WWW2020-中科大-滴滴】层次自适应上下文赌博机的资源约束推荐

【WWW2020-中科大-滴滴】层次自适应上下文赌博机的资源约束推荐

专知会员服务

21+阅读 · 2020年4月3日

【Google-普林斯顿】从学习速率中解开自适应梯度法，Disentangling Adaptive Gradient

专知会员服务

19+阅读 · 2020年3月5日

热门VIP内容

开通专知VIP会员享更多权益服务

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

《无人机对海面作战影响评估》

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

相关资讯

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

39+阅读 · 2023年4月13日

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

专知

10+阅读 · 2023年4月6日

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

专知

11+阅读 · 2020年3月17日

苏宁易购基于机器学习预测流量波动趋势的实践经验

苏宁易购基于机器学习预测流量波动趋势的实践经验

AI前线

15+阅读 · 2019年10月17日

局部学习的特征选择：Local-Learning-Based Feature Selection

局部学习的特征选择：Local-Learning-Based Feature Selection

我爱读PAMI

14+阅读 · 2019年9月20日

市场▍ToB的SaaS服务如何收费？关于定价的 10 年经验总结

市场▍ToB的SaaS服务如何收费？关于定价的 10 年经验总结

36大数据

20+阅读 · 2019年2月24日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

零售商福音：用机器学习给产品定价实现收益最大化

零售商福音：用机器学习给产品定价实现收益最大化

论智

19+阅读 · 2018年9月28日

【学科发展报告】自适应动态规划

【学科发展报告】自适应动态规划

中国自动化学会

25+阅读 · 2018年9月14日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

相关论文

Comparison Patrols on Drifting Orders: Certified Rank Maintenance, Evolving Planar Maxima, and Selection under Drifting Fitness

Arxiv

0+阅读 · 6月12日

Censorship-Resistant Sealed-Bid Auctions on Blockchains

Arxiv

0+阅读 · 6月12日

DRIVE: Distributional and Retrieval-Augmented Bidding with Value Evaluation

Arxiv

0+阅读 · 6月12日

Treatment Allocation under Uncertain Costs

Arxiv

0+阅读 · 6月7日

Gradient Dynamics in First-Price Auctions: Iterative Strategy Elimination via Cubic Potentials

Arxiv

0+阅读 · 6月3日

Repeated Descent: A Framework for Online Budget-Feasible Auctions

Arxiv

0+阅读 · 5月31日

Decision Support for Marketplace Policies under Incomplete Evidence: From Replay to Launch Readiness

Arxiv

0+阅读 · 5月13日

Adaptive Multi-Round Allocation with Stochastic Arrivals

Arxiv

0+阅读 · 5月12日

Marking strategies for adaptive mesh refinement: An efficiency-focused benchmark study for steady solid and fluid mechanics problems

Arxiv

0+阅读 · 4月30日

LLM-Auction: Generative Auction towards LLM-Native Advertising

Arxiv

0+阅读 · 4月27日

相关基金

基于在线双向拍卖的运输服务市场交易策略研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于流行品供应链的两阶段定价与广告契约研究

国家自然科学基金

1+阅读 · 2015年12月31日

随机对策的首达目标准则及其有限逼近

国家自然科学基金

0+阅读 · 2015年12月31日

考虑一般约束条件下的消费投资决策模型研究

国家自然科学基金

1+阅读 · 2014年12月31日

报价人的行为实验和拍卖机制的可实施性研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于竞争差分析的单向交易策略

国家自然科学基金

0+阅读 · 2014年12月31日

政府、银行和房地产的合作与冲突- - 基于动态博弈视角的房价调控均衡政策探索

国家自然科学基金

1+阅读 · 2014年12月31日

考虑共谋行为的多属性采购拍卖理论与优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

不确定需求下的拉动式合约拍卖协商机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

互联网实时竞价广告的若干关键问题研究

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员