Bilateral trade models the task of intermediating between two strategic agents, a seller and a buyer, who wish to trade a good. We study this problem from the perspective of a profit-maximizing broker within an online learning framework, where the agents' valuations are generated by a smooth adversary. We devise a learning algorithm that guarantees a $\tilde{O}(\sqrt{T})$ regret bound, which is tight in the time horizon $T$ up to poly-logarithmic factors. This matches the minimax rate for the stochastic i.i.d. case, and is also well separated from the adversarial setting, where sublinear-regret is unattainable. By extending the strong regret guarantees from the i.i.d. case to the smooth adversary, we significantly broaden the scope of settings where such fast rate is achievable, while closing an important gap in the regret landscape of this fundamental economic problem. To overcome the challenges posed by this adversary, we leverage a continuity property of smooth instances and combines this with a hierarchical net-construction of the broker's action space, which is analyzed via algorithmic chaining. We showcase the applicability of these techniques by deriving a similarly tight $\tilde{O}(\sqrt{T})$ regret bound for a related mechanism design model: the joint ads problem.


翻译:双边贸易模型描述了中介在两个策略性主体——卖方与买方——之间进行贸易撮合的任务。我们从在线学习框架下追求利润最大化的经纪人视角研究该问题,其中主体估值由平滑对手生成。我们设计了一种学习算法,保证达到 $\tilde{O}(\sqrt{T})$ 的遗憾界,这在时间范围 $T$ 上达到紧致(仅相差多对数因子)。该结果匹配随机独立同分布情形的极小化最优率,并与对抗性设置(其中次线性遗憾不可实现)显著区分。通过将强遗憾保证从独立同分布情形扩展至平滑对手,我们显著拓宽了可实现该快速率的场景范围,同时填补了这一基本经济问题遗憾格局中的重要空白。为应对该对手带来的挑战,我们利用平滑实例的连续性性质,并将其与经纪人行动空间的分层网络构造相结合,通过算法链式分析进行论证。我们通过推导相关机制设计模型(联合广告问题)中同样紧致的 $\tilde{O}(\sqrt{T})$ 遗憾界,展示了这些技术的适用性。

0
下载
关闭预览

相关内容

BES:让语言模型通过双向进化搜索自我改进
专知会员服务
8+阅读 · 5月30日
《战争谈判模型中的同步战役和顺序战役》
专知会员服务
20+阅读 · 2025年2月11日
【干货书】高频交易算法,360页pdf
专知会员服务
106+阅读 · 2023年7月19日
基于python的开源量化交易,量化投资架构
运维帮
15+阅读 · 2018年7月5日
基于强化学习的量化交易框架
机器学习研究会
30+阅读 · 2018年2月22日
推荐算法:Match与Rank模型的交织配合
从0到1
15+阅读 · 2017年12月18日
边缘计算:万物互联时代新型计算模型
计算机研究与发展
15+阅读 · 2017年5月19日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 6月1日
Arxiv
0+阅读 · 5月31日
Arxiv
0+阅读 · 5月15日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
6+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
4+阅读 · 6月17日
相关VIP内容
BES:让语言模型通过双向进化搜索自我改进
专知会员服务
8+阅读 · 5月30日
《战争谈判模型中的同步战役和顺序战役》
专知会员服务
20+阅读 · 2025年2月11日
【干货书】高频交易算法,360页pdf
专知会员服务
106+阅读 · 2023年7月19日
相关资讯
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员