We study a two-player dynamic Stackelberg game between a leader and a follower whose intention is unknown to the leader. Classical formulations of the Stackelberg equilibrium (SE) assume that the follower's best response (BR) function is known to the leader. However, this is not always true in practice. We study a setting in which the leader receives updated beliefs about the follower BR before the end of the game, such that the update prompts the leader and subsequently the follower to re-optimize their strategies. We characterize the optimality guarantees of the SE solutions under this belief update for both open loop and feedback information structures. Interestingly, we prove that in general, assuming an incorrect follower's BR can lead to more optimal leader costs over the entire game than knowing the true follower's BR. We support these results with numerical examples in a linear quadratic (LQ) Stackelberg game, and use Monte Carlo simulations to show that the instances of incorrect BR achieving lower leader costs are non-trivial in collision avoidance LQ Stackelberg games.


翻译:我们研究了一个领导者与跟随者之间的双人动态Stackelberg博弈,其中跟随者的意图对领导者未知。经典的Stackelberg均衡(SE)公式假设领导知晓跟随者的最优响应(BR)函数,但这在实际中并不总是成立。我们研究了一种场景:领导者在博弈结束前接收到关于跟随者BR的更新信念,该更新促使领导者及随后的跟随者重新优化其策略。我们刻画了在这种信念更新下,针对开环和反馈信息结构的SE解的最优性保证。有趣的是,我们证明在一般情况下,假设错误的跟随者BR可能在整个博弈过程中为领导者带来比知晓真实跟随者BR更优的成本。我们通过线性二次(LQ)Stackelberg博弈中的数值算例支持这些结论,并利用蒙特卡洛模拟表明:在碰撞避免LQ Stackelberg博弈中,错误BR实现更低领导者成本的情况具有非平凡性。

0
下载
关闭预览

相关内容

专知会员服务
29+阅读 · 2020年10月2日
图机器学习 2.2-2.4 Properties of Networks, Random Graph
图与推荐
10+阅读 · 2020年3月28日
TensorFlow 2.0新特性之Ragged Tensor
深度学习每日摘要
18+阅读 · 2019年4月5日
误差反向传播——CNN
统计学习与视觉计算组
30+阅读 · 2018年7月12日
MNIST入门:贝叶斯方法
Python程序员
23+阅读 · 2017年7月3日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2025年12月30日
Arxiv
0+阅读 · 2025年12月28日
VIP会员
相关资讯
图机器学习 2.2-2.4 Properties of Networks, Random Graph
图与推荐
10+阅读 · 2020年3月28日
TensorFlow 2.0新特性之Ragged Tensor
深度学习每日摘要
18+阅读 · 2019年4月5日
误差反向传播——CNN
统计学习与视觉计算组
30+阅读 · 2018年7月12日
MNIST入门:贝叶斯方法
Python程序员
23+阅读 · 2017年7月3日
相关基金
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员