Subgame solving is a technique for scaling algorithms to large games by locally refining a precomputed blueprint strategy during gameplay. While straightforward in perfect-information games where search starts from the current state, subgame solving in imperfect-information games must account for hidden states and uncertainty about the opponent's past strategy. Gadget games were developed to ensure that the improved subgame strategy is robust against any possible opponent's strategy in a zero-sum game. Gadget games typically contain infinitely many Nash equilibria. We demonstrate that while these equilibria are equivalent in the gadget game, they yield vastly different performance in the full game, even when facing a rational opponent. We propose gadget game sequential equilibria as the preferred solution concept. We introduce modifications to the sequence-form linear program and counterfactual regret minimization that converge to these refined solutions with only mild additional computational cost. Additionally, we provide several new insights into the surprising superiority of the resolving gadget game over the max-margin gadget game. Our experiments compare different Nash equilibria of gadget games in several standard benchmark games, showing that our refined equilibria consistently outperform unrefined Nash equilibria, and can reduce the exploitability of the overall strategy by more than 50%


翻译:子博弈求解是一种通过游戏过程中局部优化预计算的蓝图策略,将算法扩展至大规模博弈的技术。在完全信息博弈中,搜索从当前状态开始,该技术较为直接;而在非完全信息博弈中,子博弈求解必须考虑隐藏状态以及对手历史策略的不确定性。为在零和博弈中确保改进后的子博弈策略能够稳健应对对手任何可能的策略,研究者开发了辅助博弈。辅助博弈通常包含无限多个纳什均衡。我们证明,尽管这些均衡在辅助博弈中是等价的,但在完整博弈中,即使面对理性对手,它们也会产生截然不同的性能表现。我们提出将辅助博弈序贯均衡作为首选解概念。我们对序列形式线性规划及反事实遗憾最小化方法进行了改进,使其能以仅轻微增加的计算成本收敛至这些精炼解。此外,我们针对解析辅助博弈相对于最大边际辅助博弈表现出的显著优越性提供了若干新见解。实验在多个标准基准博弈中比较了辅助博弈的不同纳什均衡,结果表明我们的精炼均衡始终优于未精炼的纳什均衡,并能将整体策略的可利用性降低超过50%。

0
下载
关闭预览

相关内容

智能博弈决策策略求解新视角实证分析
专知会员服务
72+阅读 · 2024年1月9日
计算机博弈中序贯不完美信息博弈求解研究进展
专知会员服务
56+阅读 · 2023年11月28日
面向智能博弈的决策Transformer方法综述
专知会员服务
200+阅读 · 2023年4月14日
【经典书】算法博弈论,775页pdf,Algorithmic Game Theory
专知会员服务
156+阅读 · 2021年5月9日
面向多智能体博弈对抗的对手建模框架
专知
18+阅读 · 2022年9月28日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2012年12月31日
Arxiv
0+阅读 · 2月12日
VIP会员
最新内容
2026“人工智能+”行业发展蓝皮书(附下载)
专知会员服务
7+阅读 · 今天12:11
《强化学习数学基础》
专知会员服务
4+阅读 · 今天12:07
“Maven计划”的发展演变之“Maven智能系统”应用
《无人机革命:来自俄乌战场的启示》(报告)
专知会员服务
9+阅读 · 今天6:48
《实现联合作战能力所需的技术》58页报告
专知会员服务
5+阅读 · 今天6:30
以色列运用人工智能优化空袭警报系统
专知会员服务
5+阅读 · 今天6:20
以色列在多条战线部署AI智能体
专知会员服务
7+阅读 · 今天6:12
相关资讯
面向多智能体博弈对抗的对手建模框架
专知
18+阅读 · 2022年9月28日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员