Adversarial multiplayer games are an important object of study in multiagent learning. In particular, polymatrix zero-sum games are a multiplayer setting where Nash equilibria are known to be efficiently computable. Towards understanding the limits of tractability in polymatrix games, we study the computation of Nash equilibria in such games where each pair of players plays either a zero-sum or a coordination game. We are particularly interested in the setting where players can be grouped into a small number of teams of identical interest. While the three-team version of the problem is known to be PPAD-complete, the complexity for two teams has remained open. Our main contribution is to prove that the two-team version remains hard, namely it is CLS-hard. Furthermore, we show that this lower bound is tight (i.e., CLS-membership) for the setting where one of the teams consists of multiple independent adversaries. By leveraging this result we also obtain a simple algorithm that finds an $\varepsilon$-Nash equilibrium and only has a $1/\varepsilon^2$ dependence in $\varepsilon$ in its running time. On the way to obtaining our main result, we prove hardness of finding any stationary point in the simplest type of non-convex-concave min-max constrained optimization problem, namely for a class of bilinear polynomial objective functions.


翻译:对抗性多人博弈是多智能体学习中的重要研究对象。特别地,多矩阵零和博弈是一种已知可有效计算纳什均衡的多人博弈框架。为探索多矩阵博弈的可处理性边界,我们研究此类博弈中每对玩家进行零和博弈或协调博弈时纳什均衡的计算问题。我们尤其关注玩家可划分为少量同质利益团队的场景。尽管该问题的三团队版本已知为PPAD完全问题,但两团队情形的复杂度仍悬而未决。我们的主要贡献在于证明两团队版本仍然困难,即属于CLS困难问题。进一步研究表明,当其中一个团队由多个独立对抗者构成时,该下界是紧的(即具有CLS成员性)。基于此结果,我们还获得一种简单算法,可找到$\varepsilon$-纳什均衡,其运行时间对$\varepsilon$的依赖仅为$1/\varepsilon^2$。在得出主要结论的过程中,我们证明了最简非凸-非凹极小极大约束优化问题中寻找驻点的困难性,即针对一类双线性多项式目标函数。

0
下载
关闭预览

相关内容

论学习、公平性与复杂度
专知会员服务
11+阅读 · 2月28日
智能博弈对抗算法及其在情报领域中的应用*
专知会员服务
39+阅读 · 2024年12月1日
基于多智能体强化学习的博弈综述
专知会员服务
51+阅读 · 2024年11月23日
多智能体博弈学习研究进展
专知会员服务
91+阅读 · 2024年5月5日
博弈论应用《互补战场上的多场战斗对抗》
专知会员服务
27+阅读 · 2024年1月30日
《在互补战场上进行多场战斗》
专知会员服务
19+阅读 · 2024年1月20日
面向多智能体博弈对抗的对手建模框架
专知会员服务
165+阅读 · 2022年9月28日
专知会员服务
41+阅读 · 2021年2月12日
面向多智能体博弈对抗的对手建模框架
专知
18+阅读 · 2022年9月28日
DeepMind:用PopArt进行多任务深度强化学习
论智
30+阅读 · 2018年9月14日
不对称多代理博弈中的博弈理论解读
AI前线
14+阅读 · 2018年3月8日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
1+阅读 · 今天15:00
21世纪的无人机战争
专知会员服务
2+阅读 · 今天14:05
《量子技术的军事任务技术适配与利用》
专知会员服务
2+阅读 · 今天13:51
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关VIP内容
论学习、公平性与复杂度
专知会员服务
11+阅读 · 2月28日
智能博弈对抗算法及其在情报领域中的应用*
专知会员服务
39+阅读 · 2024年12月1日
基于多智能体强化学习的博弈综述
专知会员服务
51+阅读 · 2024年11月23日
多智能体博弈学习研究进展
专知会员服务
91+阅读 · 2024年5月5日
博弈论应用《互补战场上的多场战斗对抗》
专知会员服务
27+阅读 · 2024年1月30日
《在互补战场上进行多场战斗》
专知会员服务
19+阅读 · 2024年1月20日
面向多智能体博弈对抗的对手建模框架
专知会员服务
165+阅读 · 2022年9月28日
专知会员服务
41+阅读 · 2021年2月12日
相关基金
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员