Dynamic games are powerful tools to model multi-agent decision-making, yet computing Nash (generalized Nash) equilibria remains a central challenge in such settings. Complexity arises from tightly coupled optimality conditions, nested optimization structures, and poor numerical conditioning. Existing game-theoretic solvers address these challenges by directly solving the joint game, typically requiring explicit modeling of all agents' objective functions and constraints, while learning-based approaches often decouple interaction through prediction or policy approximation, sacrificing equilibrium consistency. This paper introduces a conceptually novel formulation for dynamic games by restructuring the equilibrium computation. Rather than solving a fully coupled game or decoupling agents through prediction or policy approximation, a data-driven structural reduction of the game is proposed that removes nested optimization layers and derivative coupling by embedding an offline-compiled best-response map as a feasibility constraint. Under standard regularity conditions, when the best-response operator is exact, any converged solution of the reduced problem corresponds to a local open-loop Nash (GNE) equilibrium of the original game; with a learned surrogate, the solution is approximately equilibrium-consistent up to the best-response approximation error. The proposed formulation is supported by mathematical proofs, accompanying a large-scale Monte Carlo study in a two-player open-loop dynamic game motivated by the autonomous racing problem. Comparisons are made against state-of-the-art joint game solvers, and results are reported on solution quality, computational cost, and constraint satisfaction.


翻译:动态博弈是建模多智能体决策的有力工具,然而计算纳什(广义纳什)均衡在此类场景中仍是一个核心挑战。复杂性源于紧密耦合的最优性条件、嵌套的优化结构以及不良的数值条件。现有的博弈论求解器通过直接求解联合博弈来应对这些挑战,通常需要显式建模所有智能体的目标函数和约束,而基于学习的方法则常通过预测或策略近似来解耦交互,牺牲了均衡一致性。本文通过重构均衡计算,为动态博弈引入了一种概念上新颖的表述。该方法既不求解完全耦合的博弈,也不通过预测或策略近似来解耦智能体,而是提出了一种数据驱动的博弈结构约简,通过将离线编译的最佳响应映射嵌入为可行性约束,从而移除了嵌套的优化层和导数耦合。在标准正则性条件下,当最佳响应算子精确时,约简问题的任何收敛解都对应于原博弈的一个局部开环纳什(广义纳什)均衡;当使用学习得到的替代模型时,其解在最佳响应近似误差范围内近似满足均衡一致性。所提出的表述得到了数学证明的支持,并辅以一项受自动驾驶赛车问题启发的双玩家开环动态博弈中的大规模蒙特卡洛研究。研究结果与最先进的联合博弈求解器进行了比较,并在求解质量、计算成本和约束满足度方面进行了报告。

0
下载
关闭预览

相关内容

智能博弈对抗算法及其在情报领域中的应用*
专知会员服务
39+阅读 · 2024年12月1日
多智能体博弈中的分布式学习: 原理与算法
专知会员服务
54+阅读 · 2024年6月13日
智能博弈决策策略求解新视角实证分析
专知会员服务
68+阅读 · 2023年12月30日
面向智能博弈的决策Transformer方法综述
专知会员服务
199+阅读 · 2023年4月14日
《资源分配博弈中的收敛率》
专知会员服务
41+阅读 · 2023年3月10日
【硬核书】博弈论,592页pdf
专知会员服务
164+阅读 · 2022年12月7日
专知会员服务
41+阅读 · 2021年2月12日
面向多智能体博弈对抗的对手建模框架
专知
18+阅读 · 2022年9月28日
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
【推荐】ResNet, AlexNet, VGG, Inception:各种卷积网络架构的理解
机器学习研究会
20+阅读 · 2017年12月17日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员