We propose a policy iteration method to solve an inverse problem for a mean-field game (MFG) model, specifically to reconstruct the obstacle function in the game from the partial observation data of value functions, which represent the optimal costs for agents. The proposed approach decouples this complex inverse problem, which is an optimization problem constrained by a coupled nonlinear forward and backward PDE system in the MFG, into several iterations of solving linear PDEs and linear inverse problems. This method can also be viewed as a fixed-point iteration that simultaneously solves the MFG system and inversion. We prove its linear rate of convergence. In addition, numerical examples in 1D and 2D, along with performance comparisons to a direct least-squares method, demonstrate the superior efficiency and accuracy of the proposed method for solving inverse MFGs.


翻译:本文提出一种策略迭代方法,用于求解平均场博弈(MFG)模型的逆问题,具体而言,即根据价值函数(代表智能体的最优成本)的部分观测数据重构博弈中的障碍函数。该方法将这一复杂的逆问题——一个受MFG中耦合的非线性前向-后向偏微分方程系统约束的优化问题——解耦为若干次线性偏微分方程求解与线性逆问题求解的迭代过程。此方法亦可视为同时求解MFG系统与逆问题的定点迭代。我们证明了该方法的线性收敛速率。此外,通过一维与二维数值算例,以及与直接最小二乘法的性能对比,验证了所提方法在求解平均场博弈逆问题上具有更优的效率和精度。

0
下载
关闭预览

相关内容

博弈论应用《互补战场上的多场战斗对抗》
专知会员服务
26+阅读 · 2024年1月30日
逆强化学习算法、理论与应用研究综述
专知会员服务
63+阅读 · 2023年8月2日
面向智能博弈的决策Transformer方法综述
专知会员服务
199+阅读 · 2023年4月14日
【NeurIPS 2021】设置多智能体策略梯度的方差
专知会员服务
21+阅读 · 2021年10月24日
面向多智能体博弈对抗的对手建模框架
专知
18+阅读 · 2022年9月28日
换个角度看GAN:另一种损失函数
机器之心
16+阅读 · 2019年1月1日
从点到线:逻辑回归到条件随机场
夕小瑶的卖萌屋
15+阅读 · 2017年7月22日
精品公开课 | 随机梯度下降算法综述
七月在线实验室
13+阅读 · 2017年7月11日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员