$2\times2$博弈中的逆学习：从合成交互到交通仿真 (Inverse Learning in $2\times2$ Games: From Synthetic Interactions to Traffic Simulation) - 专知论文

会员服务 ·

0

博弈 · 交互 · 合成 · 交通仿真 · 均衡 ·

Inverse Learning in $2\times2$ Games: From Synthetic Interactions to Traffic Simulation

翻译：$2\times2$博弈中的逆学习：从合成交互到交通仿真

Daniela Aguirre Salazar,Firas Moatemri,Tatiana Tatarenko

Understanding how agents coordinate or compete from limited behavioral data is central to modeling strategic interactions in traffic, robotics, and other multi-agent systems. In this work, we investigate the following complementary formulations of inverse game-theoretic learning: (i) a Closed-form Correlated Equilibrium Maximum-Likelihood estimator (CE-ML) specialized for $2\times2$ games; and (ii) a Logit Best Response Maximum-Likelihood estimator (LBR-ML) that captures long-run adaptation dynamics via stochastic response processes. Together, these approaches span the spectrum between static equilibrium consistency and dynamic behavioral realism. We evaluate them on synthetic "chicken-dare" games and traffic-interaction scenarios simulated in SUMO, comparing parameter recovery and distributional fit. Results reveal clear trade-offs between interpretability, computational tractability, and behavioral expressiveness across models.

翻译：如何从有限的行为数据中理解智能体之间的协作或竞争，是交通、机器人学及其他多智能体系统中战略交互建模的核心问题。本研究探讨以下两种互补的逆博弈学习框架：（i）专为$2\times2$博弈设计的闭式相关均衡最大似然估计器（CE-ML）；（ii）通过随机响应过程捕捉长期适应动态的Logit最优响应最大似然估计器（LBR-ML）。这两种方法共同覆盖了静态均衡一致性与动态行为真实性之间的研究谱系。我们在合成“胆小鬼博弈”及SUMO仿真的交通交互场景中评估了这些方法，比较了参数还原能力与分布拟合效果。结果表明，不同模型在可解释性、计算易处理性和行为表达能力之间存在明确的权衡关系。

0

相关内容

多智能体博弈中的分布式学习：原理与算法

多智能体博弈中的分布式学习：原理与算法

专知会员服务

54+阅读 · 2024年6月13日

多智能体博弈学习研究进展

多智能体博弈学习研究进展

专知会员服务

89+阅读 · 2024年5月5日

逆强化学习算法、理论与应用研究综述

逆强化学习算法、理论与应用研究综述

专知会员服务

63+阅读 · 2023年8月2日

【CMU博士论文】不完全信息博弈中的博弈决策学习动力学、均衡计算和复杂性，358页pdf

【CMU博士论文】不完全信息博弈中的博弈决策学习动力学、均衡计算和复杂性，358页pdf

专知会员服务

64+阅读 · 2023年6月16日

面向智能博弈的决策Transformer方法综述

面向智能博弈的决策Transformer方法综述

专知会员服务

199+阅读 · 2023年4月14日

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

专知会员服务

47+阅读 · 2022年9月29日

「人机对抗中的博弈学习方法」最新2022综述

「人机对抗中的博弈学习方法」最新2022综述

专知会员服务

117+阅读 · 2022年9月11日

【AI+军事】附论文《基于人工智能的“元素周期表”系统作为机器学习专家和军事操作员之间的有效沟通手段》

【AI+军事】附论文《基于人工智能的“元素周期表”系统作为机器学习专家和军事操作员之间的有效沟通手段》

专知会员服务

25+阅读 · 2022年5月5日

《人机对抗中的博弈学习方法》21页PDF，中科院自动化所最新发表

《人机对抗中的博弈学习方法》21页PDF，中科院自动化所最新发表

专知会员服务

117+阅读 · 2022年3月29日

【论文推荐】逆问题，深度学习，对称性破缺，Inverse Problems, Deep Learning, and Symmetry Breaking

【论文推荐】逆问题，深度学习，对称性破缺，Inverse Problems, Deep Learning, and Symmetry Breaking

专知会员服务

26+阅读 · 2020年3月27日

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知

18+阅读 · 2022年9月28日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知

24+阅读 · 2022年9月25日

「智能博弈对抗方法」最新2022综述-博弈论与强化学习综合视角对比分析

「智能博弈对抗方法」最新2022综述-博弈论与强化学习综合视角对比分析

专知

23+阅读 · 2022年8月28日

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

专知

72+阅读 · 2020年2月29日

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

70+阅读 · 2019年12月4日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

【资源推荐】元学习（meta-learning）相关文献资源大列表

【资源推荐】元学习（meta-learning）相关文献资源大列表

专知

25+阅读 · 2019年3月6日

基于逆强化学习的示教学习方法综述

基于逆强化学习的示教学习方法综述

计算机研究与发展

16+阅读 · 2019年2月25日

逆强化学习-学习人先验的动机

逆强化学习-学习人先验的动机

CreateAMind

16+阅读 · 2019年1月18日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

天元数学交流项目“光声与超声联合成像中的相关反演理论及其算法的研究”

国家自然科学基金

2+阅读 · 2017年12月31日

基于演化博弈的多智能体环形编队的理论与实验研究

国家自然科学基金

23+阅读 · 2015年12月31日

多维斜反射倒向随机微分方程及最优转换和停止问题

国家自然科学基金

0+阅读 · 2015年12月31日

复杂网络上数据传输博弈的合作性优化与控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

动态逆混合变分不等式理论及算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

混入自动驾驶汽车的高速公路交通流微观建模与仿真方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

面向人与Agent混合的多团队协作仿真训练方法研究

国家自然科学基金

19+阅读 · 2012年12月31日

Learning to Recommend in Unknown Games

Arxiv

0+阅读 · 2月19日

Learning in Structured Stackelberg Games

Arxiv

0+阅读 · 2月12日

A Policy Iteration Method for Inverse Mean Field Games

Arxiv

0+阅读 · 2月11日

Games with Payments between Learning Agents

Arxiv

0+阅读 · 2月11日

Constraint Learning in Multi-Agent Dynamic Games from Demonstrations of Local Nash Interactions

Arxiv

0+阅读 · 2月9日

Game-Theoretic and Algorithmic Analyses of Multi-Agent Routing under Crossing Costs

Arxiv

0+阅读 · 2月3日

The Learning Approach to Games

Arxiv

0+阅读 · 2月3日

Game-Theoretic Autonomous Driving: A Graphs of Convex Sets Approach

Arxiv

0+阅读 · 1月27日

DIML: Differentiable Inverse Mechanism Learning from Behaviors of Multi-Agent Learning Trajectories

Arxiv

0+阅读 · 1月25日

Decoding Rewards in Competitive Games: Inverse Game Theory with Entropy Regularization

Arxiv

0+阅读 · 1月19日

VIP会员

文章信息

相关主题

相关VIP内容

多智能体博弈中的分布式学习：原理与算法

多智能体博弈中的分布式学习：原理与算法

专知会员服务

54+阅读 · 2024年6月13日

多智能体博弈学习研究进展

多智能体博弈学习研究进展

专知会员服务

89+阅读 · 2024年5月5日

逆强化学习算法、理论与应用研究综述

逆强化学习算法、理论与应用研究综述

专知会员服务

63+阅读 · 2023年8月2日

【CMU博士论文】不完全信息博弈中的博弈决策学习动力学、均衡计算和复杂性，358页pdf

【CMU博士论文】不完全信息博弈中的博弈决策学习动力学、均衡计算和复杂性，358页pdf

专知会员服务

64+阅读 · 2023年6月16日

面向智能博弈的决策Transformer方法综述

面向智能博弈的决策Transformer方法综述

专知会员服务

199+阅读 · 2023年4月14日

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

长综述《用于随机控制和博弈的机器学习方法最新发展》2022最新76页长论文，加州大学、上海纽约大学等

专知会员服务

47+阅读 · 2022年9月29日

「人机对抗中的博弈学习方法」最新2022综述

「人机对抗中的博弈学习方法」最新2022综述

专知会员服务

117+阅读 · 2022年9月11日

【AI+军事】附论文《基于人工智能的“元素周期表”系统作为机器学习专家和军事操作员之间的有效沟通手段》

【AI+军事】附论文《基于人工智能的“元素周期表”系统作为机器学习专家和军事操作员之间的有效沟通手段》

专知会员服务

25+阅读 · 2022年5月5日

《人机对抗中的博弈学习方法》21页PDF，中科院自动化所最新发表

《人机对抗中的博弈学习方法》21页PDF，中科院自动化所最新发表

专知会员服务

117+阅读 · 2022年3月29日

【论文推荐】逆问题，深度学习，对称性破缺，Inverse Problems, Deep Learning, and Symmetry Breaking

【论文推荐】逆问题，深度学习，对称性破缺，Inverse Problems, Deep Learning, and Symmetry Breaking

专知会员服务

26+阅读 · 2020年3月27日

热门VIP内容

开通专知VIP会员享更多权益服务

《可信人工智能赋能系统的支柱》

《从经典神经网络到不确定性下的拓扑神经网络：军事应用》2026最新40页报告

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

《人工智能：对战略与力量的影响》slides

相关资讯

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知

18+阅读 · 2022年9月28日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知

24+阅读 · 2022年9月25日

「智能博弈对抗方法」最新2022综述-博弈论与强化学习综合视角对比分析

「智能博弈对抗方法」最新2022综述-博弈论与强化学习综合视角对比分析

专知

23+阅读 · 2022年8月28日

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

专知

72+阅读 · 2020年2月29日

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

70+阅读 · 2019年12月4日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

【资源推荐】元学习（meta-learning）相关文献资源大列表

【资源推荐】元学习（meta-learning）相关文献资源大列表

专知

25+阅读 · 2019年3月6日

基于逆强化学习的示教学习方法综述

基于逆强化学习的示教学习方法综述

计算机研究与发展

16+阅读 · 2019年2月25日

逆强化学习-学习人先验的动机

逆强化学习-学习人先验的动机

CreateAMind

16+阅读 · 2019年1月18日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

相关论文

Learning to Recommend in Unknown Games

Arxiv

0+阅读 · 2月19日

Learning in Structured Stackelberg Games

Arxiv

0+阅读 · 2月12日

A Policy Iteration Method for Inverse Mean Field Games

Arxiv

0+阅读 · 2月11日

Games with Payments between Learning Agents

Arxiv

0+阅读 · 2月11日

Constraint Learning in Multi-Agent Dynamic Games from Demonstrations of Local Nash Interactions

Arxiv

0+阅读 · 2月9日

Game-Theoretic and Algorithmic Analyses of Multi-Agent Routing under Crossing Costs

Arxiv

0+阅读 · 2月3日

The Learning Approach to Games

Arxiv

0+阅读 · 2月3日

Game-Theoretic Autonomous Driving: A Graphs of Convex Sets Approach

Arxiv

0+阅读 · 1月27日

DIML: Differentiable Inverse Mechanism Learning from Behaviors of Multi-Agent Learning Trajectories

Arxiv

0+阅读 · 1月25日

Decoding Rewards in Competitive Games: Inverse Game Theory with Entropy Regularization

Arxiv

0+阅读 · 1月19日

相关基金

天元数学交流项目“光声与超声联合成像中的相关反演理论及其算法的研究”

国家自然科学基金

2+阅读 · 2017年12月31日

基于演化博弈的多智能体环形编队的理论与实验研究

国家自然科学基金

23+阅读 · 2015年12月31日

多维斜反射倒向随机微分方程及最优转换和停止问题

国家自然科学基金

0+阅读 · 2015年12月31日

复杂网络上数据传输博弈的合作性优化与控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

动态逆混合变分不等式理论及算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

混入自动驾驶汽车的高速公路交通流微观建模与仿真方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

面向人与Agent混合的多团队协作仿真训练方法研究

国家自然科学基金

19+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员