Effectively interpreting strategic interactions among multiple agents requires us to infer each agent's objective from limited information. Existing inverse game-theoretic approaches frame this challenge in terms of a "level-1" inference problem, in which we take the perspective of a third-party observer and assume that individual agents share complete knowledge of one another's objectives. However, this assumption breaks down in decentralized, real-world scenarios like urban driving and bargaining, in which agents may act based on conflicting views of one another's objectives. We demonstrate the necessity of inferring agents' different estimates of each other's objectives through empirical examples, and by theoretically characterizing the prediction error of level-1 inference on fictitious gameplay data from linear-quadratic games. To address this fundamental issue, we propose a framework for level-2 inference to address the question: "What does each agent believe about other agents' objectives?" We prove that the level-2 inference problem is non-convex even in benign settings like linear-quadratic games, and we develop an efficient gradient-based approach for identifying local solutions. Experiments on a synthetic urban driving example show that our approach uncovers nuanced misalignments that level-1 methods miss.


翻译:有效解读多智能体间的策略互动,需要我们从有限信息中推断每个智能体的目标。现有逆向博弈论方法将此挑战框定为"一级"推断问题:我们以第三方观察者视角出发,并假设个体智能体完全知晓彼此目标。然而,这一假设在去中心化的现实场景(如城市驾驶与议价博弈)中并不成立——智能体可能基于对彼此目标相互冲突的认知而采取行动。我们通过实证案例,以及在线性二次博弈虚构对局数据上理论刻画一级推断预测误差的方式,论证了推断智能体对彼此目标差异化估计的必要性。为应对这一根本问题,我们提出二级推断框架以解决核心问题:"每个智能体对其他智能体目标持有何种信念?"我们证明即使在良性设置(如线性二次博弈)中,二级推断问题仍具有非凸性,并开发了一种高效的基于梯度的局部解求解方法。在合成城市驾驶场景中的实验表明,我们的方法能揭示一级方法所忽略的微妙目标错位。

0
下载
关闭预览

相关内容

【CMU博士论文】面向目标的自主智能体推理
专知会员服务
27+阅读 · 2025年9月11日
智能博弈对抗算法及其在情报领域中的应用*
专知会员服务
39+阅读 · 2024年12月1日
基于多智能体强化学习的博弈综述
专知会员服务
51+阅读 · 2024年11月23日
【NUS博士论文】面向交互的多智能体行为预测,156页pdf
专知会员服务
32+阅读 · 2024年11月17日
智能博弈决策大模型智能体技术综述
专知会员服务
116+阅读 · 2024年6月29日
多智能体博弈学习研究进展
专知会员服务
91+阅读 · 2024年5月5日
陆战对抗中的智能体博弈策略生成方法
专知会员服务
104+阅读 · 2023年5月7日
面向智能博弈的决策Transformer方法综述
专知会员服务
201+阅读 · 2023年4月14日
多智能体协同决策方法研究
专知会员服务
134+阅读 · 2022年12月15日
面向多智能体博弈对抗的对手建模框架
专知会员服务
165+阅读 · 2022年9月28日
面向多智能体博弈对抗的对手建模框架
专知
18+阅读 · 2022年9月28日
浅谈群体智能——新一代AI的重要方向
中国科学院自动化研究所
44+阅读 · 2019年10月16日
有关军事人机混合智能的再再思考
人工智能学家
22+阅读 · 2019年6月23日
深度学习时代的目标检测算法
炼数成金订阅号
40+阅读 · 2018年3月19日
不对称多代理博弈中的博弈理论解读
AI前线
14+阅读 · 2018年3月8日
群体智能:新一代人工智能的重要方向
走向智能论坛
12+阅读 · 2017年8月16日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
VIP会员
最新内容
无人机自主控制与人工智能:系统性综述
专知会员服务
10+阅读 · 今天7:25
巡飞弹与反无人机系统——现代战场的两大支柱
专知会员服务
3+阅读 · 今天6:54
《打造“黄金舰队”》57页报告
专知会员服务
3+阅读 · 今天6:52
《北约数字教官网络发展路径》128页报告
专知会员服务
2+阅读 · 今天6:33
ECCV 2026 | MIMFlow:MIM与归一化流统一图像生成
专知会员服务
7+阅读 · 6月25日
网状网络及其在军事领域的运用
专知会员服务
7+阅读 · 6月25日
无美国参与的欧洲战争方式(万字长文)
专知会员服务
8+阅读 · 6月25日
《国防领域敏感性分析白皮书》
专知会员服务
9+阅读 · 6月25日
综述 | 从问答到任务完成:Agent系统与Harness设计
专知会员服务
10+阅读 · 6月24日
Agentic RL:框架、实践与长程智能体训练
专知会员服务
10+阅读 · 6月24日
相关VIP内容
【CMU博士论文】面向目标的自主智能体推理
专知会员服务
27+阅读 · 2025年9月11日
智能博弈对抗算法及其在情报领域中的应用*
专知会员服务
39+阅读 · 2024年12月1日
基于多智能体强化学习的博弈综述
专知会员服务
51+阅读 · 2024年11月23日
【NUS博士论文】面向交互的多智能体行为预测,156页pdf
专知会员服务
32+阅读 · 2024年11月17日
智能博弈决策大模型智能体技术综述
专知会员服务
116+阅读 · 2024年6月29日
多智能体博弈学习研究进展
专知会员服务
91+阅读 · 2024年5月5日
陆战对抗中的智能体博弈策略生成方法
专知会员服务
104+阅读 · 2023年5月7日
面向智能博弈的决策Transformer方法综述
专知会员服务
201+阅读 · 2023年4月14日
多智能体协同决策方法研究
专知会员服务
134+阅读 · 2022年12月15日
面向多智能体博弈对抗的对手建模框架
专知会员服务
165+阅读 · 2022年9月28日
相关基金
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员