What Do Agents Think One Another Want? Level-2 Inverse Games for Inferring Agents' Estimates of Others' Objectives - 专知论文

会员服务 ·

0

推断 · 博弈 · 智能体 · 有限信息 · 现实场景 ·

What Do Agents Think One Another Want? Level-2 Inverse Games for Inferring Agents' Estimates of Others' Objectives

翻译：智能体如何推测彼此目标？基于二级逆向博弈的智能体间目标估计推断

Hamzah I. Khan,Jingqi Li,David Fridovich-Keil

from arxiv, 6 pages + appendix with supplements

Effectively interpreting strategic interactions among multiple agents requires us to infer each agent's objective from limited information. Existing inverse game-theoretic approaches frame this challenge in terms of a "level-1" inference problem, in which we take the perspective of a third-party observer and assume that individual agents share complete knowledge of one another's objectives. However, this assumption breaks down in decentralized, real-world scenarios like urban driving and bargaining, in which agents may act based on conflicting views of one another's objectives. We demonstrate the necessity of inferring agents' different estimates of each other's objectives through empirical examples, and by theoretically characterizing the prediction error of level-1 inference on fictitious gameplay data from linear-quadratic games. To address this fundamental issue, we propose a framework for level-2 inference to address the question: "What does each agent believe about other agents' objectives?" We prove that the level-2 inference problem is non-convex even in benign settings like linear-quadratic games, and we develop an efficient gradient-based approach for identifying local solutions. Experiments on a synthetic urban driving example show that our approach uncovers nuanced misalignments that level-1 methods miss.

翻译：有效解读多智能体间的策略互动，需要我们从有限信息中推断每个智能体的目标。现有逆向博弈论方法将此挑战框定为"一级"推断问题：我们以第三方观察者视角出发，并假设个体智能体完全知晓彼此目标。然而，这一假设在去中心化的现实场景（如城市驾驶与议价博弈）中并不成立——智能体可能基于对彼此目标相互冲突的认知而采取行动。我们通过实证案例，以及在线性二次博弈虚构对局数据上理论刻画一级推断预测误差的方式，论证了推断智能体对彼此目标差异化估计的必要性。为应对这一根本问题，我们提出二级推断框架以解决核心问题："每个智能体对其他智能体目标持有何种信念？"我们证明即使在良性设置（如线性二次博弈）中，二级推断问题仍具有非凸性，并开发了一种高效的基于梯度的局部解求解方法。在合成城市驾驶场景中的实验表明，我们的方法能揭示一级方法所忽略的微妙目标错位。

0

相关内容

【CMU博士论文】面向目标的自主智能体推理

【CMU博士论文】面向目标的自主智能体推理

专知会员服务

27+阅读 · 2025年9月11日

智能博弈对抗算法及其在情报领域中的应用*

智能博弈对抗算法及其在情报领域中的应用*

专知会员服务

39+阅读 · 2024年12月1日

基于多智能体强化学习的博弈综述

基于多智能体强化学习的博弈综述

专知会员服务

51+阅读 · 2024年11月23日

【NUS博士论文】面向交互的多智能体行为预测，156页pdf

【NUS博士论文】面向交互的多智能体行为预测，156页pdf

专知会员服务

32+阅读 · 2024年11月17日

智能博弈决策大模型智能体技术综述

智能博弈决策大模型智能体技术综述

专知会员服务

116+阅读 · 2024年6月29日

多智能体博弈学习研究进展

多智能体博弈学习研究进展

专知会员服务

91+阅读 · 2024年5月5日

陆战对抗中的智能体博弈策略生成方法

陆战对抗中的智能体博弈策略生成方法

专知会员服务

104+阅读 · 2023年5月7日

面向智能博弈的决策Transformer方法综述

面向智能博弈的决策Transformer方法综述

专知会员服务

201+阅读 · 2023年4月14日

多智能体协同决策方法研究

多智能体协同决策方法研究

专知会员服务

134+阅读 · 2022年12月15日

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知会员服务

165+阅读 · 2022年9月28日

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知

18+阅读 · 2022年9月28日

推荐！【美海军·系统工程顶点报告】《人工智能使能的实时兵棋推演系统在海军战术行动中的应用》美国海军2022最新128页

推荐！【美海军·系统工程顶点报告】《人工智能使能的实时兵棋推演系统在海军战术行动中的应用》美国海军2022最新128页

专知

86+阅读 · 2022年9月24日

「智能博弈对抗方法」最新2022综述-博弈论与强化学习综合视角对比分析

「智能博弈对抗方法」最新2022综述-博弈论与强化学习综合视角对比分析

专知

23+阅读 · 2022年8月28日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

有关军事人机混合智能的再再思考

有关军事人机混合智能的再再思考

人工智能学家

22+阅读 · 2019年6月23日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

深度学习时代的目标检测算法

深度学习时代的目标检测算法

炼数成金订阅号

40+阅读 · 2018年3月19日

不对称多代理博弈中的博弈理论解读

不对称多代理博弈中的博弈理论解读

AI前线

14+阅读 · 2018年3月8日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

基于演化博弈的多智能体环形编队的理论与实验研究

国家自然科学基金

23+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

基于动态增益非线性干扰观测器的多智能体系统协调跟踪和干扰抑制

国家自然科学基金

1+阅读 · 2015年12月31日

事件触发机制下随机多智能体系统的有限时间一致性研究

国家自然科学基金

2+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks

Arxiv

0+阅读 · 3月9日

Strategic Interactions in Multi-Level Stackelberg Games with Non-Follower Agents and Heterogeneous Leaders

Arxiv

0+阅读 · 3月4日

AgentConductor: Topology Evolution for Multi-Agent Competition-Level Code Generation

Arxiv

0+阅读 · 2月19日

Multi-agent cooperation through in-context co-player inference

Arxiv

0+阅读 · 2月18日

A Survey on Hypergame Theory: Modeling Misaligned Perceptions and Nested Beliefs for Multi-agent Systems

Arxiv

0+阅读 · 2月13日

MARSHAL: Incentivizing Multi-Agent Reasoning via Self-Play with Strategic LLMs

Arxiv

0+阅读 · 2月12日

What if Agents Could Imagine? Reinforcing Open-Vocabulary HOI Comprehension through Generation

Arxiv

0+阅读 · 2月12日

Games with Payments between Learning Agents

Arxiv

0+阅读 · 2月11日

From Prompt-Response to Goal-Directed Systems: The Evolution of Agentic AI Software Architecture

Arxiv

0+阅读 · 2月11日

A Behavioural and Representational Evaluation of Goal-Directedness in Language Model Agents

Arxiv

0+阅读 · 2月9日

VIP会员

文章信息

相关主题

最新内容

无人机自主控制与人工智能：系统性综述

无人机自主控制与人工智能：系统性综述

专知会员服务

10+阅读 · 今天7:25

巡飞弹与反无人机系统——现代战场的两大支柱

巡飞弹与反无人机系统——现代战场的两大支柱

专知会员服务

3+阅读 · 今天6:54

《打造“黄金舰队”》57页报告

《打造“黄金舰队”》57页报告

专知会员服务

3+阅读 · 今天6:52

《北约数字教官网络发展路径》128页报告

《北约数字教官网络发展路径》128页报告

专知会员服务

2+阅读 · 今天6:33

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

7+阅读 · 6月25日

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

6+阅读 · 6月25日

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

9+阅读 · 6月25日

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

7+阅读 · 6月25日

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

8+阅读 · 6月25日

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

8+阅读 · 6月25日

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

专知会员服务

10+阅读 · 6月25日

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

专知会员服务

9+阅读 · 6月25日

《国防领域敏感性分析白皮书》

《国防领域敏感性分析白皮书》

专知会员服务

9+阅读 · 6月25日

综述 | 从问答到任务完成：Agent系统与Harness设计

综述 | 从问答到任务完成：Agent系统与Harness设计

专知会员服务

10+阅读 · 6月24日

Agentic RL：框架、实践与长程智能体训练

Agentic RL：框架、实践与长程智能体训练

专知会员服务

10+阅读 · 6月24日

相关VIP内容

【CMU博士论文】面向目标的自主智能体推理

【CMU博士论文】面向目标的自主智能体推理

专知会员服务

27+阅读 · 2025年9月11日

智能博弈对抗算法及其在情报领域中的应用*

智能博弈对抗算法及其在情报领域中的应用*

专知会员服务

39+阅读 · 2024年12月1日

基于多智能体强化学习的博弈综述

基于多智能体强化学习的博弈综述

专知会员服务

51+阅读 · 2024年11月23日

【NUS博士论文】面向交互的多智能体行为预测，156页pdf

【NUS博士论文】面向交互的多智能体行为预测，156页pdf

专知会员服务

32+阅读 · 2024年11月17日

智能博弈决策大模型智能体技术综述

智能博弈决策大模型智能体技术综述

专知会员服务

116+阅读 · 2024年6月29日

多智能体博弈学习研究进展

多智能体博弈学习研究进展

专知会员服务

91+阅读 · 2024年5月5日

陆战对抗中的智能体博弈策略生成方法

陆战对抗中的智能体博弈策略生成方法

专知会员服务

104+阅读 · 2023年5月7日

面向智能博弈的决策Transformer方法综述

面向智能博弈的决策Transformer方法综述

专知会员服务

201+阅读 · 2023年4月14日

多智能体协同决策方法研究

多智能体协同决策方法研究

专知会员服务

134+阅读 · 2022年12月15日

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知会员服务

165+阅读 · 2022年9月28日

热门VIP内容

开通专知VIP会员享更多权益服务

巡飞弹与反无人机系统——现代战场的两大支柱

《北约数字教官网络发展路径》128页报告

无人机自主控制与人工智能：系统性综述

《打造“黄金舰队”》57页报告

相关资讯

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知

18+阅读 · 2022年9月28日

推荐！【美海军·系统工程顶点报告】《人工智能使能的实时兵棋推演系统在海军战术行动中的应用》美国海军2022最新128页

推荐！【美海军·系统工程顶点报告】《人工智能使能的实时兵棋推演系统在海军战术行动中的应用》美国海军2022最新128页

专知

86+阅读 · 2022年9月24日

「智能博弈对抗方法」最新2022综述-博弈论与强化学习综合视角对比分析

「智能博弈对抗方法」最新2022综述-博弈论与强化学习综合视角对比分析

专知

23+阅读 · 2022年8月28日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

有关军事人机混合智能的再再思考

有关军事人机混合智能的再再思考

人工智能学家

22+阅读 · 2019年6月23日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

深度学习时代的目标检测算法

深度学习时代的目标检测算法

炼数成金订阅号

40+阅读 · 2018年3月19日

不对称多代理博弈中的博弈理论解读

不对称多代理博弈中的博弈理论解读

AI前线

14+阅读 · 2018年3月8日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

相关论文

MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks

Arxiv

0+阅读 · 3月9日

Strategic Interactions in Multi-Level Stackelberg Games with Non-Follower Agents and Heterogeneous Leaders

Arxiv

0+阅读 · 3月4日

AgentConductor: Topology Evolution for Multi-Agent Competition-Level Code Generation

Arxiv

0+阅读 · 2月19日

Multi-agent cooperation through in-context co-player inference

Arxiv

0+阅读 · 2月18日

A Survey on Hypergame Theory: Modeling Misaligned Perceptions and Nested Beliefs for Multi-agent Systems

Arxiv

0+阅读 · 2月13日

MARSHAL: Incentivizing Multi-Agent Reasoning via Self-Play with Strategic LLMs

Arxiv

0+阅读 · 2月12日

What if Agents Could Imagine? Reinforcing Open-Vocabulary HOI Comprehension through Generation

Arxiv

0+阅读 · 2月12日

Games with Payments between Learning Agents

Arxiv

0+阅读 · 2月11日

From Prompt-Response to Goal-Directed Systems: The Evolution of Agentic AI Software Architecture

Arxiv

0+阅读 · 2月11日

A Behavioural and Representational Evaluation of Goal-Directedness in Language Model Agents

Arxiv

0+阅读 · 2月9日

相关基金

基于演化博弈的多智能体环形编队的理论与实验研究

国家自然科学基金

23+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

基于动态增益非线性干扰观测器的多智能体系统协调跟踪和干扰抑制

国家自然科学基金

1+阅读 · 2015年12月31日

事件触发机制下随机多智能体系统的有限时间一致性研究

国家自然科学基金

2+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

多智能体系统的可控性与群可控性研究

国家自然科学基金

10+阅读 · 2013年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员