基于拟策略逼近的高效混合层次博弈求解方法 (Efficiently Solving Mixed-Hierarchy Games with Quasi-Policy Approximations) - 专知论文

会员服务 ·

0

博弈 · 混合 · 结构 · 机器人 · 交互 ·

Efficiently Solving Mixed-Hierarchy Games with Quasi-Policy Approximations

翻译：基于拟策略逼近的高效混合层次博弈求解方法

Hamzah Khan,Dong Ho Lee,Jingqi Li,Tianyu Qiu,Christian Ellis,Jesse Milzman,Wesley Suttle,David Fridovich-Keil

Multi-robot coordination often exhibits hierarchical structure, with some robots' decisions depending on the planned behaviors of others. While game theory provides a principled framework for such interactions, existing solvers struggle to handle mixed information structures that combine simultaneous (Nash) and hierarchical (Stackelberg) decision-making. We study N-robot forest-structured mixed-hierarchy games, in which each robot acts as a Stackelberg leader over its subtree while robots in different branches interact via Nash equilibria. We derive the Karush-Kuhn-Tucker (KKT) first-order optimality conditions for this class of games and show that they involve increasingly high-order derivatives of robots' best-response policies as the hierarchy depth grows, rendering a direct solution intractable. To overcome this challenge, we introduce a quasi-policy approximation that removes higher-order policy derivatives and develop an inexact Newton method for efficiently solving the resulting approximated KKT systems. We prove local exponential convergence of the proposed algorithm for games with non-quadratic objectives and nonlinear constraints. The approach is implemented in a highly optimized Julia library (MixedHierarchyGames.jl) and evaluated in simulated experiments, demonstrating real-time convergence for complex mixed-hierarchy information structures.

翻译：多机器人协调通常呈现层次化结构，其中部分机器人的决策依赖于其他机器人的规划行为。虽然博弈论为此类交互提供了理论框架，但现有求解器难以处理同时包含同步（纳什）与层次化（斯塔克尔伯格）决策的混合信息结构。本文研究具有森林结构的N机器人混合层次博弈，其中每个机器人作为其子树中的斯塔克尔伯格领导者，而不同分支中的机器人通过纳什均衡进行交互。我们推导了此类博弈的Karush-Kuhn-Tucker（KKT）一阶最优性条件，证明其涉及机器人最优响应策略随层次深度增加而不断升阶的导数，导致直接求解不可行。为克服这一挑战，我们提出一种消除高阶策略导数的拟策略逼近方法，并开发了用于高效求解近似KKT系统的非精确牛顿法。我们证明了该算法在非二次目标函数与非线性约束博弈中具有局部指数收敛性。该方法通过高度优化的Julia库（MixedHierarchyGames.jl）实现，并在仿真实验中验证了其对复杂混合层次信息结构可实现实时收敛。

0

相关内容

混合博弈问题的求解与应用综述

混合博弈问题的求解与应用综述

专知会员服务

41+阅读 · 2024年8月9日

基于博弈论的弹目攻防决策方法研究

基于博弈论的弹目攻防决策方法研究

专知会员服务

49+阅读 · 2024年7月11日

智能博弈决策大模型智能体技术综述

智能博弈决策大模型智能体技术综述

专知会员服务

115+阅读 · 2024年6月29日

《动态作战规划：军事战役的随机博弈方法》2024最新37页论文

《动态作战规划：军事战役的随机博弈方法》2024最新37页论文

专知会员服务

140+阅读 · 2024年3月16日

智能博弈决策策略求解新视角实证分析

智能博弈决策策略求解新视角实证分析

专知会员服务

72+阅读 · 2024年1月9日

【CMU博士论文】不完全信息博弈中的博弈决策学习动力学、均衡计算和复杂性，358页pdf

【CMU博士论文】不完全信息博弈中的博弈决策学习动力学、均衡计算和复杂性，358页pdf

专知会员服务

64+阅读 · 2023年6月16日

面向智能博弈的决策Transformer方法综述

面向智能博弈的决策Transformer方法综述

专知会员服务

199+阅读 · 2023年4月14日

【AI+军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf

【AI+军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf

专知会员服务

318+阅读 · 2022年4月3日

【军用机器人+博弈论】paper速读：美国陆军研究实验室提出“基于博弈论的多机器人协作行动模型”

【军用机器人+博弈论】paper速读：美国陆军研究实验室提出“基于博弈论的多机器人协作行动模型”

专知会员服务

66+阅读 · 2022年3月21日

【IJCAI 2019 | tutorial】解决具有复杂策略空间的游戏中的问题 Solving Games With Complex Strategy Spaces，林肯大学|Hau Chan，卡内基梅隆大学|Fei Fang

【IJCAI 2019 | tutorial】解决具有复杂策略空间的游戏中的问题 Solving Games With Complex Strategy Spaces，林肯大学|Hau Chan，卡内基梅隆大学|Fei Fang

专知会员服务

29+阅读 · 2019年8月12日

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

38+阅读 · 2023年4月13日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【博士论文】《参数化战斗分析的方法框架》美国空军技术学院2022最新139页博士论文

【博士论文】《参数化战斗分析的方法框架》美国空军技术学院2022最新139页博士论文

专知

14+阅读 · 2022年10月22日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

32+阅读 · 2022年10月17日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知

24+阅读 · 2022年9月25日

「智能博弈对抗方法」最新2022综述-博弈论与强化学习综合视角对比分析

「智能博弈对抗方法」最新2022综述-博弈论与强化学习综合视角对比分析

专知

23+阅读 · 2022年8月28日

【AI与军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf，中文版

【AI与军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf，中文版

专知

129+阅读 · 2022年4月4日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

【混合智能】人机混合智能的哲学思考

【混合智能】人机混合智能的哲学思考

产业智能官

12+阅读 · 2018年10月28日

不对称多代理博弈中的博弈理论解读

不对称多代理博弈中的博弈理论解读

AI前线

14+阅读 · 2018年3月8日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

42+阅读 · 2015年12月31日

复杂动态网络上演化博弈的群体策略选择和干预机制研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于演化博弈的多智能体环形编队的理论与实验研究

国家自然科学基金

23+阅读 · 2015年12月31日

线性互补约束二次规划问题的一个全局算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

求解一类公平疏散问题的高性能混合算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂网络上数据传输博弈的合作性优化与控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

贝叶斯博弈关于信息结构的比较静态分析及应用

国家自然科学基金

1+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

Nearly-Optimal Bandit Learning in Stackelberg Games with Side Information

Arxiv

0+阅读 · 2月19日

Solving Qualitative Multi-Objective Stochastic Games

Arxiv

0+阅读 · 2月13日

Learning in Structured Stackelberg Games

Arxiv

0+阅读 · 2月12日

Altruism and Fair Objective in Mixed-Motive Markov games

Arxiv

0+阅读 · 2月9日

A Data Driven Structural Decomposition of Dynamic Games via Best Response Maps

Arxiv

0+阅读 · 2月5日

Multi-Player, Multi-Strategy Quantum Game Model for Interaction-Aware Decision-Making in Autonomous Driving

Arxiv

0+阅读 · 2月3日

Game-Theoretic and Algorithmic Analyses of Multi-Agent Routing under Crossing Costs

Arxiv

0+阅读 · 2月3日

The Learning Approach to Games

Arxiv

0+阅读 · 2月3日

Flexible Multitask Learning with Factorized Diffusion Policy

Arxiv

0+阅读 · 2月1日

Inverse Learning in $2\times2$ Games: From Synthetic Interactions to Traffic Simulation

Arxiv

0+阅读 · 1月15日

VIP会员

文章信息

相关主题

相关VIP内容

混合博弈问题的求解与应用综述

混合博弈问题的求解与应用综述

专知会员服务

41+阅读 · 2024年8月9日

基于博弈论的弹目攻防决策方法研究

基于博弈论的弹目攻防决策方法研究

专知会员服务

49+阅读 · 2024年7月11日

智能博弈决策大模型智能体技术综述

智能博弈决策大模型智能体技术综述

专知会员服务

115+阅读 · 2024年6月29日

《动态作战规划：军事战役的随机博弈方法》2024最新37页论文

《动态作战规划：军事战役的随机博弈方法》2024最新37页论文

专知会员服务

140+阅读 · 2024年3月16日

智能博弈决策策略求解新视角实证分析

智能博弈决策策略求解新视角实证分析

专知会员服务

72+阅读 · 2024年1月9日

【CMU博士论文】不完全信息博弈中的博弈决策学习动力学、均衡计算和复杂性，358页pdf

【CMU博士论文】不完全信息博弈中的博弈决策学习动力学、均衡计算和复杂性，358页pdf

专知会员服务

64+阅读 · 2023年6月16日

面向智能博弈的决策Transformer方法综述

面向智能博弈的决策Transformer方法综述

专知会员服务

199+阅读 · 2023年4月14日

【AI+军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf

【AI+军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf

专知会员服务

318+阅读 · 2022年4月3日

【军用机器人+博弈论】paper速读：美国陆军研究实验室提出“基于博弈论的多机器人协作行动模型”

【军用机器人+博弈论】paper速读：美国陆军研究实验室提出“基于博弈论的多机器人协作行动模型”

专知会员服务

66+阅读 · 2022年3月21日

【IJCAI 2019 | tutorial】解决具有复杂策略空间的游戏中的问题 Solving Games With Complex Strategy Spaces，林肯大学|Hau Chan，卡内基梅隆大学|Fei Fang

【IJCAI 2019 | tutorial】解决具有复杂策略空间的游戏中的问题 Solving Games With Complex Strategy Spaces，林肯大学|Hau Chan，卡内基梅隆大学|Fei Fang

专知会员服务

29+阅读 · 2019年8月12日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

38+阅读 · 2023年4月13日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【博士论文】《参数化战斗分析的方法框架》美国空军技术学院2022最新139页博士论文

【博士论文】《参数化战斗分析的方法框架》美国空军技术学院2022最新139页博士论文

专知

14+阅读 · 2022年10月22日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

32+阅读 · 2022年10月17日

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

【博士论文】《安全博弈中的分层规划：战略、战术和行动决策的博弈论方法》南加州大学

专知

24+阅读 · 2022年9月25日

「智能博弈对抗方法」最新2022综述-博弈论与强化学习综合视角对比分析

「智能博弈对抗方法」最新2022综述-博弈论与强化学习综合视角对比分析

专知

23+阅读 · 2022年8月28日

【AI与军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf，中文版

【AI与军事】美国陆军专著《博弈论在作战层面的应用》，47页pdf，中文版

专知

129+阅读 · 2022年4月4日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

【混合智能】人机混合智能的哲学思考

【混合智能】人机混合智能的哲学思考

产业智能官

12+阅读 · 2018年10月28日

不对称多代理博弈中的博弈理论解读

不对称多代理博弈中的博弈理论解读

AI前线

14+阅读 · 2018年3月8日

相关论文

Nearly-Optimal Bandit Learning in Stackelberg Games with Side Information

Arxiv

0+阅读 · 2月19日

Solving Qualitative Multi-Objective Stochastic Games

Arxiv

0+阅读 · 2月13日

Learning in Structured Stackelberg Games

Arxiv

0+阅读 · 2月12日

Altruism and Fair Objective in Mixed-Motive Markov games

Arxiv

0+阅读 · 2月9日

A Data Driven Structural Decomposition of Dynamic Games via Best Response Maps

Arxiv

0+阅读 · 2月5日

Multi-Player, Multi-Strategy Quantum Game Model for Interaction-Aware Decision-Making in Autonomous Driving

Arxiv

0+阅读 · 2月3日

Game-Theoretic and Algorithmic Analyses of Multi-Agent Routing under Crossing Costs

Arxiv

0+阅读 · 2月3日

The Learning Approach to Games

Arxiv

0+阅读 · 2月3日

Flexible Multitask Learning with Factorized Diffusion Policy

Arxiv

0+阅读 · 2月1日

Inverse Learning in $2\times2$ Games: From Synthetic Interactions to Traffic Simulation

Arxiv

0+阅读 · 1月15日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

42+阅读 · 2015年12月31日

复杂动态网络上演化博弈的群体策略选择和干预机制研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于演化博弈的多智能体环形编队的理论与实验研究

国家自然科学基金

23+阅读 · 2015年12月31日

线性互补约束二次规划问题的一个全局算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

求解一类公平疏散问题的高性能混合算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂网络上数据传输博弈的合作性优化与控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

贝叶斯博弈关于信息结构的比较静态分析及应用

国家自然科学基金

1+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员