高速策略规划：用于多智能体无人机竞速的学习型模型预测博弈 (Strategizing at Speed: A Learned Model Predictive Game for Multi-Agent Drone Racing) - 专知论文

会员服务 ·

0

模型预测 · 博弈 · 交互 · 智能体 · 多智能体 ·

Strategizing at Speed: A Learned Model Predictive Game for Multi-Agent Drone Racing

翻译：高速策略规划：用于多智能体无人机竞速的学习型模型预测博弈

Andrei-Carlo Papuc,Lasse Peters,Sihao Sun,Laura Ferranti,Javier Alonso-Mora

Autonomous drone racing pushes the boundaries of high-speed motion planning and multi-agent strategic decision-making. Success in this domain requires drones not only to navigate at their limits but also to anticipate and counteract competitors' actions. In this paper, we study a fundamental question that arises in this domain: how deeply should an agent strategize before taking an action? To this end, we compare two planning paradigms: the Model Predictive Game (MPG), which finds interaction-aware strategies at the expense of longer computation times, and contouring Model Predictive Control (MPC), which computes strategies rapidly but does not reason about interactions. We perform extensive experiments to study this trade-off, revealing that MPG outperforms MPC at moderate velocities but loses its advantage at higher speeds due to latency. To address this shortcoming, we propose a Learned Model Predictive Game (LMPG) approach that amortizes model predictive gameplay to reduce latency. In both simulation and hardware experiments, we benchmark our approach against MPG and MPC in head-to-head races, finding that LMPG outperforms both baselines.

翻译：自主无人机竞速技术不断挑战高速运动规划与多智能体策略决策的极限。在这一领域取得成功不仅要求无人机以极限状态飞行，还需预测并应对竞争对手的行为。本文研究该领域的一个基本问题：智能体在采取行动前应进行多深层次的策略规划？为此，我们比较了两种规划范式：模型预测博弈（MPG）——以更长的计算时间为代价获取交互感知策略，以及轮廓模型预测控制（MPC）——快速计算策略但不对交互进行推理。我们通过大量实验研究这种权衡关系，发现MPG在中等速度下优于MPC，但在更高速度下因延迟而丧失优势。为克服这一缺陷，我们提出学习型模型预测博弈（LMPG）方法，通过分摊模型预测博弈的计算成本来降低延迟。在仿真与硬件实验中，我们将该方法与MPG和MPC在直接对抗竞速中进行基准测试，结果表明LMPG优于两种基线方法。

0

相关内容

模型预测

《无人机蜂群攻击防御的预测建模：面向美军战备的人工智能轨迹预测与最优拦截策略设计》最新报告

《无人机蜂群攻击防御的预测建模：面向美军战备的人工智能轨迹预测与最优拦截策略设计》最新报告

专知会员服务

35+阅读 · 2025年12月24日

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

专知会员服务

22+阅读 · 2025年11月17日

《基于分层多智能体强化学习的逼真空战协同策略》

《基于分层多智能体强化学习的逼真空战协同策略》

专知会员服务

38+阅读 · 2025年10月30日

多智能体协同决策研究全景透视：应用场景、研究方法、挑战与未来展望

多智能体协同决策研究全景透视：应用场景、研究方法、挑战与未来展望

专知会员服务

44+阅读 · 2025年3月20日

基于强化学习的无人机集群对抗策略推演仿真

基于强化学习的无人机集群对抗策略推演仿真

专知会员服务

69+阅读 · 2024年4月14日

无人飞行器自主决策与规划技术综述

无人飞行器自主决策与规划技术综述

专知会员服务

44+阅读 · 2024年3月11日

基于多智能体博弈强化学习的无人机智能攻击策略生成模型

基于多智能体博弈强化学习的无人机智能攻击策略生成模型

专知会员服务

107+阅读 · 2023年10月16日

基于态势演化博弈的无人机集群动态攻防

基于态势演化博弈的无人机集群动态攻防

专知会员服务

98+阅读 · 2023年9月3日

面向任务的无人机集群自主决策技术

面向任务的无人机集群自主决策技术

专知会员服务

189+阅读 · 2023年4月15日

《通过运筹学和人工智能方法研究空战机动策略》美国空军技术学院

《通过运筹学和人工智能方法研究空战机动策略》美国空军技术学院

专知会员服务

115+阅读 · 2022年6月23日

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知

18+阅读 · 2022年9月28日

推荐！【美海军·系统工程顶点报告】《人工智能使能的实时兵棋推演系统在海军战术行动中的应用》美国海军2022最新128页

推荐！【美海军·系统工程顶点报告】《人工智能使能的实时兵棋推演系统在海军战术行动中的应用》美国海军2022最新128页

专知

84+阅读 · 2022年9月24日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

65+阅读 · 2022年8月25日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

自动驾驶技术解读——自动驾驶汽车决策控制系统

自动驾驶技术解读——自动驾驶汽车决策控制系统

智能交通技术

30+阅读 · 2019年7月7日

无人机蜂群作战技术与多智能体系统理论

无人机蜂群作战技术与多智能体系统理论

无人机

41+阅读 · 2019年1月27日

智能无人作战系统的发展

智能无人作战系统的发展

科技导报

36+阅读 · 2018年6月29日

智能无人机集群技术概述

智能无人机集群技术概述

无人机

44+阅读 · 2018年2月28日

【无人机】无人机的自主与智能控制

【无人机】无人机的自主与智能控制

产业智能官

53+阅读 · 2017年11月27日

无人机飞行控制方法概述

无人机飞行控制方法概述

无人机

12+阅读 · 2017年10月7日

高动态环境下的多普勒测速脉冲星导航方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

改进智能优化策略多机动目标跟踪方法研究

国家自然科学基金

17+阅读 · 2015年12月31日

多旋翼无人飞行器大机动轨迹跟踪飞行非线性鲁棒控制

国家自然科学基金

2+阅读 · 2015年12月31日

三维复杂地形环境下基于无人机追逃问题的航路规划方法研究

国家自然科学基金

26+阅读 · 2015年12月31日

高动态编队无人机自主高精度时间同步方法研究

国家自然科学基金

11+阅读 · 2013年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

20+阅读 · 2013年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

非确定环境下基于分层理论的无人机多机协同控制算法研究

国家自然科学基金

12+阅读 · 2010年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

Drones that Think on their Feet: Sudden Landing Decisions with Embodied AI

Arxiv

0+阅读 · 2月19日

Fast Surrogate Learning for Multi-Objective UAV Placement in Motorway Intelligent Transportation System

Arxiv

0+阅读 · 2月14日

Building Large-Scale Drone Defenses from Small-Team Strategies

Arxiv

0+阅读 · 2月13日

MARSHAL: Incentivizing Multi-Agent Reasoning via Self-Play with Strategic LLMs

Arxiv

0+阅读 · 2月12日

Multi UAVs Preflight Planning in a Shared and Dynamic Airspace

Arxiv

0+阅读 · 2月12日

Multi-Player, Multi-Strategy Quantum Game Model for Interaction-Aware Decision-Making in Automated Driving

Arxiv

0+阅读 · 2月9日

Multi-Agent Inverted Transformer for Flight Trajectory Prediction

Arxiv

0+阅读 · 2月5日

Multi-Player, Multi-Strategy Quantum Game Model for Interaction-Aware Decision-Making in Autonomous Driving

Arxiv

0+阅读 · 2月3日

PlanTRansformer: Unified Prediction and Planning with Goal-conditioned Transformer

Arxiv

0+阅读 · 2月3日

On Your Own: Pro-level Autonomous Drone Racing in Uninstrumented Arenas

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

相关VIP内容

《无人机蜂群攻击防御的预测建模：面向美军战备的人工智能轨迹预测与最优拦截策略设计》最新报告

《无人机蜂群攻击防御的预测建模：面向美军战备的人工智能轨迹预测与最优拦截策略设计》最新报告

专知会员服务

35+阅读 · 2025年12月24日

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

专知会员服务

22+阅读 · 2025年11月17日

《基于分层多智能体强化学习的逼真空战协同策略》

《基于分层多智能体强化学习的逼真空战协同策略》

专知会员服务

38+阅读 · 2025年10月30日

多智能体协同决策研究全景透视：应用场景、研究方法、挑战与未来展望

多智能体协同决策研究全景透视：应用场景、研究方法、挑战与未来展望

专知会员服务

44+阅读 · 2025年3月20日

基于强化学习的无人机集群对抗策略推演仿真

基于强化学习的无人机集群对抗策略推演仿真

专知会员服务

69+阅读 · 2024年4月14日

无人飞行器自主决策与规划技术综述

无人飞行器自主决策与规划技术综述

专知会员服务

44+阅读 · 2024年3月11日

基于多智能体博弈强化学习的无人机智能攻击策略生成模型

基于多智能体博弈强化学习的无人机智能攻击策略生成模型

专知会员服务

107+阅读 · 2023年10月16日

基于态势演化博弈的无人机集群动态攻防

基于态势演化博弈的无人机集群动态攻防

专知会员服务

98+阅读 · 2023年9月3日

面向任务的无人机集群自主决策技术

面向任务的无人机集群自主决策技术

专知会员服务

189+阅读 · 2023年4月15日

《通过运筹学和人工智能方法研究空战机动策略》美国空军技术学院

《通过运筹学和人工智能方法研究空战机动策略》美国空军技术学院

专知会员服务

115+阅读 · 2022年6月23日

热门VIP内容

开通专知VIP会员享更多权益服务

《可信人工智能赋能系统的支柱》

《从经典神经网络到不确定性下的拓扑神经网络：军事应用》2026最新40页报告

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

《人工智能：对战略与力量的影响》slides

相关资讯

面向多智能体博弈对抗的对手建模框架

面向多智能体博弈对抗的对手建模框架

专知

18+阅读 · 2022年9月28日

推荐！【美海军·系统工程顶点报告】《人工智能使能的实时兵棋推演系统在海军战术行动中的应用》美国海军2022最新128页

推荐！【美海军·系统工程顶点报告】《人工智能使能的实时兵棋推演系统在海军战术行动中的应用》美国海军2022最新128页

专知

84+阅读 · 2022年9月24日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

65+阅读 · 2022年8月25日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

自动驾驶技术解读——自动驾驶汽车决策控制系统

自动驾驶技术解读——自动驾驶汽车决策控制系统

智能交通技术

30+阅读 · 2019年7月7日

无人机蜂群作战技术与多智能体系统理论

无人机蜂群作战技术与多智能体系统理论

无人机

41+阅读 · 2019年1月27日

智能无人作战系统的发展

智能无人作战系统的发展

科技导报

36+阅读 · 2018年6月29日

智能无人机集群技术概述

智能无人机集群技术概述

无人机

44+阅读 · 2018年2月28日

【无人机】无人机的自主与智能控制

【无人机】无人机的自主与智能控制

产业智能官

53+阅读 · 2017年11月27日

无人机飞行控制方法概述

无人机飞行控制方法概述

无人机

12+阅读 · 2017年10月7日

相关论文

Drones that Think on their Feet: Sudden Landing Decisions with Embodied AI

Arxiv

0+阅读 · 2月19日

Fast Surrogate Learning for Multi-Objective UAV Placement in Motorway Intelligent Transportation System

Arxiv

0+阅读 · 2月14日

Building Large-Scale Drone Defenses from Small-Team Strategies

Arxiv

0+阅读 · 2月13日

MARSHAL: Incentivizing Multi-Agent Reasoning via Self-Play with Strategic LLMs

Arxiv

0+阅读 · 2月12日

Multi UAVs Preflight Planning in a Shared and Dynamic Airspace

Arxiv

0+阅读 · 2月12日

Multi-Player, Multi-Strategy Quantum Game Model for Interaction-Aware Decision-Making in Automated Driving

Arxiv

0+阅读 · 2月9日

Multi-Agent Inverted Transformer for Flight Trajectory Prediction

Arxiv

0+阅读 · 2月5日

Multi-Player, Multi-Strategy Quantum Game Model for Interaction-Aware Decision-Making in Autonomous Driving

Arxiv

0+阅读 · 2月3日

PlanTRansformer: Unified Prediction and Planning with Goal-conditioned Transformer

Arxiv

0+阅读 · 2月3日

On Your Own: Pro-level Autonomous Drone Racing in Uninstrumented Arenas

Arxiv

0+阅读 · 1月30日

相关基金

高动态环境下的多普勒测速脉冲星导航方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

改进智能优化策略多机动目标跟踪方法研究

国家自然科学基金

17+阅读 · 2015年12月31日

多旋翼无人飞行器大机动轨迹跟踪飞行非线性鲁棒控制

国家自然科学基金

2+阅读 · 2015年12月31日

三维复杂地形环境下基于无人机追逃问题的航路规划方法研究

国家自然科学基金

26+阅读 · 2015年12月31日

高动态编队无人机自主高精度时间同步方法研究

国家自然科学基金

11+阅读 · 2013年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

20+阅读 · 2013年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

非确定环境下基于分层理论的无人机多机协同控制算法研究

国家自然科学基金

12+阅读 · 2010年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员