Agile Interception of a Flying Target using Competitive Reinforcement Learning - 专知论文

会员服务 ·

0

捕获 · 基线 · 无人机 · 强化学习 · 策略优化 ·

Agile Interception of a Flying Target using Competitive Reinforcement Learning

翻译：基于竞争强化学习的飞行目标敏捷拦截

Timothée Gavin,Simon Lacroix,Murat Bronz

This article presents a solution to intercept an agile drone by another agile drone carrying a catching net. We formulate the interception as a Competitive Reinforcement Learning problem, where the interceptor and the target drone are controlled by separate policies trained with Proximal Policy Optimization (PPO). We introduce a high-fidelity simulation environment that integrates a realistic quadrotor dynamics model and a low-level control architecture implemented in JAX, which allows for fast parallelized execution on GPUs. We train the agents using low-level control, collective thrust and body rates, to achieve agile flights both for the interceptor and the target. We compare the performance of the trained policies in terms of catch rate, time to catch, and crash rate, against common heuristic baselines and show that our solution outperforms these baselines for interception of agile targets. Finally, we demonstrate the performance of the trained policies in a scaled real-world scenario using agile drones inside an indoor flight arena.

翻译：本文提出了一种利用携带捕捉网的敏捷无人机拦截另一架敏捷无人机的解决方案。我们将拦截问题建模为一个竞争强化学习问题，其中拦截器和目标无人机分别由通过近端策略优化算法训练的策略进行控制。我们引入了一个高保真仿真环境，该环境集成了真实的四旋翼动力学模型和一个在JAX中实现的底层控制架构，从而支持在GPU上进行快速并行化计算。我们使用底层控制指令——集体推力和机体角速率——训练智能体，使拦截器和目标均能实现敏捷飞行。我们通过捕获率、捕获时间和坠毁率等指标，将训练所得策略的性能与常见启发式基线方法进行比较，结果表明在拦截敏捷目标方面，我们的解决方案优于这些基线方法。最后，我们在室内飞行场中使用敏捷无人机，通过缩比现实场景验证了训练策略的性能。

1

相关内容

《基于强化学习的反无人机蜂群拦截优先级排序》

《基于强化学习的反无人机蜂群拦截优先级排序》

专知会员服务

25+阅读 · 4月16日

《基于无模型深度强化学习的导弹规避机动生成》

《基于无模型深度强化学习的导弹规避机动生成》

专知会员服务

18+阅读 · 2月10日

《无人机蜂群攻击防御的预测建模：面向美军战备的人工智能轨迹预测与最优拦截策略设计》最新报告

《无人机蜂群攻击防御的预测建模：面向美军战备的人工智能轨迹预测与最优拦截策略设计》最新报告

专知会员服务

41+阅读 · 2025年12月24日

《高速强机动目标制导方法优化途径：考虑拦截器动态特性的制导优化》

《高速强机动目标制导方法优化途径：考虑拦截器动态特性的制导优化》

专知会员服务

18+阅读 · 2025年11月30日

《"牧羊人网格"拦截策略：实现无人机集群可靠拦截的新范式》

《"牧羊人网格"拦截策略：实现无人机集群可靠拦截的新范式》

专知会员服务

36+阅读 · 2025年8月17日

《空中无人机拦截：追踪与捕获策略》

《空中无人机拦截：追踪与捕获策略》

专知会员服务

67+阅读 · 2024年5月29日

基于强化学习的无人机集群对抗策略推演仿真

基于强化学习的无人机集群对抗策略推演仿真

专知会员服务

70+阅读 · 2024年4月14日

《利用强化学习优化穿越敌方高射炮火力的飞行路径》论文

《利用强化学习优化穿越敌方高射炮火力的飞行路径》论文

专知会员服务

53+阅读 · 2023年3月1日

《无人机蜂群防御策略的行动规划和优化》2022.12最新97页论文

《无人机蜂群防御策略的行动规划和优化》2022.12最新97页论文

专知会员服务

165+阅读 · 2023年2月15日

基于强化学习的空战动作生成

基于强化学习的空战动作生成

专知会员服务

138+阅读 · 2022年6月19日

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知

38+阅读 · 2023年4月11日

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

专知

13+阅读 · 2022年11月25日

推荐！《用机器学习发掘反综合防空系统（IADS）的蜂群自主行为》【博士论文】2022最新325页论文

推荐！《用机器学习发掘反综合防空系统（IADS）的蜂群自主行为》【博士论文】2022最新325页论文

专知

28+阅读 · 2022年10月22日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

66+阅读 · 2022年8月25日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

【综述】深度学习在视频多目标跟踪上的应用

【综述】深度学习在视频多目标跟踪上的应用

专知

14+阅读 · 2019年8月8日

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

泡泡机器人SLAM

14+阅读 · 2019年6月28日

反无人机技术的方法与难点

反无人机技术的方法与难点

无人机

32+阅读 · 2019年4月30日

「目标检测算法」连连看：从 Faster R-CNN 、 R-FCN 到 FPN

「目标检测算法」连连看：从 Faster R-CNN 、 R-FCN 到 FPN

AI研习社

10+阅读 · 2018年5月12日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

改进智能优化策略多机动目标跟踪方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于弱监督贝叶斯推断模型的多无人机协同跟踪技术研究

国家自然科学基金

14+阅读 · 2015年12月31日

三维复杂地形环境下基于无人机追逃问题的航路规划方法研究

国家自然科学基金

26+阅读 · 2015年12月31日

机场跑道飞机拦阻系统的几个关键力学问题研究

国家自然科学基金

1+阅读 · 2014年12月31日

临近空间平台载雷达的地面动目标检测方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

拦截高超声速目标的多拦截器协同制导控制理论与方法研究

国家自然科学基金

14+阅读 · 2013年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

Rule-based High-Level Coaching for Goal-Conditioned Reinforcement Learning in Search-and-Rescue UAV Missions Under Limited-Simulation Training

Arxiv

0+阅读 · 4月29日

E2E-Fly: An Integrated Training-to-Deployment System for End-to-End Quadrotor Autonomy

Arxiv

0+阅读 · 4月14日

Precise Aggressive Aerial Maneuvers with Sensorimotor Policies

Arxiv

0+阅读 · 4月7日

Meta-Adaptive Beam Search Planning for Transformer-Based Reinforcement Learning Control of UAVs with Overhead Manipulators under Flight Disturbances

Arxiv

0+阅读 · 3月27日

Multi-objective Optimization for Over-the-Air Federated Edge Learning-enabled Collaborative Integrated Sensing and Communications

Arxiv

0+阅读 · 3月16日

ASTER: Attitude-aware Suspended-payload Quadrotor Traversal via Efficient Reinforcement Learning

Arxiv

0+阅读 · 3月11日

Vision-Guided MPPI for Agile Drone Racing: Navigating Arbitrary Gate Poses via Neural Signed Distance Fields

Arxiv

0+阅读 · 3月7日

Learning Acrobatic Flight from Preferences

Arxiv

0+阅读 · 3月3日

Curriculum Reinforcement Learning for Quadrotor Racing with Random Obstacles

Arxiv

0+阅读 · 2月27日

Hierarchical Multi-Agent Reinforcement Learning for Air Combat Maneuvering

Arxiv

49+阅读 · 2023年9月20日

VIP会员

文章信息

相关主题

最新内容

《不确定性下基础设施维修与更换决策的深度强化学习方法》2026最新89页

《不确定性下基础设施维修与更换决策的深度强化学习方法》2026最新89页

专知会员服务

7+阅读 · 今天3:25

Palantir测试“战争操作系统” ：管理乌克兰对俄作战

Palantir测试“战争操作系统” ：管理乌克兰对俄作战

专知会员服务

7+阅读 · 今天3:16

《算法背后的力量：Palantir与全球AI监控及军事行动的兴起》

《算法背后的力量：Palantir与全球AI监控及军事行动的兴起》

专知会员服务

9+阅读 · 今天3:13

无人机系统对海军舰艇的战略威胁评估：基于任务分析的脆弱性与应对措施研究（2026最新90页）

无人机系统对海军舰艇的战略威胁评估：基于任务分析的脆弱性与应对措施研究（2026最新90页）

专知会员服务

11+阅读 · 今天3:10

战争算法：Palantir与Anthropic如何成为美国对伊行动中的共同交战方

战争算法：Palantir与Anthropic如何成为美国对伊行动中的共同交战方

专知会员服务

4+阅读 · 今天3:05

《军事任务为中心网络安全风险评估中的不确定性》

《军事任务为中心网络安全风险评估中的不确定性》

专知会员服务

5+阅读 · 今天2:39

[ICML 2026] 训练-推理一致的片段级执行：长上下文LLM的高效可扩展方法

[ICML 2026] 训练-推理一致的片段级执行：长上下文LLM的高效可扩展方法

专知会员服务

4+阅读 · 5月17日

从看见到认知世界：视觉世界模型综述

从看见到认知世界：视觉世界模型综述

专知会员服务

7+阅读 · 5月17日

《高超声速打击武器引发的战略影响》116页

《高超声速打击武器引发的战略影响》116页

专知会员服务

8+阅读 · 5月17日

《美军不对称战略选择》28页slides

《美军不对称战略选择》28页slides

专知会员服务

9+阅读 · 5月17日

《审视 Palantir 监控平台》

《审视 Palantir 监控平台》

专知会员服务

20+阅读 · 5月17日

《美海军研究报告：利用认知模型为机器学习模型生成数据》

《美海军研究报告：利用认知模型为机器学习模型生成数据》

专知会员服务

10+阅读 · 5月17日

PALANTIR GOTHAM平台：人工智能赋能作战

PALANTIR GOTHAM平台：人工智能赋能作战

专知会员服务

17+阅读 · 5月17日

集成式人工智能：Palantir与认知维度

集成式人工智能：Palantir与认知维度

专知会员服务

11+阅读 · 5月17日

AI原生数据库发展趋势白皮书

AI原生数据库发展趋势白皮书

专知会员服务

13+阅读 · 5月16日

相关VIP内容

《基于强化学习的反无人机蜂群拦截优先级排序》

《基于强化学习的反无人机蜂群拦截优先级排序》

专知会员服务

25+阅读 · 4月16日

《基于无模型深度强化学习的导弹规避机动生成》

《基于无模型深度强化学习的导弹规避机动生成》

专知会员服务

18+阅读 · 2月10日

《无人机蜂群攻击防御的预测建模：面向美军战备的人工智能轨迹预测与最优拦截策略设计》最新报告

《无人机蜂群攻击防御的预测建模：面向美军战备的人工智能轨迹预测与最优拦截策略设计》最新报告

专知会员服务

41+阅读 · 2025年12月24日

《高速强机动目标制导方法优化途径：考虑拦截器动态特性的制导优化》

《高速强机动目标制导方法优化途径：考虑拦截器动态特性的制导优化》

专知会员服务

18+阅读 · 2025年11月30日

《"牧羊人网格"拦截策略：实现无人机集群可靠拦截的新范式》

《"牧羊人网格"拦截策略：实现无人机集群可靠拦截的新范式》

专知会员服务

36+阅读 · 2025年8月17日

《空中无人机拦截：追踪与捕获策略》

《空中无人机拦截：追踪与捕获策略》

专知会员服务

67+阅读 · 2024年5月29日

基于强化学习的无人机集群对抗策略推演仿真

基于强化学习的无人机集群对抗策略推演仿真

专知会员服务

70+阅读 · 2024年4月14日

《利用强化学习优化穿越敌方高射炮火力的飞行路径》论文

《利用强化学习优化穿越敌方高射炮火力的飞行路径》论文

专知会员服务

53+阅读 · 2023年3月1日

《无人机蜂群防御策略的行动规划和优化》2022.12最新97页论文

《无人机蜂群防御策略的行动规划和优化》2022.12最新97页论文

专知会员服务

165+阅读 · 2023年2月15日

基于强化学习的空战动作生成

基于强化学习的空战动作生成

专知会员服务

138+阅读 · 2022年6月19日

热门VIP内容

开通专知VIP会员享更多权益服务

Palantir测试“战争操作系统” ：管理乌克兰对俄作战

无人机系统对海军舰艇的战略威胁评估：基于任务分析的脆弱性与应对措施研究（2026最新90页）

《不确定性下基础设施维修与更换决策的深度强化学习方法》2026最新89页

《算法背后的力量：Palantir与全球AI监控及军事行动的兴起》

相关资讯

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知

38+阅读 · 2023年4月11日

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

专知

13+阅读 · 2022年11月25日

推荐！《用机器学习发掘反综合防空系统（IADS）的蜂群自主行为》【博士论文】2022最新325页论文

推荐！《用机器学习发掘反综合防空系统（IADS）的蜂群自主行为》【博士论文】2022最新325页论文

专知

28+阅读 · 2022年10月22日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

66+阅读 · 2022年8月25日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

【综述】深度学习在视频多目标跟踪上的应用

【综述】深度学习在视频多目标跟踪上的应用

专知

14+阅读 · 2019年8月8日

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

泡泡机器人SLAM

14+阅读 · 2019年6月28日

反无人机技术的方法与难点

反无人机技术的方法与难点

无人机

32+阅读 · 2019年4月30日

「目标检测算法」连连看：从 Faster R-CNN 、 R-FCN 到 FPN

「目标检测算法」连连看：从 Faster R-CNN 、 R-FCN 到 FPN

AI研习社

10+阅读 · 2018年5月12日

相关论文

Rule-based High-Level Coaching for Goal-Conditioned Reinforcement Learning in Search-and-Rescue UAV Missions Under Limited-Simulation Training

Arxiv

0+阅读 · 4月29日

E2E-Fly: An Integrated Training-to-Deployment System for End-to-End Quadrotor Autonomy

Arxiv

0+阅读 · 4月14日

Precise Aggressive Aerial Maneuvers with Sensorimotor Policies

Arxiv

0+阅读 · 4月7日

Meta-Adaptive Beam Search Planning for Transformer-Based Reinforcement Learning Control of UAVs with Overhead Manipulators under Flight Disturbances

Arxiv

0+阅读 · 3月27日

Multi-objective Optimization for Over-the-Air Federated Edge Learning-enabled Collaborative Integrated Sensing and Communications

Arxiv

0+阅读 · 3月16日

ASTER: Attitude-aware Suspended-payload Quadrotor Traversal via Efficient Reinforcement Learning

Arxiv

0+阅读 · 3月11日

Vision-Guided MPPI for Agile Drone Racing: Navigating Arbitrary Gate Poses via Neural Signed Distance Fields

Arxiv

0+阅读 · 3月7日

Learning Acrobatic Flight from Preferences

Arxiv

0+阅读 · 3月3日

Curriculum Reinforcement Learning for Quadrotor Racing with Random Obstacles

Arxiv

0+阅读 · 2月27日

Hierarchical Multi-Agent Reinforcement Learning for Air Combat Maneuvering

Arxiv

49+阅读 · 2023年9月20日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

改进智能优化策略多机动目标跟踪方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于弱监督贝叶斯推断模型的多无人机协同跟踪技术研究

国家自然科学基金

14+阅读 · 2015年12月31日

三维复杂地形环境下基于无人机追逃问题的航路规划方法研究

国家自然科学基金

26+阅读 · 2015年12月31日

机场跑道飞机拦阻系统的几个关键力学问题研究

国家自然科学基金

1+阅读 · 2014年12月31日

临近空间平台载雷达的地面动目标检测方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

拦截高超声速目标的多拦截器协同制导控制理论与方法研究

国家自然科学基金

14+阅读 · 2013年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员