基于激光雷达深度强化学习的无人机集群无通信协同导航 (Communication-Free Collective Navigation for a Swarm of UAVs via LiDAR-Based Deep Reinforcement Learning) - 专知论文

会员服务 ·

0

协同 · 协同导航 · 鲁棒 · 控制器 · 系统 ·

Communication-Free Collective Navigation for a Swarm of UAVs via LiDAR-Based Deep Reinforcement Learning

翻译：基于激光雷达深度强化学习的无人机集群无通信协同导航

Myong-Yol Choi,Hankyoul Ko,Hanse Cho,Changseung Kim,Seunghwan Kim,Jaemin Seo,Hyondong Oh

This paper presents a deep reinforcement learning (DRL) based controller for collective navigation of unmanned aerial vehicle (UAV) swarms in communication-denied environments, enabling robust operation in complex, obstacle-rich environments. Inspired by biological swarms where informed individuals guide groups without explicit communication, we employ an implicit leader-follower framework. In this paradigm, only the leader possesses goal information, while follower UAVs learn robust policies using only onboard LiDAR sensing, without requiring any inter-agent communication or leader identification. Our system utilizes LiDAR point clustering and an extended Kalman filter for stable neighbor tracking, providing reliable perception independent of external positioning systems. The core of our approach is a DRL controller, trained in GPU-accelerated Nvidia Isaac Sim, that enables followers to learn complex emergent behaviors - balancing flocking and obstacle avoidance - using only local perception. This allows the swarm to implicitly follow the leader while robustly addressing perceptual challenges such as occlusion and limited field-of-view. The robustness and sim-to-real transfer of our approach are confirmed through extensive simulations and challenging real-world experiments with a swarm of five UAVs, which successfully demonstrated collective navigation across diverse indoor and outdoor environments without any communication or external localization.

翻译：本文提出一种基于深度强化学习（DRL）的控制器，用于在通信受限环境中实现无人机（UAV）集群的协同导航，使其能够在复杂、障碍物密集的环境中鲁棒运行。受生物集群中知情个体无需显式通信即可引导群体的启发，我们采用了一种隐式领导者-跟随者框架。在此范式中，仅领导者掌握目标信息，而跟随者无人机仅利用机载激光雷达感知学习鲁棒策略，无需任何个体间通信或领导者识别。我们的系统利用激光雷达点云聚类与扩展卡尔曼滤波器实现稳定的邻居跟踪，提供不依赖外部定位系统的可靠感知。方法的核心是一个在GPU加速的Nvidia Isaac Sim中训练的DRL控制器，使跟随者仅通过局部感知即可学习复杂的涌现行为——平衡集群聚集与避障。这使得集群能够隐式跟随领导者，同时鲁棒地应对遮挡与有限视场等感知挑战。我们通过大量仿真及由五架无人机组成的集群在具有挑战性的真实世界实验，验证了所提方法的鲁棒性与仿真到现实的迁移能力。实验成功展示了在多样化的室内外环境中无需任何通信或外部定位的集群协同导航。

0

相关内容

无人艇集群路径规划研究综述: 深度强化学习

无人艇集群路径规划研究综述: 深度强化学习

专知会员服务

24+阅读 · 2025年5月3日

《基于深度强化学习与可解释AI的战斗机导航与作战研究》

《基于深度强化学习与可解释AI的战斗机导航与作战研究》

专知会员服务

40+阅读 · 2025年3月1日

《基于可解释人工智能的深度强化学习实现战斗机导航和作战》

《基于可解释人工智能的深度强化学习实现战斗机导航和作战》

专知会员服务

32+阅读 · 2025年2月23日

《基于深度强化学习的安全约束分布式多无人机协同》最新130页博士论文

《基于深度强化学习的安全约束分布式多无人机协同》最新130页博士论文

专知会员服务

66+阅读 · 2024年11月19日

《利用深度强化学习实现自主水下航行器的自适应编队运动规划和控制》2023最新33页

《利用深度强化学习实现自主水下航行器的自适应编队运动规划和控制》2023最新33页

专知会员服务

45+阅读 · 2023年12月26日

《使用强化学习的自主无人飞行器导航：综述》

《使用强化学习的自主无人飞行器导航：综述》

专知会员服务

84+阅读 · 2023年6月18日

深度强化学习的无人作战飞机空战机动决策

深度强化学习的无人作战飞机空战机动决策

专知会员服务

120+阅读 · 2023年5月22日

《使用强化学习的无人作战飞行器机队协同规划》12页论文

《使用强化学习的无人作战飞行器机队协同规划》12页论文

专知会员服务

164+阅读 · 2022年11月14日

北理工最新《基于深度学习的无人机UAV目标检测与跟踪》研究综述论文，24页pdf227篇文献概述深度无人机目标检测进展

北理工最新《基于深度学习的无人机UAV目标检测与跟踪》研究综述论文，24页pdf227篇文献概述深度无人机目标检测进展

专知会员服务

163+阅读 · 2021年10月28日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

176+阅读 · 2020年2月8日

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

专知

69+阅读 · 2022年12月3日

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

专知

10+阅读 · 2022年11月17日

《作战无人机系统（UAS）概念开发和实验的性能测量》加拿大国防研究与发展部2022最新35页报告

《作战无人机系统（UAS）概念开发和实验的性能测量》加拿大国防研究与发展部2022最新35页报告

专知

34+阅读 · 2022年10月11日

【万字长文】《信息集群：无人机群与信息战》美国陆军战争学院季刊最新17页论文

【万字长文】《信息集群：无人机群与信息战》美国陆军战争学院季刊最新17页论文

专知

43+阅读 · 2022年8月16日

《无人机系统中的人类系统集成指南》加拿大国防研究和发展部64页报告

《无人机系统中的人类系统集成指南》加拿大国防研究和发展部64页报告

专知

49+阅读 · 2022年8月11日

DAI2020 SMARTS 自动驾驶挑战赛(深度强化学习)

DAI2020 SMARTS 自动驾驶挑战赛(深度强化学习)

深度强化学习实验室

15+阅读 · 2020年8月15日

深度强化学习在NLP怎么用？看清华黄民烈老师这一份120页《自然语言处理和搜索中的深度强化学习应用》讲义

深度强化学习在NLP怎么用？看清华黄民烈老师这一份120页《自然语言处理和搜索中的深度强化学习应用》讲义

专知

31+阅读 · 2018年9月1日

智能无人机集群技术概述

智能无人机集群技术概述

无人机

44+阅读 · 2018年2月28日

无人机飞行控制方法概述

无人机飞行控制方法概述

无人机

12+阅读 · 2017年10月7日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

多旋翼无人飞行器大机动轨迹跟踪飞行非线性鲁棒控制

国家自然科学基金

2+阅读 · 2015年12月31日

基于弱监督贝叶斯推断模型的多无人机协同跟踪技术研究

国家自然科学基金

14+阅读 · 2015年12月31日

无人机自主导航中LiDAR点云与图像特征提取与配准方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于确定学习方法的无人水面艇智能控制研究

国家自然科学基金

17+阅读 · 2014年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

20+阅读 · 2013年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

无人机对地目标跟踪与定位的基础理论与关键技术

国家自然科学基金

18+阅读 · 2011年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

无人机协同组网感知融合与传感器管理关键技术研究

国家自然科学基金

27+阅读 · 2011年12月31日

非确定环境下基于分层理论的无人机多机协同控制算法研究

国家自然科学基金

12+阅读 · 2010年12月31日

Deep Reinforcement Learning based Autonomous Decision-Making for Cooperative UAVs: A Search and Rescue Real World Application

Arxiv

0+阅读 · 2月16日

Composable Model-Free RL for Navigation with Input-Affine Systems

Arxiv

0+阅读 · 2月13日

AC-MASAC: An Attentive Curriculum Learning Framework for Heterogeneous UAV Swarm Coordination

Arxiv

0+阅读 · 2月12日

Multi-Task Reinforcement Learning of Drone Aerobatics by Exploiting Geometric Symmetries

Arxiv

0+阅读 · 2月11日

Resilient Topology-Aware Coordination for Dynamic 3D UAV Networks under Node Failure

Arxiv

0+阅读 · 2月10日

ORCHID: Fairness-Aware Orchestration in Mission-Critical Air-Ground Integrated Networks

Arxiv

0+阅读 · 2月10日

AutoFly: Vision-Language-Action Model for UAV Autonomous Navigation in the Wild

Arxiv

0+阅读 · 2月10日

Integrated Sensing, Communication, and Control for UAV-Assisted Mobile Target Tracking

Arxiv

0+阅读 · 2月5日

DeepUrban: Interaction-Aware Trajectory Prediction and Planning for Automated Driving by Aerial Imagery

Arxiv

0+阅读 · 2月3日

3D UAV Trajectory Design for Fair and Energy-Efficient Communication: A Deep Reinforcement Learning Technique

Arxiv

0+阅读 · 1月16日

VIP会员

文章信息

相关主题

相关VIP内容

无人艇集群路径规划研究综述: 深度强化学习

无人艇集群路径规划研究综述: 深度强化学习

专知会员服务

24+阅读 · 2025年5月3日

《基于深度强化学习与可解释AI的战斗机导航与作战研究》

《基于深度强化学习与可解释AI的战斗机导航与作战研究》

专知会员服务

40+阅读 · 2025年3月1日

《基于可解释人工智能的深度强化学习实现战斗机导航和作战》

《基于可解释人工智能的深度强化学习实现战斗机导航和作战》

专知会员服务

32+阅读 · 2025年2月23日

《基于深度强化学习的安全约束分布式多无人机协同》最新130页博士论文

《基于深度强化学习的安全约束分布式多无人机协同》最新130页博士论文

专知会员服务

66+阅读 · 2024年11月19日

《利用深度强化学习实现自主水下航行器的自适应编队运动规划和控制》2023最新33页

《利用深度强化学习实现自主水下航行器的自适应编队运动规划和控制》2023最新33页

专知会员服务

45+阅读 · 2023年12月26日

《使用强化学习的自主无人飞行器导航：综述》

《使用强化学习的自主无人飞行器导航：综述》

专知会员服务

84+阅读 · 2023年6月18日

深度强化学习的无人作战飞机空战机动决策

深度强化学习的无人作战飞机空战机动决策

专知会员服务

120+阅读 · 2023年5月22日

《使用强化学习的无人作战飞行器机队协同规划》12页论文

《使用强化学习的无人作战飞行器机队协同规划》12页论文

专知会员服务

164+阅读 · 2022年11月14日

北理工最新《基于深度学习的无人机UAV目标检测与跟踪》研究综述论文，24页pdf227篇文献概述深度无人机目标检测进展

北理工最新《基于深度学习的无人机UAV目标检测与跟踪》研究综述论文，24页pdf227篇文献概述深度无人机目标检测进展

专知会员服务

163+阅读 · 2021年10月28日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

176+阅读 · 2020年2月8日

热门VIP内容

开通专知VIP会员享更多权益服务

《可信人工智能赋能系统的支柱》

《从经典神经网络到不确定性下的拓扑神经网络：军事应用》2026最新40页报告

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

《人工智能：对战略与力量的影响》slides

相关资讯

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

专知

69+阅读 · 2022年12月3日

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

专知

10+阅读 · 2022年11月17日

《作战无人机系统（UAS）概念开发和实验的性能测量》加拿大国防研究与发展部2022最新35页报告

《作战无人机系统（UAS）概念开发和实验的性能测量》加拿大国防研究与发展部2022最新35页报告

专知

34+阅读 · 2022年10月11日

【万字长文】《信息集群：无人机群与信息战》美国陆军战争学院季刊最新17页论文

【万字长文】《信息集群：无人机群与信息战》美国陆军战争学院季刊最新17页论文

专知

43+阅读 · 2022年8月16日

《无人机系统中的人类系统集成指南》加拿大国防研究和发展部64页报告

《无人机系统中的人类系统集成指南》加拿大国防研究和发展部64页报告

专知

49+阅读 · 2022年8月11日

DAI2020 SMARTS 自动驾驶挑战赛(深度强化学习)

DAI2020 SMARTS 自动驾驶挑战赛(深度强化学习)

深度强化学习实验室

15+阅读 · 2020年8月15日

深度强化学习在NLP怎么用？看清华黄民烈老师这一份120页《自然语言处理和搜索中的深度强化学习应用》讲义

深度强化学习在NLP怎么用？看清华黄民烈老师这一份120页《自然语言处理和搜索中的深度强化学习应用》讲义

专知

31+阅读 · 2018年9月1日

智能无人机集群技术概述

智能无人机集群技术概述

无人机

44+阅读 · 2018年2月28日

无人机飞行控制方法概述

无人机飞行控制方法概述

无人机

12+阅读 · 2017年10月7日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

相关论文

Deep Reinforcement Learning based Autonomous Decision-Making for Cooperative UAVs: A Search and Rescue Real World Application

Arxiv

0+阅读 · 2月16日

Composable Model-Free RL for Navigation with Input-Affine Systems

Arxiv

0+阅读 · 2月13日

AC-MASAC: An Attentive Curriculum Learning Framework for Heterogeneous UAV Swarm Coordination

Arxiv

0+阅读 · 2月12日

Multi-Task Reinforcement Learning of Drone Aerobatics by Exploiting Geometric Symmetries

Arxiv

0+阅读 · 2月11日

Resilient Topology-Aware Coordination for Dynamic 3D UAV Networks under Node Failure

Arxiv

0+阅读 · 2月10日

ORCHID: Fairness-Aware Orchestration in Mission-Critical Air-Ground Integrated Networks

Arxiv

0+阅读 · 2月10日

AutoFly: Vision-Language-Action Model for UAV Autonomous Navigation in the Wild

Arxiv

0+阅读 · 2月10日

Integrated Sensing, Communication, and Control for UAV-Assisted Mobile Target Tracking

Arxiv

0+阅读 · 2月5日

DeepUrban: Interaction-Aware Trajectory Prediction and Planning for Automated Driving by Aerial Imagery

Arxiv

0+阅读 · 2月3日

3D UAV Trajectory Design for Fair and Energy-Efficient Communication: A Deep Reinforcement Learning Technique

Arxiv

0+阅读 · 1月16日

相关基金

多旋翼无人飞行器大机动轨迹跟踪飞行非线性鲁棒控制

国家自然科学基金

2+阅读 · 2015年12月31日

基于弱监督贝叶斯推断模型的多无人机协同跟踪技术研究

国家自然科学基金

14+阅读 · 2015年12月31日

无人机自主导航中LiDAR点云与图像特征提取与配准方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于确定学习方法的无人水面艇智能控制研究

国家自然科学基金

17+阅读 · 2014年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

20+阅读 · 2013年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

无人机对地目标跟踪与定位的基础理论与关键技术

国家自然科学基金

18+阅读 · 2011年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

无人机协同组网感知融合与传感器管理关键技术研究

国家自然科学基金

27+阅读 · 2011年12月31日

非确定环境下基于分层理论的无人机多机协同控制算法研究

国家自然科学基金

12+阅读 · 2010年12月31日

微信扫码咨询专知VIP会员