Autonomous Unmanned Aerial Vehicle (UAV) swarms are increasingly used as rapidly deployable aerial relays and sensing platforms, yet practical deployments must operate under partial observability and intermittent peer-to-peer links. We present a graph-based multi-agent reinforcement learning framework trained under centralized training with decentralized execution (CTDE): a centralized critic and global state are available only during training, while each UAV executes a shared policy using local observations and messages from nearby neighbors. Our architecture encodes local agent state and nearby entities with an agent-entity attention module, and aggregates inter-UAV messages with neighbor self-attention over a distance-limited communication graph. We evaluate primarily on a cooperative relay deployment task (DroneConnect) and secondarily on an adversarial engagement task (DroneCombat). In DroneConnect, the proposed method achieves high coverage under restricted communication and partial observation (e.g. 74% coverage with M = 5 UAVs and N = 10 nodes) while remaining competitive with a mixed-integer linear programming (MILP) optimization-based offline upper bound, and it generalizes to unseen team sizes without fine-tuning. In the adversarial setting, the same framework transfers without architectural changes and improves win rate over non-communicating baselines.


翻译:自主无人机群正日益被用作快速部署的空中中继与感知平台,然而实际部署必须在部分可观测性与间歇性点对点链路的条件下运行。我们提出了一种基于图的多智能体强化学习框架,采用集中训练与分散执行(CTDE)进行训练:集中式评论器与全局状态仅在训练期间可用,而每架无人机使用局部观测与来自邻近邻居的消息执行共享策略。我们的架构通过智能体-实体注意力模块编码局部智能体状态与邻近实体,并在距离受限的通信图上通过邻居自注意力聚合无人机间消息。我们主要在协同中继部署任务(DroneConnect)上进行评估,并在对抗性交战任务(DroneCombat)上进行次要评估。在DroneConnect中,所提方法在受限通信与部分观测条件下实现了高覆盖率(例如,当M = 5架无人机、N = 10个节点时覆盖率达74%),同时与基于混合整数线性规划(MILP)优化的离线上界保持竞争力,并且无需微调即可泛化至未见过的团队规模。在对抗性场景中,同一框架无需架构修改即可迁移,并相比无通信基线提高了胜率。

0
下载
关闭预览

相关内容

《抗干扰协同无人机中继网络的多智能体深度强化学习》
专知会员服务
26+阅读 · 2025年12月31日
多智能体强化学习中的稳健且高效的通信
专知会员服务
25+阅读 · 2025年11月17日
《基于分层多智能体强化学习的逼真空战协同策略》
专知会员服务
42+阅读 · 2025年10月30日
《合作多智能体强化学习:简介》最新65页
专知会员服务
41+阅读 · 2025年1月13日
基于强化学习的无人机集群对抗策略推演仿真
专知会员服务
70+阅读 · 2024年4月14日
基于通信的多智能体强化学习进展综述
专知会员服务
112+阅读 · 2022年11月12日
「基于通信的多智能体强化学习」 进展综述
国外有人/无人平台协同作战概述
无人机
122+阅读 · 2019年5月28日
深度学习在自动驾驶感知领域的应用
AI100
11+阅读 · 2019年3月6日
无人机蜂群作战技术与多智能体系统理论
无人机
42+阅读 · 2019年1月27日
智能无人机集群技术概述
无人机
46+阅读 · 2018年2月28日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
20+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
27+阅读 · 2011年12月31日
国家自然科学基金
48+阅读 · 2009年12月31日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
20+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
27+阅读 · 2011年12月31日
国家自然科学基金
48+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员