Cooperative path planning for heterogeneous UAV swarms poses significant challenges for Multi-Agent Reinforcement Learning (MARL), particularly in handling asymmetric inter-agent dependencies and addressing the risks of sparse rewards and catastrophic forgetting during training. To address these issues, this paper proposes an attentive curriculum learning framework (AC-MASAC). The framework introduces a role-aware heterogeneous attention mechanism to explicitly model asymmetric dependencies. Moreover, a structured curriculum strategy is designed, integrating hierarchical knowledge transfer and stage-proportional experience replay to address the issues of sparse rewards and catastrophic forgetting. The proposed framework is validated on a custom multi-agent simulation platform, and the results show that our method has significant advantages over other advanced methods in terms of Success Rate, Formation Keeping Rate, and Success-weighted Mission Time. The code is available at \textcolor{red}{https://github.com/Wanhao-Liu/AC-MASAC}.


翻译:异构无人机集群的协同路径规划对多智能体强化学习提出了重大挑战,特别是在处理非对称的智能体间依赖关系以及应对训练过程中稀疏奖励和灾难性遗忘的风险方面。为解决这些问题,本文提出了一种注意力课程学习框架。该框架引入了一种角色感知的异构注意力机制,以显式建模非对称依赖关系。此外,设计了一种结构化的课程策略,整合了分层知识迁移和阶段比例经验回放,以应对稀疏奖励和灾难性遗忘问题。所提出的框架在一个定制的多智能体仿真平台上进行了验证,结果表明,在成功率、队形保持率和任务成功加权时间等指标上,我们的方法相较于其他先进方法具有显著优势。代码发布于 \textcolor{red}{https://github.com/Wanhao-Liu/AC-MASAC}。

0
下载
关闭预览

相关内容

《基于分层多智能体强化学习的逼真空战协同策略》
专知会员服务
43+阅读 · 2025年10月30日
异构联邦学习在无人系统中的研究综述
专知会员服务
12+阅读 · 2025年5月25日
基于强化学习的无人机集群对抗策略推演仿真
专知会员服务
70+阅读 · 2024年4月14日
注意力机制可解释吗?这篇ACL 2019论文说……
机器之心
11+阅读 · 2019年6月16日
无人机集群对抗研究的关键问题
无人机
65+阅读 · 2018年9月16日
入门 | 什么是自注意力机制?
机器之心
17+阅读 · 2018年8月19日
【干货】基于Keras的注意力机制实战
专知
59+阅读 · 2018年5月4日
干货!自然语言处理中的自注意力机制!
全球人工智能
11+阅读 · 2018年3月27日
深度学习中的注意力机制
人工智能头条
16+阅读 · 2017年11月2日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
27+阅读 · 2011年12月31日
国家自然科学基金
12+阅读 · 2010年12月31日
国家自然科学基金
49+阅读 · 2009年12月31日
VIP会员
最新内容
最新“指挥控制”领域出版物合集(简介)
专知会员服务
1+阅读 · 今天15:19
面向军事作战需求开发的人工智能(RAIMOND)
专知会员服务
3+阅读 · 今天15:13
软件定义多域战术网络:基础与未来方向(综述)
水下战战术决策中的气象与海洋预报(50页报告)
远程空中优势:新一代超视距导弹的兴起
专知会员服务
1+阅读 · 今天14:45
大语言模型溯因推理的统一分类学与综述
专知会员服务
0+阅读 · 今天12:07
相关VIP内容
《基于分层多智能体强化学习的逼真空战协同策略》
专知会员服务
43+阅读 · 2025年10月30日
异构联邦学习在无人系统中的研究综述
专知会员服务
12+阅读 · 2025年5月25日
基于强化学习的无人机集群对抗策略推演仿真
专知会员服务
70+阅读 · 2024年4月14日
相关资讯
相关基金
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
27+阅读 · 2011年12月31日
国家自然科学基金
12+阅读 · 2010年12月31日
国家自然科学基金
49+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员