Cooperative path planning for heterogeneous UAV swarms poses significant challenges for Multi-Agent Reinforcement Learning (MARL), particularly in handling asymmetric inter-agent dependencies and addressing the risks of sparse rewards and catastrophic forgetting during training. To address these issues, this paper proposes an attentive curriculum learning framework (AC-MASAC). The framework introduces a role-aware heterogeneous attention mechanism to explicitly model asymmetric dependencies. Moreover, a structured curriculum strategy is designed, integrating hierarchical knowledge transfer and stage-proportional experience replay to address the issues of sparse rewards and catastrophic forgetting. The proposed framework is validated on a custom multi-agent simulation platform, and the results show that our method has significant advantages over other advanced methods in terms of Success Rate, Formation Keeping Rate, and Success-weighted Mission Time. The code is available at \textcolor{red}{https://github.com/Wanhao-Liu/AC-MASAC}.


翻译:异构无人机集群的协同路径规划对多智能体强化学习提出了重大挑战,特别是在处理非对称的智能体间依赖关系以及应对训练过程中稀疏奖励和灾难性遗忘的风险方面。为解决这些问题,本文提出了一种注意力课程学习框架。该框架引入了一种角色感知的异构注意力机制,以显式建模非对称依赖关系。此外,设计了一种结构化的课程策略,整合了分层知识迁移和阶段比例经验回放,以应对稀疏奖励和灾难性遗忘问题。所提出的框架在一个定制的多智能体仿真平台上进行了验证,结果表明,在成功率、队形保持率和任务成功加权时间等指标上,我们的方法相较于其他先进方法具有显著优势。代码发布于 \textcolor{red}{https://github.com/Wanhao-Liu/AC-MASAC}。

0
下载
关闭预览

相关内容

《基于分层多智能体强化学习的逼真空战协同策略》
专知会员服务
39+阅读 · 2025年10月30日
异构联邦学习在无人系统中的研究综述
专知会员服务
11+阅读 · 2025年5月25日
基于强化学习的无人机集群对抗策略推演仿真
专知会员服务
69+阅读 · 2024年4月14日
注意力机制可解释吗?这篇ACL 2019论文说……
机器之心
11+阅读 · 2019年6月16日
无人机集群对抗研究的关键问题
无人机
65+阅读 · 2018年9月16日
入门 | 什么是自注意力机制?
机器之心
17+阅读 · 2018年8月19日
【干货】基于Keras的注意力机制实战
专知
59+阅读 · 2018年5月4日
干货!自然语言处理中的自注意力机制!
全球人工智能
11+阅读 · 2018年3月27日
深度学习中的注意力机制
CSDN大数据
24+阅读 · 2017年11月2日
国家自然科学基金
42+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
20+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
27+阅读 · 2011年12月31日
国家自然科学基金
12+阅读 · 2010年12月31日
国家自然科学基金
48+阅读 · 2009年12月31日
VIP会员
相关VIP内容
《基于分层多智能体强化学习的逼真空战协同策略》
专知会员服务
39+阅读 · 2025年10月30日
异构联邦学习在无人系统中的研究综述
专知会员服务
11+阅读 · 2025年5月25日
基于强化学习的无人机集群对抗策略推演仿真
专知会员服务
69+阅读 · 2024年4月14日
相关基金
国家自然科学基金
42+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
20+阅读 · 2013年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
27+阅读 · 2011年12月31日
国家自然科学基金
12+阅读 · 2010年12月31日
国家自然科学基金
48+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员