The target defense problem (TDP) for unmanned surface vehicles (USVs) concerns intercepting an adversarial USV before it breaches a designated target region, using one or more defending USVs. A particularly challenging scenario arises when the attacker exhibits superior maneuverability compared to the defenders, significantly complicating effective interception. To tackle this challenge, this letter introduces ARBoids, a novel adaptive residual reinforcement learning framework that integrates deep reinforcement learning (DRL) with the biologically inspired, force-based Boids model. Within this framework, the Boids model serves as a computationally efficient baseline policy for multi-agent coordination, while DRL learns a residual policy to adaptively refine and optimize the defenders' actions. The proposed approach is validated in a high-fidelity Gazebo simulation environment, demonstrating superior performance over traditional interception strategies, including pure force-based approaches and vanilla DRL policies. Furthermore, the learned policy exhibits strong adaptability to attackers with diverse maneuverability profiles, highlighting its robustness and generalization capability. The code of ARBoids will be released upon acceptance of this letter.


翻译:无人水面艇(USV)的目标防御问题(TDP)涉及使用一艘或多艘防御性USV,在敌方USV突破指定目标区域前进行拦截。当攻击者展现出比防御者更优越的机动性时,会出现一个极具挑战性的场景,这显著增加了有效拦截的难度。为应对这一挑战,本文提出了ARBoids,一种新颖的自适应残差强化学习框架,该框架将深度强化学习(DRL)与受生物启发的、基于力的Boids模型相结合。在此框架中,Boids模型作为多智能体协调的计算高效基线策略,而DRL则学习一个残差策略,以自适应地优化和调整防御者的行动。所提出的方法在高保真Gazebo仿真环境中得到验证,显示出优于传统拦截策略(包括纯基于力的方法和原始DRL策略)的性能。此外,学习到的策略对具有不同机动性特征的攻击者表现出强大的适应能力,突显了其鲁棒性和泛化能力。ARBoids的代码将在本文被接受后发布。

0
下载
关闭预览

相关内容

《无人水面舰艇行动中的 AI 摄像机功能研究》最新93页
专知会员服务
30+阅读 · 2024年10月15日
“美国陆军机动短程防空(M-SHORAD)系统”最新情况
专知会员服务
26+阅读 · 2024年9月6日
美军“系列混合电力推进飞机演示(SHEPARD)”计划
专知会员服务
24+阅读 · 2024年7月18日
敏捷作战部署(ACE)概念
专知会员服务
85+阅读 · 2024年7月4日
MonoGRNet:单目3D目标检测的通用框架(TPAMI2021)
专知会员服务
18+阅读 · 2021年5月3日
【AAAI2021】“可瘦身”的生成式对抗网络
专知会员服务
13+阅读 · 2020年12月12日
AAAI 2022 | ProtGNN:自解释图神经网络
专知
10+阅读 · 2022年2月28日
3倍加速CPU上的BERT模型部署
ApacheMXNet
11+阅读 · 2020年7月13日
【NeurIPS2019】图变换网络:Graph Transformer Network
多项NLP任务新SOTA,Facebook提出预训练模型BART
机器之心
22+阅读 · 2019年11月4日
美国“忠诚僚机”项目概念与技术现状
无人机
12+阅读 · 2018年11月1日
Single-Shot Object Detection with Enriched Semantics
统计学习与视觉计算组
14+阅读 · 2018年8月29日
国家自然科学基金
13+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
51+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Arxiv
18+阅读 · 2024年12月27日
Arxiv
175+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
499+阅读 · 2023年3月31日
VIP会员
相关基金
国家自然科学基金
13+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
51+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员