基于学习的主动碎片清除任务规划中的鲁棒性与适应性评估 (Evaluating Robustness and Adaptability in Learning-Based Mission Planning for Active Debris Removal) - 专知论文

会员服务 ·

0

约束 · 鲁棒 · 任务规划 · 适应性评估 · 轨道 ·

Evaluating Robustness and Adaptability in Learning-Based Mission Planning for Active Debris Removal

翻译：基于学习的主动碎片清除任务规划中的鲁棒性与适应性评估

Agni Bandyopadhyay,Günther Waxenegger-Wilfing

from arxiv, Presented at Conference: International Conference on Space Robotics (ISPARO,2025) At: Sendai,Japan

Autonomous mission planning for Active Debris Removal (ADR) must balance efficiency, adaptability, and strict feasibility constraints on fuel and mission duration. This work compares three planners for the constrained multi-debris rendezvous problem in Low Earth Orbit: a nominal Masked Proximal Policy Optimization (PPO) policy trained under fixed mission parameters, a domain-randomized Masked PPO policy trained across varying mission constraints for improved robustness, and a plain Monte Carlo Tree Search (MCTS) baseline. Evaluations are conducted in a high-fidelity orbital simulation with refueling, realistic transfer dynamics, and randomized debris fields across 300 test cases in nominal, reduced fuel, and reduced mission time scenarios. Results show that nominal PPO achieves top performance when conditions match training but degrades sharply under distributional shift, while domain-randomized PPO exhibits improved adaptability with only moderate loss in nominal performance. MCTS consistently handles constraint changes best due to online replanning but incurs orders-of-magnitude higher computation time. The findings underline a trade-off between the speed of learned policies and the adaptability of search-based methods, and suggest that combining training-time diversity with online planning could be a promising path for future resilient ADR mission planners.

翻译：主动碎片清除（ADR）的自主任务规划必须在效率、适应性与严格的燃料及任务时长可行性约束之间取得平衡。本研究针对低地球轨道中的受约束多碎片交会问题，比较了三种规划器：一种是在固定任务参数下训练的标准掩码近端策略优化（PPO）策略；一种是为提升鲁棒性而在不同任务约束下训练的领域随机化掩码PPO策略；以及一个朴素的蒙特卡洛树搜索（MCTS）基线。评估在一个高保真轨道仿真环境中进行，该环境包含燃料补给、真实的转移动力学以及随机生成的碎片场，并在300个测试案例中覆盖了标称、燃料减少和任务时间减少三种场景。结果表明，当条件与训练环境匹配时，标准PPO策略能取得最佳性能，但在分布偏移下性能急剧下降；而领域随机化PPO策略在标称性能仅有适度损失的情况下，表现出更好的适应性。MCTS由于能够在线重新规划，始终能最好地处理约束变化，但其计算时间高出数个数量级。这些发现揭示了学习策略的速度与基于搜索的方法的适应性之间的权衡，并表明将训练时的多样性与在线规划相结合，可能是未来具有弹性的ADR任务规划器的一条有前景的路径。

0

相关内容

《安全导航：对抗性环境中使用最短路径算法的路线规划》最新60页报告

《安全导航：对抗性环境中使用最短路径算法的路线规划》最新60页报告

专知会员服务

11+阅读 · 3月16日

《基于回归估计、附带损伤优化与发射集成的武器效能评估（RECOIL）系统》

《基于回归估计、附带损伤优化与发射集成的武器效能评估（RECOIL）系统》

专知会员服务

17+阅读 · 2025年11月22日

《推进鲁棒自主系统定位：卷积神经网络标注优化技术》最新博士论文

《推进鲁棒自主系统定位：卷积神经网络标注优化技术》最新博士论文

专知会员服务

16+阅读 · 2025年9月10日

《人工智能在作战决策中的应用：基于强化学习与图神经网络的武器目标分配》

《人工智能在作战决策中的应用：基于强化学习与图神经网络的武器目标分配》

专知会员服务

36+阅读 · 2025年6月30日

《基于图神经网络与强化学习的自主空战决策研究》

《基于图神经网络与强化学习的自主空战决策研究》

专知会员服务

30+阅读 · 2025年5月15日

作战任务智能规划系统设计及关键技术研究

作战任务智能规划系统设计及关键技术研究

专知会员服务

105+阅读 · 2024年4月25日

《基于强化学习的有人-无人飞机编队任务规划：敌方防空压制（SEAD）任务》最新论文

《基于强化学习的有人-无人飞机编队任务规划：敌方防空压制（SEAD）任务》最新论文

专知会员服务

173+阅读 · 2024年1月27日

战术级任务规划方法研究综述

战术级任务规划方法研究综述

专知会员服务

149+阅读 · 2024年1月11日

《评估人工智能和辅助自动化指挥与控制决策辅助工具以提高任务效率的分析框架》

《评估人工智能和辅助自动化指挥与控制决策辅助工具以提高任务效率的分析框架》

专知会员服务

137+阅读 · 2023年7月10日

【AI+军事】美国HRL实验室AAAI2020《基于强化学习的多智能体任务规划》，Multi-Agent Mission Planning with Reinforcement Learning

【AI+军事】美国HRL实验室AAAI2020《基于强化学习的多智能体任务规划》，Multi-Agent Mission Planning with Reinforcement Learning

专知会员服务

236+阅读 · 2022年4月10日

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

专知

13+阅读 · 2022年11月25日

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

专知

73+阅读 · 2022年11月19日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

286页！【军事自主系统】NATO STO最新报告《军事地面自主系统的机动性评估方法和工具》

286页！【军事自主系统】NATO STO最新报告《军事地面自主系统的机动性评估方法和工具》

专知

54+阅读 · 2022年6月4日

Google at KDD 2020，提出MoSE框架显式建模用户行为序列提升多任务学习效果

Google at KDD 2020，提出MoSE框架显式建模用户行为序列提升多任务学习效果

AINLP

11+阅读 · 2020年7月7日

浅谈主动学习（Active Learning）

浅谈主动学习（Active Learning）

凡人机器学习

32+阅读 · 2020年6月18日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

反导任务规划技术丨研究前沿

反导任务规划技术丨研究前沿

科学出版社

25+阅读 · 2019年7月16日

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

泡泡机器人SLAM

14+阅读 · 2019年6月28日

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

10+阅读 · 2019年2月18日

基于复杂耦合时间线的深空探测器自主任务规划方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

动态重构综合模块化航空电子系统适航安全性评估方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

改进智能优化策略多机动目标跟踪方法研究

国家自然科学基金

18+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向任务成功性的可修系统重要度分析及优化

国家自然科学基金

0+阅读 · 2014年12月31日

不确定与动态信息环境下基于预规划-重规划集成建模的应急物流选址-调度鲁棒优化研究

国家自然科学基金

3+阅读 · 2014年12月31日

复杂项目组织能力与任务分配的适应性测度及优化

国家自然科学基金

7+阅读 · 2014年12月31日

高动态环境下低可探测性飞行器自主任务规划方法研究

国家自然科学基金

18+阅读 · 2013年12月31日

不确定环境下基于HTN的应急任务规划方法研究

国家自然科学基金

15+阅读 · 2012年12月31日

基于训练效果的部队作战效能评估及作战计划制订方法研究

国家自然科学基金

96+阅读 · 2009年12月31日

Scalable Multi-Task Learning through Spiking Neural Networks with Adaptive Task-Switching Policy for Intelligent Autonomous Agents

Arxiv

0+阅读 · 3月11日

CRED: Counterfactual Reasoning and Environment Design for Active Preference Learning

Arxiv

0+阅读 · 3月9日

Sparse Offline Reinforcement Learning with Corruption Robustness

Arxiv

0+阅读 · 3月7日

Adversarial Fine-tuning in Offline-to-Online Reinforcement Learning for Robust Robot Control

Arxiv

0+阅读 · 2月27日

Two Constraint Compilation Methods for Lifted Planning

Arxiv

0+阅读 · 2月20日

Effective Task Planning with Missing Objects using Learning-Informed Object Search

Arxiv

0+阅读 · 2月13日

Effective Task Planning with Missing Objects using Learning-Informed Object Search

Arxiv

0+阅读 · 2月12日

Optimizing Mission Planning for Multi-Debris Rendezvous Using Reinforcement Learning with Refueling and Adaptive Collision Avoidance

Arxiv

0+阅读 · 2月4日

An End-to-End Approach for Microgrid Probabilistic Forecasting and Robust Operation via Decision-focused Learning

Arxiv

0+阅读 · 2月3日

Reinforcement Learning for Active Perception in Autonomous Navigation

Arxiv

0+阅读 · 2月1日

VIP会员

文章信息

相关主题

适应性评估

最新内容

美国与以色列如何在攻击伊朗中使用人工智能

美国与以色列如何在攻击伊朗中使用人工智能

专知会员服务

2+阅读 · 今天16:20

《面向大语言模型引导规划、Bandit算法驱动探索与多智能体导航的分层决策问题研究》180页

《面向大语言模型引导规划、Bandit算法驱动探索与多智能体导航的分层决策问题研究》180页

专知会员服务

3+阅读 · 今天14:34

《自动化战略情报管控》

《自动化战略情报管控》

专知会员服务

2+阅读 · 今天14:31

《反无人机蜂群技术研究：基于小队策略构建大规模无人机防御》

《反无人机蜂群技术研究：基于小队策略构建大规模无人机防御》

专知会员服务

3+阅读 · 今天14:23

得失评估：审视对伊朗战争的轨迹（简报）

得失评估：审视对伊朗战争的轨迹（简报）

专知会员服务

2+阅读 · 今天14:19

【CMU博士论文】迈向可解释机器学习的理论基础

【CMU博士论文】迈向可解释机器学习的理论基础

专知会员服务

2+阅读 · 今天12:23

CVPR 2026 | HulluEdit：基于正交子空间编辑的多模态大语言模型幻觉缓解框架

CVPR 2026 | HulluEdit：基于正交子空间编辑的多模态大语言模型幻觉缓解框架

专知会员服务

2+阅读 · 今天12:21

无人机视觉语言导航：研究进展、挑战与技术路线图

无人机视觉语言导航：研究进展、挑战与技术路线图

专知会员服务

2+阅读 · 今天12:13

《基于强化学习的反无人机蜂群拦截优先级排序》

《基于强化学习的反无人机蜂群拦截优先级排序》

专知会员服务

8+阅读 · 今天8:20

乌克兰反无人机方案“天穹哨兵”解析：一款人工智能驱动的近程防空系统

乌克兰反无人机方案“天穹哨兵”解析：一款人工智能驱动的近程防空系统

专知会员服务

3+阅读 · 今天7:30

美军2026条令《指挥官装甲装备维护技能测试计划》

美军2026条令《指挥官装甲装备维护技能测试计划》

专知会员服务

6+阅读 · 今天7:28

《俄罗斯构建服务于人工智能驱动自主性的主权无人机生态系统》（2026报告）

《俄罗斯构建服务于人工智能驱动自主性的主权无人机生态系统》（2026报告）

专知会员服务

7+阅读 · 今天3:09

2026年俄罗斯新型喷气动力无人机Geran-5的技术规格

2026年俄罗斯新型喷气动力无人机Geran-5的技术规格

专知会员服务

4+阅读 · 今天2:50

基于数据优化的人机协同与机器人僚机

基于数据优化的人机协同与机器人僚机

专知会员服务

6+阅读 · 今天2:08

美太空军发布两份聚焦2040年规划的文件：《2040年未来作战环境》和《2040年目标部队》（附文件）

美太空军发布两份聚焦2040年规划的文件：《2040年未来作战环境》和《2040年目标部队》（附文件）

专知会员服务

15+阅读 · 今天1:51

相关VIP内容

《安全导航：对抗性环境中使用最短路径算法的路线规划》最新60页报告

《安全导航：对抗性环境中使用最短路径算法的路线规划》最新60页报告

专知会员服务

11+阅读 · 3月16日

《基于回归估计、附带损伤优化与发射集成的武器效能评估（RECOIL）系统》

《基于回归估计、附带损伤优化与发射集成的武器效能评估（RECOIL）系统》

专知会员服务

17+阅读 · 2025年11月22日

《推进鲁棒自主系统定位：卷积神经网络标注优化技术》最新博士论文

《推进鲁棒自主系统定位：卷积神经网络标注优化技术》最新博士论文

专知会员服务

16+阅读 · 2025年9月10日

《人工智能在作战决策中的应用：基于强化学习与图神经网络的武器目标分配》

《人工智能在作战决策中的应用：基于强化学习与图神经网络的武器目标分配》

专知会员服务

36+阅读 · 2025年6月30日

《基于图神经网络与强化学习的自主空战决策研究》

《基于图神经网络与强化学习的自主空战决策研究》

专知会员服务

30+阅读 · 2025年5月15日

作战任务智能规划系统设计及关键技术研究

作战任务智能规划系统设计及关键技术研究

专知会员服务

105+阅读 · 2024年4月25日

《基于强化学习的有人-无人飞机编队任务规划：敌方防空压制（SEAD）任务》最新论文

《基于强化学习的有人-无人飞机编队任务规划：敌方防空压制（SEAD）任务》最新论文

专知会员服务

173+阅读 · 2024年1月27日

战术级任务规划方法研究综述

战术级任务规划方法研究综述

专知会员服务

149+阅读 · 2024年1月11日

《评估人工智能和辅助自动化指挥与控制决策辅助工具以提高任务效率的分析框架》

《评估人工智能和辅助自动化指挥与控制决策辅助工具以提高任务效率的分析框架》

专知会员服务

137+阅读 · 2023年7月10日

【AI+军事】美国HRL实验室AAAI2020《基于强化学习的多智能体任务规划》，Multi-Agent Mission Planning with Reinforcement Learning

【AI+军事】美国HRL实验室AAAI2020《基于强化学习的多智能体任务规划》，Multi-Agent Mission Planning with Reinforcement Learning

专知会员服务

236+阅读 · 2022年4月10日

热门VIP内容

开通专知VIP会员享更多权益服务

《面向大语言模型引导规划、Bandit算法驱动探索与多智能体导航的分层决策问题研究》180页

《反无人机蜂群技术研究：基于小队策略构建大规模无人机防御》

美国与以色列如何在攻击伊朗中使用人工智能

《自动化战略情报管控》

相关资讯

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

专知

13+阅读 · 2022年11月25日

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

专知

73+阅读 · 2022年11月19日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

286页！【军事自主系统】NATO STO最新报告《军事地面自主系统的机动性评估方法和工具》

286页！【军事自主系统】NATO STO最新报告《军事地面自主系统的机动性评估方法和工具》

专知

54+阅读 · 2022年6月4日

Google at KDD 2020，提出MoSE框架显式建模用户行为序列提升多任务学习效果

Google at KDD 2020，提出MoSE框架显式建模用户行为序列提升多任务学习效果

AINLP

11+阅读 · 2020年7月7日

浅谈主动学习（Active Learning）

浅谈主动学习（Active Learning）

凡人机器学习

32+阅读 · 2020年6月18日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

反导任务规划技术丨研究前沿

反导任务规划技术丨研究前沿

科学出版社

25+阅读 · 2019年7月16日

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

泡泡机器人SLAM

14+阅读 · 2019年6月28日

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

10+阅读 · 2019年2月18日

相关论文

Scalable Multi-Task Learning through Spiking Neural Networks with Adaptive Task-Switching Policy for Intelligent Autonomous Agents

Arxiv

0+阅读 · 3月11日

CRED: Counterfactual Reasoning and Environment Design for Active Preference Learning

Arxiv

0+阅读 · 3月9日

Sparse Offline Reinforcement Learning with Corruption Robustness

Arxiv

0+阅读 · 3月7日

Adversarial Fine-tuning in Offline-to-Online Reinforcement Learning for Robust Robot Control

Arxiv

0+阅读 · 2月27日

Two Constraint Compilation Methods for Lifted Planning

Arxiv

0+阅读 · 2月20日

Effective Task Planning with Missing Objects using Learning-Informed Object Search

Arxiv

0+阅读 · 2月13日

Effective Task Planning with Missing Objects using Learning-Informed Object Search

Arxiv

0+阅读 · 2月12日

Optimizing Mission Planning for Multi-Debris Rendezvous Using Reinforcement Learning with Refueling and Adaptive Collision Avoidance

Arxiv

0+阅读 · 2月4日

An End-to-End Approach for Microgrid Probabilistic Forecasting and Robust Operation via Decision-focused Learning

Arxiv

0+阅读 · 2月3日

Reinforcement Learning for Active Perception in Autonomous Navigation

Arxiv

0+阅读 · 2月1日

相关基金

基于复杂耦合时间线的深空探测器自主任务规划方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

动态重构综合模块化航空电子系统适航安全性评估方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

改进智能优化策略多机动目标跟踪方法研究

国家自然科学基金

18+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向任务成功性的可修系统重要度分析及优化

国家自然科学基金

0+阅读 · 2014年12月31日

不确定与动态信息环境下基于预规划-重规划集成建模的应急物流选址-调度鲁棒优化研究

国家自然科学基金

3+阅读 · 2014年12月31日

复杂项目组织能力与任务分配的适应性测度及优化

国家自然科学基金

7+阅读 · 2014年12月31日

高动态环境下低可探测性飞行器自主任务规划方法研究

国家自然科学基金

18+阅读 · 2013年12月31日

不确定环境下基于HTN的应急任务规划方法研究

国家自然科学基金

15+阅读 · 2012年12月31日

基于训练效果的部队作战效能评估及作战计划制订方法研究

国家自然科学基金

96+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员