Imitation learning-based spacecraft rendezvous and docking method with Expert Demonstration - 专知论文

会员服务 ·

0

对接 · 演示 · 模仿学习 · 鲁棒 · 解码 ·

Imitation learning-based spacecraft rendezvous and docking method with Expert Demonstration

翻译：基于专家演示的模仿学习航天器交会对接方法

Shibo Shao,Dong Zhou,Guanghui Sun,Liwen Zhang,Mingxuan Jiang

from arxiv, 6 figures, 4 tables. Focus on 6-DOF spacecraft rendezvous and docking control using imitation learning-based control method

Existing spacecraft rendezvous and docking control methods largely rely on predefined dynamic models and often exhibit limited robustness in realistic on-orbit environments. To address this issue, this paper proposes an Imitation Learning-based spacecraft rendezvous and docking control framework (IL-SRD) that directly learns control policies from expert demonstrations, thereby reducing dependence on accurate modeling. We propose an anchored decoder target mechanism, which conditions the decoder queries on state-related anchors to explicitly constrain the control generation process. This mechanism enforces physically consistent control evolution and effectively suppresses implausible action deviations in sequential prediction, enabling reliable six-degree-of-freedom (6-DOF) rendezvous and docking control. To further enhance stability, a temporal aggregation mechanism is incorporated to mitigate error accumulation caused by the sequential prediction nature of Transformer-based models, where small inaccuracies at each time step can propagate and amplify over long horizons. Extensive simulation results demonstrate that the proposed IL-SRD framework achieves accurate and energy-efficient model-free rendezvous and docking control. Robustness evaluations further confirm its capability to maintain competitive performance under significant unknown disturbances. The source code is available at https://github.com/Dongzhou-1996/IL-SRD.

翻译：现有的航天器交会对接控制方法主要依赖于预定义动力学模型，在实际在轨环境中往往表现出有限的鲁棒性。为解决这一问题，本文提出一种基于模仿学习的航天器交会对接控制框架（IL-SRD），该框架直接从专家演示中学习控制策略，从而降低对精确建模的依赖。我们提出了一种锚定解码器目标机制，该机制将解码器查询条件建立在状态相关的锚点上，以显式约束控制生成过程。该机制强制实现物理一致的控制演化，并有效抑制序列预测中不合理的动作偏差，从而实现可靠的六自由度（6-DOF）交会对接控制。为进一步增强稳定性，本框架引入了时序聚合机制，以缓解基于Transformer的模型因序列预测特性导致的误差累积问题——即每个时间步的微小不准确性可能在长时域中传播并放大。大量仿真结果表明，所提出的IL-SRD框架能够实现精确且节能的无模型交会对接控制。鲁棒性评估进一步证实了其在显著未知扰动下保持竞争优势的能力。源代码发布于 https://github.com/Dongzhou-1996/IL-SRD。

0

相关内容

《利用亚纳秒级授时与增强型分布式计算的太空域建模与仿真》报告

《利用亚纳秒级授时与增强型分布式计算的太空域建模与仿真》报告

专知会员服务

19+阅读 · 1月15日

航天器非脆弱控制理论及应用研究进展

航天器非脆弱控制理论及应用研究进展

专知会员服务

10+阅读 · 2025年7月8日

《基于深度学习预测模拟场景中的飞行器与导弹轨迹》2025最新73页

《基于深度学习预测模拟场景中的飞行器与导弹轨迹》2025最新73页

专知会员服务

24+阅读 · 2025年6月25日

《基于机器学习方法加速导弹-飞机碰撞模拟与轨迹预测》最新107页

《基于机器学习方法加速导弹-飞机碰撞模拟与轨迹预测》最新107页

专知会员服务

25+阅读 · 2025年3月25日

《综述：强化学习在航空中的应用》第一份调查航空领域RL方法的研究论文，2022最新论文

《综述：强化学习在航空中的应用》第一份调查航空领域RL方法的研究论文，2022最新论文

专知会员服务

49+阅读 · 2022年11月15日

《微型浮动航天器模拟器的原型设计和测试》美国海军2022最新117页报告

《微型浮动航天器模拟器的原型设计和测试》美国海军2022最新117页报告

专知会员服务

31+阅读 · 2022年9月12日

机器人运动轨迹的模仿学习综述

机器人运动轨迹的模仿学习综述

专知会员服务

45+阅读 · 2021年6月8日

最新《模仿学习(Imitation Learning》进展报告, 加州理工Yisong Yue教授，附下载

最新《模仿学习(Imitation Learning》进展报告, 加州理工Yisong Yue教授，附下载

专知会员服务

41+阅读 · 2020年12月6日

【NeurIPS 2020】生成对抗性模仿学习的f-Divergence

【NeurIPS 2020】生成对抗性模仿学习的f-Divergence

专知会员服务

26+阅读 · 2020年10月9日

【CoRL2019最佳论文】模仿学习，A Divergence Minimization Perspective on Imitation Learning Methods

【CoRL2019最佳论文】模仿学习，A Divergence Minimization Perspective on Imitation Learning Methods

专知会员服务

24+阅读 · 2019年11月11日

《开发新型飞行器数字孪生原型的框架》北约科学与技术组织2022最新14页技术报告

《开发新型飞行器数字孪生原型的框架》北约科学与技术组织2022最新14页技术报告

专知

24+阅读 · 2022年10月24日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

66+阅读 · 2022年8月25日

推荐！【中文版】美国海军研究实验室《将机器学习异常检测技术应用于美国海军空间系统运行》43页技术报告

推荐！【中文版】美国海军研究实验室《将机器学习异常检测技术应用于美国海军空间系统运行》43页技术报告

专知

33+阅读 · 2022年7月13日

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

专知

15+阅读 · 2022年2月16日

【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架

【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架

专知

20+阅读 · 2020年5月26日

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

专知

72+阅读 · 2020年2月29日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

NLP实践：对话系统技术原理和应用

NLP实践：对话系统技术原理和应用

AI100

34+阅读 · 2019年3月20日

【CVPR Oral】TensorFlow实现StarGAN代码全部开源，1天训练完

【CVPR Oral】TensorFlow实现StarGAN代码全部开源，1天训练完

新智元

12+阅读 · 2018年6月13日

基于磁悬浮飞轮转子转轴主动偏转的航天器高稳定度姿态控制方法

国家自然科学基金

1+阅读 · 2016年12月31日

空间非合作目标基于点云模型的视觉与惯性融合相对导航方法与实验研究

国家自然科学基金

17+阅读 · 2015年12月31日

多用途载人航天器时间触发系统的容错和柔性调度方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

GNSS仿真模型服务化共享关键技术研究

国家自然科学基金

9+阅读 · 2015年12月31日

几何/拓扑混合空间中的仿生导航方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

在轨航天器诊断策略自动构建与学习调控方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂低空飞行中机会信号导航的信号优选及融合定位方法研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于多物理场监测的大型高精度复合材料航天器结构胶接变形与失效研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于螺旋理论的空间近距离相对运动建模方法与姿轨耦合控制研究

国家自然科学基金

0+阅读 · 2014年12月31日

高安全性环月轨道遥操作交会人机联合共享控制

国家自然科学基金

2+阅读 · 2014年12月31日

RFS: Reinforcement Learning with Residual Flow Steering for Dexterous Manipulation

Arxiv

0+阅读 · 2月5日

RFS: Reinforcement learning with Residual flow steering for dexterous manipulation

Arxiv

0+阅读 · 2月3日

Safe Learning for Contact-Rich Robot Tasks: A Survey from Classical Learning-Based Methods to Safe Foundation Models

Arxiv

0+阅读 · 1月26日

Learning a Unified Latent Space for Cross-Embodiment Robot Control

Arxiv

0+阅读 · 1月21日

Learning on the Fly: Rapid Policy Adaptation via Differentiable Simulation

Arxiv

0+阅读 · 1月14日

Interactive and Hybrid Imitation Learning: Provably Beating Behavior Cloning

Arxiv

0+阅读 · 1月13日

Agile Tradespace Exploration for Space Rendezvous Mission Design via Transformers

Arxiv

0+阅读 · 1月11日

Learning specifications for reactive synthesis with safety constraints

Arxiv

0+阅读 · 1月9日

Solving Robotics Tasks with Prior Demonstration via Exploration-Efficient Deep Reinforcement Learning

Arxiv

0+阅读 · 1月8日

Coupled Distributional Random Expert Distillation for World Model Online Imitation Learning

Arxiv

0+阅读 · 1月4日

VIP会员

文章信息

相关主题

最新内容

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

1+阅读 · 今天14:49

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

3+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

5+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

7+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

10+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

11+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

7+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

15+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

8+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

6+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

8+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

相关VIP内容

《利用亚纳秒级授时与增强型分布式计算的太空域建模与仿真》报告

《利用亚纳秒级授时与增强型分布式计算的太空域建模与仿真》报告

专知会员服务

19+阅读 · 1月15日

航天器非脆弱控制理论及应用研究进展

航天器非脆弱控制理论及应用研究进展

专知会员服务

10+阅读 · 2025年7月8日

《基于深度学习预测模拟场景中的飞行器与导弹轨迹》2025最新73页

《基于深度学习预测模拟场景中的飞行器与导弹轨迹》2025最新73页

专知会员服务

24+阅读 · 2025年6月25日

《基于机器学习方法加速导弹-飞机碰撞模拟与轨迹预测》最新107页

《基于机器学习方法加速导弹-飞机碰撞模拟与轨迹预测》最新107页

专知会员服务

25+阅读 · 2025年3月25日

《综述：强化学习在航空中的应用》第一份调查航空领域RL方法的研究论文，2022最新论文

《综述：强化学习在航空中的应用》第一份调查航空领域RL方法的研究论文，2022最新论文

专知会员服务

49+阅读 · 2022年11月15日

《微型浮动航天器模拟器的原型设计和测试》美国海军2022最新117页报告

《微型浮动航天器模拟器的原型设计和测试》美国海军2022最新117页报告

专知会员服务

31+阅读 · 2022年9月12日

机器人运动轨迹的模仿学习综述

机器人运动轨迹的模仿学习综述

专知会员服务

45+阅读 · 2021年6月8日

最新《模仿学习(Imitation Learning》进展报告, 加州理工Yisong Yue教授，附下载

最新《模仿学习(Imitation Learning》进展报告, 加州理工Yisong Yue教授，附下载

专知会员服务

41+阅读 · 2020年12月6日

【NeurIPS 2020】生成对抗性模仿学习的f-Divergence

【NeurIPS 2020】生成对抗性模仿学习的f-Divergence

专知会员服务

26+阅读 · 2020年10月9日

【CoRL2019最佳论文】模仿学习，A Divergence Minimization Perspective on Imitation Learning Methods

【CoRL2019最佳论文】模仿学习，A Divergence Minimization Perspective on Imitation Learning Methods

专知会员服务

24+阅读 · 2019年11月11日

热门VIP内容

开通专知VIP会员享更多权益服务

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

相关资讯

《开发新型飞行器数字孪生原型的框架》北约科学与技术组织2022最新14页技术报告

《开发新型飞行器数字孪生原型的框架》北约科学与技术组织2022最新14页技术报告

专知

24+阅读 · 2022年10月24日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

66+阅读 · 2022年8月25日

推荐！【中文版】美国海军研究实验室《将机器学习异常检测技术应用于美国海军空间系统运行》43页技术报告

推荐！【中文版】美国海军研究实验室《将机器学习异常检测技术应用于美国海军空间系统运行》43页技术报告

专知

33+阅读 · 2022年7月13日

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

专知

15+阅读 · 2022年2月16日

【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架

【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架

专知

20+阅读 · 2020年5月26日

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

元迁移学习的小样本学习，Meta-transfer Learning for Few-shot Learning，33页ppt

专知

72+阅读 · 2020年2月29日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

NLP实践：对话系统技术原理和应用

NLP实践：对话系统技术原理和应用

AI100

34+阅读 · 2019年3月20日

【CVPR Oral】TensorFlow实现StarGAN代码全部开源，1天训练完

【CVPR Oral】TensorFlow实现StarGAN代码全部开源，1天训练完

新智元

12+阅读 · 2018年6月13日

相关论文

RFS: Reinforcement Learning with Residual Flow Steering for Dexterous Manipulation

Arxiv

0+阅读 · 2月5日

RFS: Reinforcement learning with Residual flow steering for dexterous manipulation

Arxiv

0+阅读 · 2月3日

Safe Learning for Contact-Rich Robot Tasks: A Survey from Classical Learning-Based Methods to Safe Foundation Models

Arxiv

0+阅读 · 1月26日

Learning a Unified Latent Space for Cross-Embodiment Robot Control

Arxiv

0+阅读 · 1月21日

Learning on the Fly: Rapid Policy Adaptation via Differentiable Simulation

Arxiv

0+阅读 · 1月14日

Interactive and Hybrid Imitation Learning: Provably Beating Behavior Cloning

Arxiv

0+阅读 · 1月13日

Agile Tradespace Exploration for Space Rendezvous Mission Design via Transformers

Arxiv

0+阅读 · 1月11日

Learning specifications for reactive synthesis with safety constraints

Arxiv

0+阅读 · 1月9日

Solving Robotics Tasks with Prior Demonstration via Exploration-Efficient Deep Reinforcement Learning

Arxiv

0+阅读 · 1月8日

Coupled Distributional Random Expert Distillation for World Model Online Imitation Learning

Arxiv

0+阅读 · 1月4日

相关基金

基于磁悬浮飞轮转子转轴主动偏转的航天器高稳定度姿态控制方法

国家自然科学基金

1+阅读 · 2016年12月31日

空间非合作目标基于点云模型的视觉与惯性融合相对导航方法与实验研究

国家自然科学基金

17+阅读 · 2015年12月31日

多用途载人航天器时间触发系统的容错和柔性调度方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

GNSS仿真模型服务化共享关键技术研究

国家自然科学基金

9+阅读 · 2015年12月31日

几何/拓扑混合空间中的仿生导航方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

在轨航天器诊断策略自动构建与学习调控方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂低空飞行中机会信号导航的信号优选及融合定位方法研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于多物理场监测的大型高精度复合材料航天器结构胶接变形与失效研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于螺旋理论的空间近距离相对运动建模方法与姿轨耦合控制研究

国家自然科学基金

0+阅读 · 2014年12月31日

高安全性环月轨道遥操作交会人机联合共享控制

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员