水下航行器六自由度位置控制的快速策略学习 (Fast Policy Learning for 6-DOF Position Control of Underwater Vehicles) - 专知论文

会员服务 ·

0

水下 · 六自由度 · 自由度 · 水下航行器 · 扰动 ·

Fast Policy Learning for 6-DOF Position Control of Underwater Vehicles

翻译：水下航行器六自由度位置控制的快速策略学习

Sümer Tunçay,Alain Andres,Ignacio Carlucho

Autonomous Underwater Vehicles (AUVs) require reliable six-degree-of-freedom (6-DOF) position control to operate effectively in complex and dynamic marine environments. Traditional controllers are effective under nominal conditions but exhibit degraded performance when faced with unmodeled dynamics or environmental disturbances. Reinforcement learning (RL) provides a powerful alternative but training is typically slow and sim-to-real transfer remains challenging. This work introduces a GPU accelerated RL training pipeline built in JAX and MuJoCo-XLA (MJX). By jointly JIT-compiling large-scale parallel physics simulation and learning updates, we achieve training times of under two minutes. Through systematic evaluation of multiple RL algorithms, we show robust 6-DOF trajectory tracking and effective disturbance rejection in real underwater experiments, with policies transferred zero-shot from simulation.

翻译：自主水下航行器（AUVs）需具备可靠的六自由度（6-DOF）位置控制能力，方能在复杂动态的海洋环境中有效作业。传统控制器在标称条件下表现良好，但在面对未建模动力学或环境扰动时性能显著下降。强化学习（RL）提供了一种强有力的替代方案，但其训练通常耗时较长，且仿真到实体的迁移仍具挑战性。本研究提出了一种基于JAX与MuJoCo-XLA（MJX）构建的GPU加速RL训练流程。通过将大规模并行物理仿真与学习更新进行联合即时编译，我们实现了两分钟以内的训练时间。通过对多种RL算法的系统评估，我们在真实水下实验中展示了稳健的六自由度轨迹跟踪与有效的扰动抑制能力，且策略实现了从仿真到实体的零样本迁移。

0

相关内容

隐身自主无人水下航行器技术如何变革水下作战并重塑海军竞争

隐身自主无人水下航行器技术如何变革水下作战并重塑海军竞争

专知会员服务

11+阅读 · 2025年12月15日

美海军专利《球形自主水下航行器》

美海军专利《球形自主水下航行器》

专知会员服务

22+阅读 · 2025年2月4日

《水下航行器：设计与应用》112页

《水下航行器：设计与应用》112页

专知会员服务

40+阅读 · 2024年9月15日

自主水下航行器集群组网技术发展与展望

自主水下航行器集群组网技术发展与展望

专知会员服务

37+阅读 · 2024年4月26日

《无人水面航行器的集群协同优化》131页

《无人水面航行器的集群协同优化》131页

专知会员服务

74+阅读 · 2024年3月30日

水下航行器视觉控制技术综述

水下航行器视觉控制技术综述

专知会员服务

49+阅读 · 2024年1月9日

自主水下航行器路径规划技术综述及展望

自主水下航行器路径规划技术综述及展望

专知会员服务

56+阅读 · 2023年7月6日

《自主水下航行器编队综述：性能、编队控制和通信能力》大连海事大学27页综述论文

《自主水下航行器编队综述：性能、编队控制和通信能力》大连海事大学27页综述论文

专知会员服务

41+阅读 · 2022年12月25日

《远程自主水下航行器性能研究：增强AUV续航能力》2022最新博士论文，瑞典皇家理工学院

《远程自主水下航行器性能研究：增强AUV续航能力》2022最新博士论文，瑞典皇家理工学院

专知会员服务

37+阅读 · 2022年12月25日

【深海自主导航定位】《自主水下航行器多模型交互估计的信息论方法》2022最新154页论文，美国海军研究生院

【深海自主导航定位】《自主水下航行器多模型交互估计的信息论方法》2022最新154页论文，美国海军研究生院

专知会员服务

63+阅读 · 2022年10月27日

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

专知

71+阅读 · 2022年11月19日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

自动驾驶技术解读——自动驾驶汽车决策控制系统

自动驾驶技术解读——自动驾驶汽车决策控制系统

智能交通技术

30+阅读 · 2019年7月7日

前沿：水下机器人及其导航系统

前沿：水下机器人及其导航系统

科学出版社

11+阅读 · 2019年6月22日

自动驾驶车辆定位技术概述｜厚势汽车

自动驾驶车辆定位技术概述｜厚势汽车

厚势

10+阅读 · 2019年5月16日

【学科发展报告】无人船

【学科发展报告】无人船

中国自动化学会

29+阅读 · 2019年1月8日

国外无人水下航行器装备与技术现状及展望

国外无人水下航行器装备与技术现状及展望

无人机

14+阅读 · 2018年1月11日

水下无人系统发展现状及关键技术

水下无人系统发展现状及关键技术

无人机

21+阅读 · 2018年1月5日

无人艇的发展趋势

无人艇的发展趋势

无人机

13+阅读 · 2017年11月6日

无人机飞行控制方法概述

无人机飞行控制方法概述

无人机

12+阅读 · 2017年10月7日

基于边界辨识的水下航行器低频线谱主动调控

国家自然科学基金

2+阅读 · 2015年12月31日

动态不确定性条件下基于混杂约束满足问题的水下移动传感器网络节点自定位方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于线结构光的水下自主作业系统目标识别与定位方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

自主式水下机器人推进器的故障诊断与容错控制方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

在轨航天器诊断策略自动构建与学习调控方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

水下机器人可重构控制系统可靠性分析研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于制导-控制结构的船舶非线性协调编队控制方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

复杂环境下异构自主海洋航行器网络的协同优化控制

国家自然科学基金

2+阅读 · 2015年12月31日

基于确定学习方法的无人水面艇智能控制研究

国家自然科学基金

17+阅读 · 2014年12月31日

重力/重力梯度补偿水下惯性导航系统理论和算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

Efficient Knowledge Transfer for Jump-Starting Control Policy Learning of Multirotors through Physics-Aware Neural Architectures

Arxiv

0+阅读 · 2月17日

Constrained PSO Six-Parameter Fuzzy PID Tuning Method for Balanced Optimization of Depth Tracking Performance in Underwater Vehicles

Arxiv

0+阅读 · 2月13日

Multi-Task Reinforcement Learning of Drone Aerobatics by Exploiting Geometric Symmetries

Arxiv

0+阅读 · 2月11日

Assessing Vision-Language Models for Perception in Autonomous Underwater Robotic Software

Arxiv

0+阅读 · 2月11日

DHEA-MECD: An Embodied Intelligence-Powered DRL Algorithm for AUV Tracking in Underwater Environments with High-Dimensional Features

Arxiv

0+阅读 · 2月8日

Robust Trajectory Tracking of Autonomous Surface Vehicle via Lie Algebraic Online MPC

Arxiv

0+阅读 · 2月1日

Ocean Current-Harnessing Stage-Gated MPC: Monotone Cost Shaping and Speed-to-Fly for Energy-Efficient AUV Navigation

Arxiv

0+阅读 · 1月31日

A Switching Nonlinear Model Predictive Control Strategy for Safe Collision Handling by an Underwater Vehicle-Manipulator System

Arxiv

0+阅读 · 1月26日

A Beacon Based Solution for Autonomous UUVs GNSS-Denied Stealthy Navigation

Arxiv

0+阅读 · 1月22日

AUV Trajectory Learning for Underwater Acoustic Energy Transfer and Age Minimization

Arxiv

0+阅读 · 1月13日

VIP会员

文章信息

相关主题

水下航行器

相关VIP内容

隐身自主无人水下航行器技术如何变革水下作战并重塑海军竞争

隐身自主无人水下航行器技术如何变革水下作战并重塑海军竞争

专知会员服务

11+阅读 · 2025年12月15日

美海军专利《球形自主水下航行器》

美海军专利《球形自主水下航行器》

专知会员服务

22+阅读 · 2025年2月4日

《水下航行器：设计与应用》112页

《水下航行器：设计与应用》112页

专知会员服务

40+阅读 · 2024年9月15日

自主水下航行器集群组网技术发展与展望

自主水下航行器集群组网技术发展与展望

专知会员服务

37+阅读 · 2024年4月26日

《无人水面航行器的集群协同优化》131页

《无人水面航行器的集群协同优化》131页

专知会员服务

74+阅读 · 2024年3月30日

水下航行器视觉控制技术综述

水下航行器视觉控制技术综述

专知会员服务

49+阅读 · 2024年1月9日

自主水下航行器路径规划技术综述及展望

自主水下航行器路径规划技术综述及展望

专知会员服务

56+阅读 · 2023年7月6日

《自主水下航行器编队综述：性能、编队控制和通信能力》大连海事大学27页综述论文

《自主水下航行器编队综述：性能、编队控制和通信能力》大连海事大学27页综述论文

专知会员服务

41+阅读 · 2022年12月25日

《远程自主水下航行器性能研究：增强AUV续航能力》2022最新博士论文，瑞典皇家理工学院

《远程自主水下航行器性能研究：增强AUV续航能力》2022最新博士论文，瑞典皇家理工学院

专知会员服务

37+阅读 · 2022年12月25日

【深海自主导航定位】《自主水下航行器多模型交互估计的信息论方法》2022最新154页论文，美国海军研究生院

【深海自主导航定位】《自主水下航行器多模型交互估计的信息论方法》2022最新154页论文，美国海军研究生院

专知会员服务

63+阅读 · 2022年10月27日

热门VIP内容

开通专知VIP会员享更多权益服务

《可信人工智能赋能系统的支柱》

《从经典神经网络到不确定性下的拓扑神经网络：军事应用》2026最新40页报告

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

《人工智能：对战略与力量的影响》slides

相关资讯

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

专知

71+阅读 · 2022年11月19日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

自动驾驶技术解读——自动驾驶汽车决策控制系统

自动驾驶技术解读——自动驾驶汽车决策控制系统

智能交通技术

30+阅读 · 2019年7月7日

前沿：水下机器人及其导航系统

前沿：水下机器人及其导航系统

科学出版社

11+阅读 · 2019年6月22日

自动驾驶车辆定位技术概述｜厚势汽车

自动驾驶车辆定位技术概述｜厚势汽车

厚势

10+阅读 · 2019年5月16日

【学科发展报告】无人船

【学科发展报告】无人船

中国自动化学会

29+阅读 · 2019年1月8日

国外无人水下航行器装备与技术现状及展望

国外无人水下航行器装备与技术现状及展望

无人机

14+阅读 · 2018年1月11日

水下无人系统发展现状及关键技术

水下无人系统发展现状及关键技术

无人机

21+阅读 · 2018年1月5日

无人艇的发展趋势

无人艇的发展趋势

无人机

13+阅读 · 2017年11月6日

无人机飞行控制方法概述

无人机飞行控制方法概述

无人机

12+阅读 · 2017年10月7日

相关论文

Efficient Knowledge Transfer for Jump-Starting Control Policy Learning of Multirotors through Physics-Aware Neural Architectures

Arxiv

0+阅读 · 2月17日

Constrained PSO Six-Parameter Fuzzy PID Tuning Method for Balanced Optimization of Depth Tracking Performance in Underwater Vehicles

Arxiv

0+阅读 · 2月13日

Multi-Task Reinforcement Learning of Drone Aerobatics by Exploiting Geometric Symmetries

Arxiv

0+阅读 · 2月11日

Assessing Vision-Language Models for Perception in Autonomous Underwater Robotic Software

Arxiv

0+阅读 · 2月11日

DHEA-MECD: An Embodied Intelligence-Powered DRL Algorithm for AUV Tracking in Underwater Environments with High-Dimensional Features

Arxiv

0+阅读 · 2月8日

Robust Trajectory Tracking of Autonomous Surface Vehicle via Lie Algebraic Online MPC

Arxiv

0+阅读 · 2月1日

Ocean Current-Harnessing Stage-Gated MPC: Monotone Cost Shaping and Speed-to-Fly for Energy-Efficient AUV Navigation

Arxiv

0+阅读 · 1月31日

A Switching Nonlinear Model Predictive Control Strategy for Safe Collision Handling by an Underwater Vehicle-Manipulator System

Arxiv

0+阅读 · 1月26日

A Beacon Based Solution for Autonomous UUVs GNSS-Denied Stealthy Navigation

Arxiv

0+阅读 · 1月22日

AUV Trajectory Learning for Underwater Acoustic Energy Transfer and Age Minimization

Arxiv

0+阅读 · 1月13日

相关基金

基于边界辨识的水下航行器低频线谱主动调控

国家自然科学基金

2+阅读 · 2015年12月31日

动态不确定性条件下基于混杂约束满足问题的水下移动传感器网络节点自定位方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于线结构光的水下自主作业系统目标识别与定位方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

自主式水下机器人推进器的故障诊断与容错控制方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

在轨航天器诊断策略自动构建与学习调控方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

水下机器人可重构控制系统可靠性分析研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于制导-控制结构的船舶非线性协调编队控制方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

复杂环境下异构自主海洋航行器网络的协同优化控制

国家自然科学基金

2+阅读 · 2015年12月31日

基于确定学习方法的无人水面艇智能控制研究

国家自然科学基金

17+阅读 · 2014年12月31日

重力/重力梯度补偿水下惯性导航系统理论和算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员