Agile Fall Recovery for Quadrotors with Bidirectional Thrust via Reinforcement Learning - 专知论文

会员服务 ·

0

旋翼无人机 · 四旋翼无人机 · 传感 · 扰动 · 传感器 ·

Agile Fall Recovery for Quadrotors with Bidirectional Thrust via Reinforcement Learning

翻译：具有双向推力的四旋翼无人机敏捷跌倒恢复的强化学习方法

Anke Zhao,Yuhang Zhong,Kenghou Hoi,Junyu Mou,Junjie Wang,Lijie Wang,Jialiang Hou,Fei Gao

Autonomous fall recovery is a critical capability for quadrotors operating in real-world environments, where collisions or failures may leave the vehicle resting on the ground in an arbitrary attitude. This problem is challenging because recovery must be achieved under limited onboard sensing, in constrained free space, with ground contact, and in the presence of unknown disturbances. In this letter, we present an RL-based framework for autonomous fall recovery of a quadrotor from arbitrary ground attitudes to stable hover using only lightweight onboard sensors. To address severe partial observability and intermittent sensor invalidity, we train a recurrent policy within an asymmetric actor--critic architecture, leveraging an Incremental Nonlinear Dynamic Inversion (INDI) controller to track the policy output. Combined with high-fidelity simulations of motor response and optical flow, the overall training framework significantly reduces the sim-to-real gap. Simulation ablation studies validate the importance of the main design choices, while real-world experiments demonstrate zero-shot transfer and robust recovery under different initial attitudes, wind disturbances, and additional payloads. These results demonstrate that agile quadrotor fall recovery can be achieved without explicit state estimation using only limited and unreliable onboard sensing.

翻译：自主跌倒恢复是四旋翼无人机在现实环境中运行的关键能力——当碰撞或故障导致飞行器以任意姿态停在地面时，需实现自主姿态恢复。该问题具有挑战性，原因在于恢复过程需在有限机载感知、受限自由空间、地面接触及未知扰动条件下完成。本文提出一种基于强化学习（RL）的框架，仅利用轻量级机载传感器实现四旋翼无人机从任意地面姿态到稳定悬停的自主跌倒恢复。为解决严重的部分可观测性与传感器间歇性失效问题，我们在非对称Actor-Critic架构中训练循环策略，并利用增量非线性动态逆（INDI）控制器跟踪策略输出。结合电机响应与光流的高保真仿真，整体训练框架显著缩小了仿真与现实的差距。仿真消融研究验证了主要设计选择的重要性，而实体实验展示了在不同初始姿态、风扰动及额外载荷下零样本迁移与鲁棒恢复能力。结果表明，无需显式状态估计，仅依赖有限且不可靠的机载传感即可实现敏捷的四旋翼跌倒恢复。

0

相关内容

旋翼无人机

旋翼无人机

《强化学习在无人机作战应用中的现存差距》2025最新29页综述

《强化学习在无人机作战应用中的现存差距》2025最新29页综述

专知会员服务

48+阅读 · 2025年5月17日

基于四旋翼无人机的协同跟踪系统

基于四旋翼无人机的协同跟踪系统

专知会员服务

19+阅读 · 2024年9月25日

行业关注｜面向无人机自主着陆的视觉感知与位姿估计方法综述

行业关注｜面向无人机自主着陆的视觉感知与位姿估计方法综述

专知会员服务

29+阅读 · 2024年8月19日

《分析强化学习智能体在空战中的能力：综合性能评估工具》

《分析强化学习智能体在空战中的能力：综合性能评估工具》

专知会员服务

74+阅读 · 2024年7月10日

《使用强化学习的自主无人飞行器导航：综述》

《使用强化学习的自主无人飞行器导航：综述》

专知会员服务

85+阅读 · 2023年6月18日

《基于深度强化学习的自主无人机拦截》空客等

《基于深度强化学习的自主无人机拦截》空客等

专知会员服务

56+阅读 · 2023年4月28日

【干货书】Python强化学习算法:学习、理解和开发智能算法以应对人工智能挑战，356页pdf，附代码

【干货书】Python强化学习算法:学习、理解和开发智能算法以应对人工智能挑战，356页pdf，附代码

专知会员服务

58+阅读 · 2022年12月10日

「强化学习在无人车领域」的应用与展望

「强化学习在无人车领域」的应用与展望

专知会员服务

58+阅读 · 2022年12月8日

《综述：强化学习在航空中的应用》第一份调查航空领域RL方法的研究论文，2022最新论文

《综述：强化学习在航空中的应用》第一份调查航空领域RL方法的研究论文，2022最新论文

专知会员服务

49+阅读 · 2022年11月15日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

176+阅读 · 2020年2月8日

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

33+阅读 · 2022年11月12日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

30+阅读 · 2022年9月19日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

反无人机技术的方法与难点

反无人机技术的方法与难点

无人机

32+阅读 · 2019年4月30日

使用强化学习训练机械臂完成人类任务

使用强化学习训练机械臂完成人类任务

AI研习社

14+阅读 · 2019年3月23日

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

产业智能官

16+阅读 · 2018年12月27日

无人机图像处理技术精髓汇总 (一) 三维还原重建技术简介

无人机图像处理技术精髓汇总 (一) 三维还原重建技术简介

深度学习

13+阅读 · 2018年12月18日

【强化学习】强化学习/增强学习/再励学习介绍

【强化学习】强化学习/增强学习/再励学习介绍

产业智能官

10+阅读 · 2018年2月23日

无人机飞行控制方法概述

无人机飞行控制方法概述

无人机

12+阅读 · 2017年10月7日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

面向复杂环境的四足机器人自适应和快速稳定运动控制方法研究及应用

国家自然科学基金

0+阅读 · 2017年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

面向踩踏事故防范的运动人群无人机协同航拍及风险演化态势计算

国家自然科学基金

0+阅读 · 2015年12月31日

基于自动导航的旋翼式微小型无人机农作物遥感信息解析方法

国家自然科学基金

4+阅读 · 2015年12月31日

无人机视频快速4-D重建及时空自适应索引方法研究

国家自然科学基金

8+阅读 · 2015年12月31日

倾转旋翼飞行器模态转换阶段非线性控制方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

三维复杂地形环境下基于无人机追逃问题的航路规划方法研究

国家自然科学基金

26+阅读 · 2015年12月31日

直升机旋翼动态失速流动控制新方法探索研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

Reinforcement Learning with Inner-loop Dynamics Estimator for Aerial Manipulation under Uncertainty

Arxiv

0+阅读 · 6月15日

Robust Fall Recovery for Armless Bipedal-Wheeled Robots Via Force-Guided Learning

Arxiv

0+阅读 · 6月12日

Stubborn: A Streamlined and Unified Reinforcement Learning Framework for Robust Motion Tracking and Fall Recovery for Humanoids

Arxiv

0+阅读 · 6月11日

Latent World Recovery for Multimodal Learning with Missing Modalities

Arxiv

0+阅读 · 6月10日

EM-Fall: Embodied mmWave Sensing for Day-and-Night Fall Detection on Humanoid Robots

Arxiv

0+阅读 · 6月9日

Neuromorphic Reinforcement Learning for Quadruped Locomotion Control on Uneven Terrain

Arxiv

0+阅读 · 6月9日

Goal-oriented Communication for Fast and Robust Robotic Fault Detection and Recovery

Arxiv

0+阅读 · 6月8日

PTDL:Multi-Terrain Fall Recovery via Phase-Terrain Decoupled Learning

Arxiv

0+阅读 · 6月8日

Propeller-Assisted Robust 3D Hopping Robot with Hierarchical Force Allocation

Arxiv

0+阅读 · 6月6日

Vision-Based Agile Landing on Turbulent Waters

Arxiv

0+阅读 · 5月22日

VIP会员

文章信息

相关主题

旋翼无人机

四旋翼无人机

最新内容

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

0+阅读 · 今天15:26

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

0+阅读 · 今天15:19

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

4+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

5+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

9+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

6+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

9+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

7+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

13+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

6+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

8+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

9+阅读 · 6月17日

相关VIP内容

《强化学习在无人机作战应用中的现存差距》2025最新29页综述

《强化学习在无人机作战应用中的现存差距》2025最新29页综述

专知会员服务

48+阅读 · 2025年5月17日

基于四旋翼无人机的协同跟踪系统

基于四旋翼无人机的协同跟踪系统

专知会员服务

19+阅读 · 2024年9月25日

行业关注｜面向无人机自主着陆的视觉感知与位姿估计方法综述

行业关注｜面向无人机自主着陆的视觉感知与位姿估计方法综述

专知会员服务

29+阅读 · 2024年8月19日

《分析强化学习智能体在空战中的能力：综合性能评估工具》

《分析强化学习智能体在空战中的能力：综合性能评估工具》

专知会员服务

74+阅读 · 2024年7月10日

《使用强化学习的自主无人飞行器导航：综述》

《使用强化学习的自主无人飞行器导航：综述》

专知会员服务

85+阅读 · 2023年6月18日

《基于深度强化学习的自主无人机拦截》空客等

《基于深度强化学习的自主无人机拦截》空客等

专知会员服务

56+阅读 · 2023年4月28日

【干货书】Python强化学习算法:学习、理解和开发智能算法以应对人工智能挑战，356页pdf，附代码

【干货书】Python强化学习算法:学习、理解和开发智能算法以应对人工智能挑战，356页pdf，附代码

专知会员服务

58+阅读 · 2022年12月10日

「强化学习在无人车领域」的应用与展望

「强化学习在无人车领域」的应用与展望

专知会员服务

58+阅读 · 2022年12月8日

《综述：强化学习在航空中的应用》第一份调查航空领域RL方法的研究论文，2022最新论文

《综述：强化学习在航空中的应用》第一份调查航空领域RL方法的研究论文，2022最新论文

专知会员服务

49+阅读 · 2022年11月15日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

176+阅读 · 2020年2月8日

热门VIP内容

开通专知VIP会员享更多权益服务

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

相关资讯

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

33+阅读 · 2022年11月12日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

30+阅读 · 2022年9月19日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

反无人机技术的方法与难点

反无人机技术的方法与难点

无人机

32+阅读 · 2019年4月30日

使用强化学习训练机械臂完成人类任务

使用强化学习训练机械臂完成人类任务

AI研习社

14+阅读 · 2019年3月23日

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

产业智能官

16+阅读 · 2018年12月27日

无人机图像处理技术精髓汇总 (一) 三维还原重建技术简介

无人机图像处理技术精髓汇总 (一) 三维还原重建技术简介

深度学习

13+阅读 · 2018年12月18日

【强化学习】强化学习/增强学习/再励学习介绍

【强化学习】强化学习/增强学习/再励学习介绍

产业智能官

10+阅读 · 2018年2月23日

无人机飞行控制方法概述

无人机飞行控制方法概述

无人机

12+阅读 · 2017年10月7日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

相关论文

Reinforcement Learning with Inner-loop Dynamics Estimator for Aerial Manipulation under Uncertainty

Arxiv

0+阅读 · 6月15日

Robust Fall Recovery for Armless Bipedal-Wheeled Robots Via Force-Guided Learning

Arxiv

0+阅读 · 6月12日

Stubborn: A Streamlined and Unified Reinforcement Learning Framework for Robust Motion Tracking and Fall Recovery for Humanoids

Arxiv

0+阅读 · 6月11日

Latent World Recovery for Multimodal Learning with Missing Modalities

Arxiv

0+阅读 · 6月10日

EM-Fall: Embodied mmWave Sensing for Day-and-Night Fall Detection on Humanoid Robots

Arxiv

0+阅读 · 6月9日

Neuromorphic Reinforcement Learning for Quadruped Locomotion Control on Uneven Terrain

Arxiv

0+阅读 · 6月9日

Goal-oriented Communication for Fast and Robust Robotic Fault Detection and Recovery

Arxiv

0+阅读 · 6月8日

PTDL:Multi-Terrain Fall Recovery via Phase-Terrain Decoupled Learning

Arxiv

0+阅读 · 6月8日

Propeller-Assisted Robust 3D Hopping Robot with Hierarchical Force Allocation

Arxiv

0+阅读 · 6月6日

Vision-Based Agile Landing on Turbulent Waters

Arxiv

0+阅读 · 5月22日

相关基金

面向复杂环境的四足机器人自适应和快速稳定运动控制方法研究及应用

国家自然科学基金

0+阅读 · 2017年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

面向踩踏事故防范的运动人群无人机协同航拍及风险演化态势计算

国家自然科学基金

0+阅读 · 2015年12月31日

基于自动导航的旋翼式微小型无人机农作物遥感信息解析方法

国家自然科学基金

4+阅读 · 2015年12月31日

无人机视频快速4-D重建及时空自适应索引方法研究

国家自然科学基金

8+阅读 · 2015年12月31日

倾转旋翼飞行器模态转换阶段非线性控制方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

三维复杂地形环境下基于无人机追逃问题的航路规划方法研究

国家自然科学基金

26+阅读 · 2015年12月31日

直升机旋翼动态失速流动控制新方法探索研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员