Autonomous fall recovery is a critical capability for quadrotors operating in real-world environments, where collisions or failures may leave the vehicle resting on the ground in an arbitrary attitude. This problem is challenging because recovery must be achieved under limited onboard sensing, in constrained free space, with ground contact, and in the presence of unknown disturbances. In this letter, we present an RL-based framework for autonomous fall recovery of a quadrotor from arbitrary ground attitudes to stable hover using only lightweight onboard sensors. To address severe partial observability and intermittent sensor invalidity, we train a recurrent policy within an asymmetric actor--critic architecture, leveraging an Incremental Nonlinear Dynamic Inversion (INDI) controller to track the policy output. Combined with high-fidelity simulations of motor response and optical flow, the overall training framework significantly reduces the sim-to-real gap. Simulation ablation studies validate the importance of the main design choices, while real-world experiments demonstrate zero-shot transfer and robust recovery under different initial attitudes, wind disturbances, and additional payloads. These results demonstrate that agile quadrotor fall recovery can be achieved without explicit state estimation using only limited and unreliable onboard sensing.


翻译:自主跌倒恢复是四旋翼无人机在现实环境中运行的关键能力——当碰撞或故障导致飞行器以任意姿态停在地面时,需实现自主姿态恢复。该问题具有挑战性,原因在于恢复过程需在有限机载感知、受限自由空间、地面接触及未知扰动条件下完成。本文提出一种基于强化学习(RL)的框架,仅利用轻量级机载传感器实现四旋翼无人机从任意地面姿态到稳定悬停的自主跌倒恢复。为解决严重的部分可观测性与传感器间歇性失效问题,我们在非对称Actor-Critic架构中训练循环策略,并利用增量非线性动态逆(INDI)控制器跟踪策略输出。结合电机响应与光流的高保真仿真,整体训练框架显著缩小了仿真与现实的差距。仿真消融研究验证了主要设计选择的重要性,而实体实验展示了在不同初始姿态、风扰动及额外载荷下零样本迁移与鲁棒恢复能力。结果表明,无需显式状态估计,仅依赖有限且不可靠的机载传感即可实现敏捷的四旋翼跌倒恢复。

0
下载
关闭预览

相关内容

基于四旋翼无人机的协同跟踪系统
专知会员服务
19+阅读 · 2024年9月25日
《使用强化学习的自主无人飞行器导航:综述》
专知会员服务
85+阅读 · 2023年6月18日
《基于深度强化学习的自主无人机拦截》空客等
专知会员服务
56+阅读 · 2023年4月28日
「强化学习在无人车领域」的应用与展望
专知会员服务
58+阅读 · 2022年12月8日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
176+阅读 · 2020年2月8日
「基于通信的多智能体强化学习」 进展综述
基于模型的强化学习综述
专知
42+阅读 · 2022年7月13日
反无人机技术的方法与难点
无人机
32+阅读 · 2019年4月30日
使用强化学习训练机械臂完成人类任务
AI研习社
14+阅读 · 2019年3月23日
【强化学习】强化学习/增强学习/再励学习介绍
产业智能官
10+阅读 · 2018年2月23日
无人机飞行控制方法概述
无人机
12+阅读 · 2017年10月7日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
26+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
7+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
6+阅读 · 6月17日
相关资讯
「基于通信的多智能体强化学习」 进展综述
基于模型的强化学习综述
专知
42+阅读 · 2022年7月13日
反无人机技术的方法与难点
无人机
32+阅读 · 2019年4月30日
使用强化学习训练机械臂完成人类任务
AI研习社
14+阅读 · 2019年3月23日
【强化学习】强化学习/增强学习/再励学习介绍
产业智能官
10+阅读 · 2018年2月23日
无人机飞行控制方法概述
无人机
12+阅读 · 2017年10月7日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
相关基金
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
26+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员