Precise aggressive maneuvers with lightweight onboard sensors remains a key bottleneck in fully exploiting the maneuverability of drones. Such maneuvers are critical for expanding the systems' accessible area by navigating through narrow openings in the environment. Among the most relevant problems, a representative one is aggressive traversal through narrow gaps with quadrotors under SE(3) constraints, which require the quadrotors to leverage a momentary tilted attitude and the asymmetry of the airframe to navigate through gaps. In this paper, we achieve such maneuvers by developing sensorimotor policies directly mapping onboard vision and proprioception into low-level control commands. The policies are trained using reinforcement learning (RL) with end-to-end policy distillation in simulation. We mitigate the fundamental hardness of model-free RL's exploration on the restricted solution space with an initialization strategy leveraging trajectories generated by a model-based planner. Careful sim-to-real design allows the policy to control a quadrotor through narrow gaps with low clearances and high repeatability. For instance, the proposed method enables a quadrotor to navigate a rectangular gap at a 5 cm clearance, tilted at up to 90-degree orientation, without knowledge of the gap's position or orientation. Without training on dynamic gaps, the policy can reactively servo the quadrotor to traverse through a moving gap. The proposed method is also validated by training and deploying policies on challenging tracks of narrow gaps placed closely. The flexibility of the policy learning method is demonstrated by developing policies for geometrically diverse gaps, without relying on manually defined traversal poses and visual features.


翻译:基于轻量级机载传感器实现精准激进机动仍是充分释放无人机机动性的关键瓶颈。此类机动对通过环境中狭窄开口扩展系统可及区域至关重要。在最具代表性的问题中,四旋翼在SE(3)约束下穿越狭窄间隙的激进机动尤为典型,这要求四旋翼利用瞬时倾斜姿态与机身非对称性完成间隙穿越。本文通过开发直接映射机载视觉与本体感知为底层控制指令的传感器运动策略实现此类机动。策略采用强化学习(RL)训练,在仿真中通过端到端策略蒸馏实现。针对无模型强化学习在受限解空间探索的固有难题,我们提出基于模型规划器生成轨迹的初始化策略进行缓解。精心设计的仿真到现实(sim-to-real)方案使策略能够以高重复性控制四旋翼穿越低间隙余量的狭窄通道。例如,所提方法可使四旋翼在5厘米间隙余量下穿越倾角达90度的矩形间隙,且无需获知间隙的位置或方向。即使未在动态间隙上训练,策略仍能响应式伺服四旋翼穿越移动间隙。通过在紧密排列的狭窄间隙挑战赛道上训练与部署策略,进一步验证了所提方法。通过为几何形状各异的间隙开发策略,且无需依赖人工定义的穿越姿态与视觉特征,充分展示了策略学习方法的灵活性。

0
下载
关闭预览

相关内容

《动态对抗环境下无人机路径规划算法》
专知会员服务
42+阅读 · 2025年7月22日
《现有“低慢小”无人机反制措施综述》
专知会员服务
68+阅读 · 2025年6月20日
《空基机器人系统的传感器融合技术》美陆军最新58页
专知会员服务
31+阅读 · 2025年4月20日
无人机精确着陆控制技术
专知会员服务
25+阅读 · 2024年10月22日
无人预警机系统架构及关键技术分析
专知
14+阅读 · 2022年8月6日
无人机蜂群作战概念研究
无人机
63+阅读 · 2018年7月9日
进攻机动作战中的机器人集群
无人机
31+阅读 · 2017年12月4日
无人机飞行控制方法概述
无人机
12+阅读 · 2017年10月7日
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2013年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
29+阅读 · 2011年12月31日
VIP会员
最新内容
ICML 2026 | CFPO:用反事实策略优化提升多模态推理
综述 | 世界动作模型:少做梦,多行动
专知会员服务
0+阅读 · 11分钟前
美以伊冲突:无人机与人工智能的运用
专知会员服务
1+阅读 · 23分钟前
《特种部队在透明战场中的生存力》最新报告
专知会员服务
1+阅读 · 43分钟前
《人工智能生成的零日漏洞:对未来作战的影响》
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关基金
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2013年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
29+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员