Fall recovery is critical for autonomous legged locomotion. Existing methods have demonstrated that some legged robots, such as humanoids and quadrupeds, are capable of fall recovery from diverse postures by utilizing arms or coordinating multi-legs to generate support forces. Without arms or other legs to provide supportive assistance, a bipedal-wheeled robot must rely solely on the actuation of its legs, making recovery particularly difficult. To address this, we introduce FTSR (Force-guided Teacher-student framework with Stage-wise Rewards). The force-guided method constructs an external auxiliary force during simulation training that correlates directly with the robot's real-time height, explicitly formulating this force as an optimizable constraint. Through constrained reinforcement learning, the policy is guided toward reducing force dependency gradually and increasing the body height, developing internal recovery strategies despite having no arms for support. Height-progressive stage-Wise rewards progressively structure posture stabilization during recovery and transition to sustained locomotion, integrated with teacher-student architecture distilling privileged knowledge of force effects and recovery dynamics. After simulation training, the policy is deployed on a physical armless bipedal-wheeled robot and extensively evaluated. Experiments confirm robust and reliable fall recovery under diverse challenging conditions, demonstrating strong environmental adaptability and motion robustness, while maintaining full post-recovery motion capability. The framework also generalizes effectively to a high-DOF humanoid, confirming its practical generalizability. The project page is available at https://2350575870.github.io/force-guided.github.io/


翻译:摔倒恢复对于自主腿部运动至关重要。现有方法已证明,某些腿足机器人(如人形机器人和四足机器人)能够通过利用手臂或协调多腿产生支撑力,从多种姿态中实现摔倒恢复。然而,无臂或缺乏其他腿部提供辅助支撑的轮式双足机器人必须仅依靠其腿部驱动,这使得恢复特别困难。针对这一问题,我们提出了FTSR(基于阶段奖励的力引导教师-学生框架)。该力引导方法在仿真训练期间构建一个与机器人实时高度直接相关的外部辅助力,并明确将该力建模为可优化的约束。通过约束强化学习,策略被引导逐步减少对力的依赖并增加身体高度,从而在无手臂支撑的情况下发展内部恢复策略。高度递进的阶段奖励在恢复过程中逐步构建姿态稳定,并过渡到持续运动,结合教师-学生架构蒸馏关于力效应和恢复动态的特权知识。仿真训练后,该策略被部署在物理无臂轮式双足机器人上并进行广泛评估。实验证实,在各种具有挑战性的条件下,该方法实现了鲁棒且可靠的摔倒恢复,展现出强大的环境适应性和运动鲁棒性,同时保持恢复后的完整运动能力。该框架还能有效泛化至高自由度人形机器人,验证了其实用泛化能力。项目页面见 https://2350575870.github.io/force-guided.github.io/

0
下载
关闭预览

相关内容

不可错过!普林斯顿《机器人导论》课程,附Slides
专知会员服务
27+阅读 · 2022年12月18日
【综述】自动机器学习AutoML最新65页综述,带你了解最新进展
中国人工智能学会
48+阅读 · 2019年5月3日
使用强化学习训练机械臂完成人类任务
AI研习社
14+阅读 · 2019年3月23日
【机器人】机器人PID控制
产业智能官
10+阅读 · 2018年11月25日
机器人操作的“圣杯问题” -- Bin Picking
机器人学家
16+阅读 · 2018年8月2日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
7+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
5+阅读 · 6月17日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员