Humanoid Whole-Body Controllers trained with reinforcement learning (RL) have recently achieved remarkable performance, yet many target a single robot embodiment. Variations in dynamics, degrees of freedom (DoFs), and kinematic topology still hinder a single policy from commanding diverse humanoids. Moreover, obtaining a generalist policy that not only transfers across embodiments but also supports richer behaviors-beyond simple walking to squatting, leaning-remains especially challenging. In this work, we tackle these obstacles by introducing EAGLE, an iterative generalist-specialist distillation framework that produces a single unified policy that controls multiple heterogeneous humanoids without per-robot reward tuning. During each cycle, embodiment-specific specialists are forked from the current generalist, refined on their respective robots, and new skills are distilled back into the generalist by training on the pooled embodiment set. Repeating this loop until performance convergence produces a robust Whole-Body Controller validated on robots such as Unitree H1, G1, and Fourier N1. We conducted experiments on five different robots in simulation and four in real-world settings. Through quantitative evaluations, EAGLE achieves high tracking accuracy and robustness compared to other methods, marking a step toward scalable, fleet-level humanoid control. See more details at https://eagle-wbc.github.io/


翻译:基于强化学习训练的人形机器人全身控制器近期取得了显著性能,但多数仅针对单一机器人本体。动力学特性、自由度以及运动学拓扑结构的差异仍阻碍单一策略对多样化人形机器人的统一操控。此外,获得不仅能够跨本体迁移、还能支持更丰富行为(从简单行走到蹲伏、侧倾等)的通用策略尤其具有挑战性。本研究通过提出EAGLE框架应对这些挑战——这是一个迭代式通用-专家蒸馏框架,能够生成无需针对各机器人进行奖励调整即可控制多个异构人形机器人的统一策略。在每个循环周期中,系统从当前通用策略派生出针对特定本体的专家策略,在各自机器人上进行精调,随后通过在全本体集合上的训练将新技能蒸馏回通用策略。该循环持续至性能收敛,最终产生经过Unitree H1、G1和Fourier N1等机器人验证的鲁棒全身控制器。我们在仿真环境中对五种不同机器人、在现实场景中对四种机器人进行了实验。定量评估表明,相较于其他方法,EAGLE实现了更高的轨迹跟踪精度与鲁棒性,标志着向可扩展的集群级人形机器人控制迈出了重要一步。更多细节请访问:https://eagle-wbc.github.io/

0
下载
关闭预览

相关内容

机器人(英语:Robot)包括一切模拟人类行为或思想与模拟其他生物的机械(如机器狗,机器猫等)。狭义上对机器人的定义还有很多分类法及争议,有些电脑程序甚至也被称为机器人。在当代工业中,机器人指能自动运行任务的人造机器设备,用以取代或协助人类工作,一般会是机电设备,由计算机程序或是电子电路控制。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【斯坦福博士论文】移动操作机器人的学习系统构建研究
专知会员服务
14+阅读 · 2025年11月14日
【CMU博士论文】构建自适应性强的通用机器人,248页pdf
专知会员服务
37+阅读 · 2024年6月10日
具身智能:突破人机边界,AI产业的下一站
专知会员服务
88+阅读 · 2024年5月18日
【机器人】机器人PID控制
产业智能官
10+阅读 · 2018年11月25日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
国家自然科学基金
48+阅读 · 2009年12月31日
VIP会员
相关基金
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
23+阅读 · 2009年12月31日
国家自然科学基金
48+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员