具身感知的通用专家蒸馏框架用于统一人形机器人全身控制 (Embodiment-Aware Generalist Specialist Distillation for Unified Humanoid Whole-Body Control) - 专知论文

会员服务 ·

0

机器人 · 蒸馏 · 本体 · Eagle · 控制器 ·

Embodiment-Aware Generalist Specialist Distillation for Unified Humanoid Whole-Body Control

翻译：具身感知的通用专家蒸馏框架用于统一人形机器人全身控制

Quanquan Peng,Yunfeng Lin,Yufei Xue,Jiangmiao Pang,Weinan Zhang

Humanoid Whole-Body Controllers trained with reinforcement learning (RL) have recently achieved remarkable performance, yet many target a single robot embodiment. Variations in dynamics, degrees of freedom (DoFs), and kinematic topology still hinder a single policy from commanding diverse humanoids. Moreover, obtaining a generalist policy that not only transfers across embodiments but also supports richer behaviors-beyond simple walking to squatting, leaning-remains especially challenging. In this work, we tackle these obstacles by introducing EAGLE, an iterative generalist-specialist distillation framework that produces a single unified policy that controls multiple heterogeneous humanoids without per-robot reward tuning. During each cycle, embodiment-specific specialists are forked from the current generalist, refined on their respective robots, and new skills are distilled back into the generalist by training on the pooled embodiment set. Repeating this loop until performance convergence produces a robust Whole-Body Controller validated on robots such as Unitree H1, G1, and Fourier N1. We conducted experiments on five different robots in simulation and four in real-world settings. Through quantitative evaluations, EAGLE achieves high tracking accuracy and robustness compared to other methods, marking a step toward scalable, fleet-level humanoid control. See more details at https://eagle-wbc.github.io/

翻译：基于强化学习训练的人形机器人全身控制器近期取得了显著性能，但多数仅针对单一机器人本体。动力学特性、自由度以及运动学拓扑结构的差异仍阻碍单一策略对多样化人形机器人的统一操控。此外，获得不仅能够跨本体迁移、还能支持更丰富行为（从简单行走到蹲伏、侧倾等）的通用策略尤其具有挑战性。本研究通过提出EAGLE框架应对这些挑战——这是一个迭代式通用-专家蒸馏框架，能够生成无需针对各机器人进行奖励调整即可控制多个异构人形机器人的统一策略。在每个循环周期中，系统从当前通用策略派生出针对特定本体的专家策略，在各自机器人上进行精调，随后通过在全本体集合上的训练将新技能蒸馏回通用策略。该循环持续至性能收敛，最终产生经过Unitree H1、G1和Fourier N1等机器人验证的鲁棒全身控制器。我们在仿真环境中对五种不同机器人、在现实场景中对四种机器人进行了实验。定量评估表明，相较于其他方法，EAGLE实现了更高的轨迹跟踪精度与鲁棒性，标志着向可扩展的集群级人形机器人控制迈出了重要一步。更多细节请访问：https://eagle-wbc.github.io/

0

相关内容

机器人

机器人（英语：Robot）包括一切模拟人类行为或思想与模拟其他生物的机械（如机器狗，机器猫等）。狭义上对机器人的定义还有很多分类法及争议，有些电脑程序甚至也被称为机器人。在当代工业中，机器人指能自动运行任务的人造机器设备，用以取代或协助人类工作，一般会是机电设备，由计算机程序或是电子电路控制。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【斯坦福博士论文】移动操作机器人的学习系统构建研究

【斯坦福博士论文】移动操作机器人的学习系统构建研究

专知会员服务

14+阅读 · 2025年11月14日

构建具身智能新范式：人形机器人技术现状及发展趋势综述

构建具身智能新范式：人形机器人技术现状及发展趋势综述

专知会员服务

27+阅读 · 2025年5月12日

【斯坦福博士论文】构建类人化具身智能体：从人类行为中学习

【斯坦福博士论文】构建类人化具身智能体：从人类行为中学习

专知会员服务

25+阅读 · 2025年3月20日

【CMU博士论文】构建自适应性强的通用机器人，248页pdf

【CMU博士论文】构建自适应性强的通用机器人，248页pdf

专知会员服务

37+阅读 · 2024年6月10日

具身智能：突破人机边界，AI产业的下一站

具身智能：突破人机边界，AI产业的下一站

专知会员服务

88+阅读 · 2024年5月18日

【牛津大学博士论文】面向对象的生成模型在机器人感知与行动中的应用，148页pdf

【牛津大学博士论文】面向对象的生成模型在机器人感知与行动中的应用，148页pdf

专知会员服务

22+阅读 · 2024年2月13日

通往具身通用智能：如何让机器从自然模态中学习到世界模型？

通往具身通用智能：如何让机器从自然模态中学习到世界模型？

专知会员服务

61+阅读 · 2023年12月30日

【ETHZ博士论文】通过自适应和基于学习的模型预测控制的机器人移动操纵

【ETHZ博士论文】通过自适应和基于学习的模型预测控制的机器人移动操纵

专知会员服务

24+阅读 · 2023年11月26日

【普林斯顿博士论文】基于异常检测和泛化理论的可证安全机器人学习控制，278页pdf

【普林斯顿博士论文】基于异常检测和泛化理论的可证安全机器人学习控制，278页pdf

专知会员服务

29+阅读 · 2023年4月23日

【2020新书】基于人工智能的机器人安全学习和控制，138页pdf

【2020新书】基于人工智能的机器人安全学习和控制，138页pdf

专知会员服务

52+阅读 · 2020年12月12日

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

专知

12+阅读 · 2023年4月4日

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

26+阅读 · 2022年11月24日

【干货书】基于深度学习的机器人感知与认知，638页pdf

【干货书】基于深度学习的机器人感知与认知，638页pdf

专知

19+阅读 · 2022年7月30日

【硬核书】《现代机器人学：机构、规划与控制》，642页pdf

【硬核书】《现代机器人学：机构、规划与控制》，642页pdf

专知

13+阅读 · 2022年5月2日

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人大讲堂

18+阅读 · 2019年7月5日

【前沿】让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法！

【前沿】让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法！

中国自动化学会

11+阅读 · 2019年6月18日

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

专知

10+阅读 · 2019年1月18日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

产业智能官

16+阅读 · 2018年12月27日

【机器人】机器人PID控制

【机器人】机器人PID控制

产业智能官

10+阅读 · 2018年11月25日

融合人脑意图与力觉反馈的外骨骼机器人步态控制CPG模型及调节方法

国家自然科学基金

0+阅读 · 2015年12月31日

三维空间基于角度测量的多机器人系统协同定位与编队控制

国家自然科学基金

11+阅读 · 2015年12月31日

面向类人机器人动作规划的参数最优控制技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

人机协调稳定约束的单腿外骨骼机器人自适应式动平衡助行控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

多旋翼空中操作机器人的一体化设计及动态运动规划

国家自然科学基金

1+阅读 · 2015年12月31日

不确定非完整移动机器人基于一致性的分布式编队控制研究

国家自然科学基金

13+阅读 · 2015年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

MeshMimic: Geometry-Aware Humanoid Motion Learning through 3D Scene Reconstruction

Arxiv

0+阅读 · 2月17日

General Humanoid Whole-Body Control via Pretraining and Fast Adaptation

Arxiv

0+阅读 · 2月12日

HAIC: Humanoid Agile Object Interaction Control via Dynamics-Aware World Model

Arxiv

0+阅读 · 2月12日

TeleGate: Whole-Body Humanoid Teleoperation via Gated Expert Selection with Motion Prior

Arxiv

0+阅读 · 2月10日

A Survey of Behavior Foundation Model: Next-Generation Whole-Body Control System of Humanoid Robots

Arxiv

0+阅读 · 2月9日

Scalable and General Whole-Body Control for Cross-Humanoid Locomotion

Arxiv

0+阅读 · 2月5日

HUSKY: Humanoid Skateboarding System via Physics-Aware Whole-Body Control

Arxiv

0+阅读 · 2月3日

Robust and Generalized Humanoid Motion Tracking

Arxiv

0+阅读 · 1月30日

Learning a Unified Latent Space for Cross-Embodiment Robot Control

Arxiv

0+阅读 · 1月21日

A Brain-inspired Embodied Intelligence for Fluid and Fast Reflexive Robotics Control

Arxiv

0+阅读 · 1月21日

VIP会员

文章信息

相关主题

相关VIP内容

【斯坦福博士论文】移动操作机器人的学习系统构建研究

【斯坦福博士论文】移动操作机器人的学习系统构建研究

专知会员服务

14+阅读 · 2025年11月14日

构建具身智能新范式：人形机器人技术现状及发展趋势综述

构建具身智能新范式：人形机器人技术现状及发展趋势综述

专知会员服务

27+阅读 · 2025年5月12日

【斯坦福博士论文】构建类人化具身智能体：从人类行为中学习

【斯坦福博士论文】构建类人化具身智能体：从人类行为中学习

专知会员服务

25+阅读 · 2025年3月20日

【CMU博士论文】构建自适应性强的通用机器人，248页pdf

【CMU博士论文】构建自适应性强的通用机器人，248页pdf

专知会员服务

37+阅读 · 2024年6月10日

具身智能：突破人机边界，AI产业的下一站

具身智能：突破人机边界，AI产业的下一站

专知会员服务

88+阅读 · 2024年5月18日

【牛津大学博士论文】面向对象的生成模型在机器人感知与行动中的应用，148页pdf

【牛津大学博士论文】面向对象的生成模型在机器人感知与行动中的应用，148页pdf

专知会员服务

22+阅读 · 2024年2月13日

通往具身通用智能：如何让机器从自然模态中学习到世界模型？

通往具身通用智能：如何让机器从自然模态中学习到世界模型？

专知会员服务

61+阅读 · 2023年12月30日

【ETHZ博士论文】通过自适应和基于学习的模型预测控制的机器人移动操纵

【ETHZ博士论文】通过自适应和基于学习的模型预测控制的机器人移动操纵

专知会员服务

24+阅读 · 2023年11月26日

【普林斯顿博士论文】基于异常检测和泛化理论的可证安全机器人学习控制，278页pdf

【普林斯顿博士论文】基于异常检测和泛化理论的可证安全机器人学习控制，278页pdf

专知会员服务

29+阅读 · 2023年4月23日

【2020新书】基于人工智能的机器人安全学习和控制，138页pdf

【2020新书】基于人工智能的机器人安全学习和控制，138页pdf

专知会员服务

52+阅读 · 2020年12月12日

热门VIP内容

开通专知VIP会员享更多权益服务

美国防部门开始扩建金穹反导系统基础设施

《基于选择性深度神经网络分类的弹性无线通信》最新报告

《多域作战中融合网络、电子战与动能机动》

《在东欧磨砺反无人机技能》美陆军最新反无人机训练报告

相关资讯

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

专知

12+阅读 · 2023年4月4日

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

26+阅读 · 2022年11月24日

【干货书】基于深度学习的机器人感知与认知，638页pdf

【干货书】基于深度学习的机器人感知与认知，638页pdf

专知

19+阅读 · 2022年7月30日

【硬核书】《现代机器人学：机构、规划与控制》，642页pdf

【硬核书】《现代机器人学：机构、规划与控制》，642页pdf

专知

13+阅读 · 2022年5月2日

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人大讲堂

18+阅读 · 2019年7月5日

【前沿】让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法！

【前沿】让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法！

中国自动化学会

11+阅读 · 2019年6月18日

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

专知

10+阅读 · 2019年1月18日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

产业智能官

16+阅读 · 2018年12月27日

【机器人】机器人PID控制

【机器人】机器人PID控制

产业智能官

10+阅读 · 2018年11月25日

相关论文

MeshMimic: Geometry-Aware Humanoid Motion Learning through 3D Scene Reconstruction

Arxiv

0+阅读 · 2月17日

General Humanoid Whole-Body Control via Pretraining and Fast Adaptation

Arxiv

0+阅读 · 2月12日

HAIC: Humanoid Agile Object Interaction Control via Dynamics-Aware World Model

Arxiv

0+阅读 · 2月12日

TeleGate: Whole-Body Humanoid Teleoperation via Gated Expert Selection with Motion Prior

Arxiv

0+阅读 · 2月10日

A Survey of Behavior Foundation Model: Next-Generation Whole-Body Control System of Humanoid Robots

Arxiv

0+阅读 · 2月9日

Scalable and General Whole-Body Control for Cross-Humanoid Locomotion

Arxiv

0+阅读 · 2月5日

HUSKY: Humanoid Skateboarding System via Physics-Aware Whole-Body Control

Arxiv

0+阅读 · 2月3日

Robust and Generalized Humanoid Motion Tracking

Arxiv

0+阅读 · 1月30日

Learning a Unified Latent Space for Cross-Embodiment Robot Control

Arxiv

0+阅读 · 1月21日

A Brain-inspired Embodied Intelligence for Fluid and Fast Reflexive Robotics Control

Arxiv

0+阅读 · 1月21日

相关基金

融合人脑意图与力觉反馈的外骨骼机器人步态控制CPG模型及调节方法

国家自然科学基金

0+阅读 · 2015年12月31日

三维空间基于角度测量的多机器人系统协同定位与编队控制

国家自然科学基金

11+阅读 · 2015年12月31日

面向类人机器人动作规划的参数最优控制技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

人机协调稳定约束的单腿外骨骼机器人自适应式动平衡助行控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

多旋翼空中操作机器人的一体化设计及动态运动规划

国家自然科学基金

1+阅读 · 2015年12月31日

不确定非完整移动机器人基于一致性的分布式编队控制研究

国家自然科学基金

13+阅读 · 2015年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员