学习跨形态机器人控制的统一潜在空间 (Learning a Unified Latent Space for Cross-Embodiment Robot Control) - 专知论文

会员服务 ·

0

潜在 · 机器人 · 机器人控制 · 构建 · 运动模式 ·

Learning a Unified Latent Space for Cross-Embodiment Robot Control

翻译：学习跨形态机器人控制的统一潜在空间

Yashuai Yan,Dongheui Lee

We present a scalable framework for cross-embodiment humanoid robot control by learning a shared latent representation that unifies motion across humans and diverse humanoid platforms, including single-arm, dual-arm, and legged humanoid robots. Our method proceeds in two stages: first, we construct a decoupled latent space that captures localized motion patterns across different body parts using contrastive learning, enabling accurate and flexible motion retargeting even across robots with diverse morphologies. To enhance alignment between embodiments, we introduce tailored similarity metrics that combine joint rotation and end-effector positioning for critical segments, such as arms. Then, we train a goal-conditioned control policy directly within this latent space using only human data. Leveraging a conditional variational autoencoder, our policy learns to predict latent space displacements guided by intended goal directions. We show that the trained policy can be directly deployed on multiple robots without any adaptation. Furthermore, our method supports the efficient addition of new robots to the latent space by learning only a lightweight, robot-specific embedding layer. The learned latent policies can also be directly applied to the new robots. Experimental results demonstrate that our approach enables robust, scalable, and embodiment-agnostic robot control across a wide range of humanoid platforms.

翻译：我们提出了一种可扩展的跨形态人形机器人控制框架，通过学习一个共享的潜在表征来统一人类与多样化人形平台（包括单臂、双臂及足式人形机器人）的运动。我们的方法分为两个阶段：首先，我们通过对比学习构建解耦的潜在空间，以捕捉不同身体部位的局部运动模式，从而即使在形态各异的机器人之间也能实现精确灵活的运动重定向。为增强不同形态间的对齐，我们针对关键部位（如手臂）引入了结合关节旋转与末端执行器定位的定制化相似性度量。随后，我们仅使用人类数据在此潜在空间中直接训练目标条件控制策略。借助条件变分自编码器，我们的策略学习在预期目标方向引导下预测潜在空间位移。研究表明，训练完成的策略无需任何调整即可直接部署于多种机器人。此外，我们的方法支持通过仅学习轻量级的机器人专用嵌入层，将新机器人高效纳入潜在空间。习得的潜在策略亦可直接应用于新机器人。实验结果证明，我们的方法能够在广泛的人形机器人平台上实现鲁棒、可扩展且与具体形态无关的机器人控制。

0

相关内容

【伯克利博士论文】物理世界中可泛化且可扩展的机器人学习

【伯克利博士论文】物理世界中可泛化且可扩展的机器人学习

专知会员服务

21+阅读 · 1月18日

构建具身智能新范式：人形机器人技术现状及发展趋势综述

构建具身智能新范式：人形机器人技术现状及发展趋势综述

专知会员服务

27+阅读 · 2025年5月12日

【斯坦福大学博士论文】学习连续体机器人控制中的主要动力学

【斯坦福大学博士论文】学习连续体机器人控制中的主要动力学

专知会员服务

16+阅读 · 2025年4月19日

【剑桥博士论文】面向多机器人系统的学习型协同感知与控制

【剑桥博士论文】面向多机器人系统的学习型协同感知与控制

专知会员服务

24+阅读 · 2025年3月26日

【人形机器人系列报告】多维度赋能，人形机器人蓄势待发

【人形机器人系列报告】多维度赋能，人形机器人蓄势待发

专知会员服务

44+阅读 · 2023年7月31日

人形机器人行业深度：具身智能，迈向广阔蓝海市场

人形机器人行业深度：具身智能，迈向广阔蓝海市场

专知会员服务

51+阅读 · 2023年7月2日

《集群机器人中自组织任务分配的全局到局部设计》2022最新12页论文，布鲁塞尔自由大学等

《集群机器人中自组织任务分配的全局到局部设计》2022最新12页论文，布鲁塞尔自由大学等

专知会员服务

50+阅读 · 2022年11月14日

301页pdf伯克利博士论文《可扩展机器人学习》，系统全面阐述机器人技术

301页pdf伯克利博士论文《可扩展机器人学习》，系统全面阐述机器人技术

专知会员服务

36+阅读 · 2022年8月16日

【含源代码】《用机器学习提高超视距空战中的态势感知能力》最新论文，巴西空军高级研究学院、卡内基梅隆大学机器人研究所

【含源代码】《用机器学习提高超视距空战中的态势感知能力》最新论文，巴西空军高级研究学院、卡内基梅隆大学机器人研究所

专知会员服务

117+阅读 · 2022年6月20日

【2020新书】基于人工智能的机器人安全学习和控制，138页pdf

【2020新书】基于人工智能的机器人安全学习和控制，138页pdf

专知会员服务

52+阅读 · 2020年12月12日

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

专知

12+阅读 · 2023年4月4日

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

26+阅读 · 2022年11月24日

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

专知

29+阅读 · 2022年11月23日

【硬核书】《现代机器人学：机构、规划与控制》，642页pdf

【硬核书】《现代机器人学：机构、规划与控制》，642页pdf

专知

13+阅读 · 2022年5月2日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

105+阅读 · 2022年4月28日

【干货书】《Transformers 机器学习:深度探究》，284页pdf

【干货书】《Transformers 机器学习:深度探究》，284页pdf

专知

72+阅读 · 2022年4月21日

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人大讲堂

18+阅读 · 2019年7月5日

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

专知

10+阅读 · 2019年1月18日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

从信息瓶颈理论一瞥机器学习的“大一统理论”

从信息瓶颈理论一瞥机器学习的“大一统理论”

PaperWeekly

14+阅读 · 2019年1月4日

共融机器人战略规划研究和学术交流

国家自然科学基金

13+阅读 · 2016年12月31日

人类步行机理认知下的双足机器人步态与智能协同进化理论基础

国家自然科学基金

0+阅读 · 2015年12月31日

三维空间基于角度测量的多机器人系统协同定位与编队控制

国家自然科学基金

11+阅读 · 2015年12月31日

人机协调稳定约束的单腿外骨骼机器人自适应式动平衡助行控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于智能空间的云机器人行为知识驱动服务机制研究

国家自然科学基金

3+阅读 · 2015年12月31日

多旋翼空中操作机器人的一体化设计及动态运动规划

国家自然科学基金

1+阅读 · 2015年12月31日

基于形态改变的多体空间系统动力学建模、运动规划与最优控制

国家自然科学基金

0+阅读 · 2014年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

Learning Humanoid End-Effector Control for Open-Vocabulary Visual Loco-Manipulation

Arxiv

0+阅读 · 2月18日

TRANS: Terrain-aware Reinforcement Learning for Agile Navigation of Quadruped Robots under Social Interactions

Arxiv

0+阅读 · 2月13日

APEX: Learning Adaptive High-Platform Traversal for Humanoid Robots

Arxiv

0+阅读 · 2月11日

Morphogenetic Assembly and Adaptive Control for Heterogeneous Modular Robots

Arxiv

0+阅读 · 2月11日

A Survey of Behavior Foundation Model: Next-Generation Whole-Body Control System of Humanoid Robots

Arxiv

0+阅读 · 2月9日

TextOp: Real-time Interactive Text-Driven Humanoid Robot Motion Generation and Control

Arxiv

0+阅读 · 2月7日

Scalable Dexterous Robot Learning with AR-based Remote Human-Robot Interactions

Arxiv

0+阅读 · 2月7日

Now You See That: Learning End-to-End Humanoid Locomotion from Raw Pixels

Arxiv

0+阅读 · 2月6日

Scalable and General Whole-Body Control for Cross-Humanoid Locomotion

Arxiv

0+阅读 · 2月5日

Embodiment-Aware Generalist Specialist Distillation for Unified Humanoid Whole-Body Control

Arxiv

0+阅读 · 2月3日

VIP会员

文章信息

相关主题

机器人控制

相关VIP内容

【伯克利博士论文】物理世界中可泛化且可扩展的机器人学习

【伯克利博士论文】物理世界中可泛化且可扩展的机器人学习

专知会员服务

21+阅读 · 1月18日

构建具身智能新范式：人形机器人技术现状及发展趋势综述

构建具身智能新范式：人形机器人技术现状及发展趋势综述

专知会员服务

27+阅读 · 2025年5月12日

【斯坦福大学博士论文】学习连续体机器人控制中的主要动力学

【斯坦福大学博士论文】学习连续体机器人控制中的主要动力学

专知会员服务

16+阅读 · 2025年4月19日

【剑桥博士论文】面向多机器人系统的学习型协同感知与控制

【剑桥博士论文】面向多机器人系统的学习型协同感知与控制

专知会员服务

24+阅读 · 2025年3月26日

【人形机器人系列报告】多维度赋能，人形机器人蓄势待发

【人形机器人系列报告】多维度赋能，人形机器人蓄势待发

专知会员服务

44+阅读 · 2023年7月31日

人形机器人行业深度：具身智能，迈向广阔蓝海市场

人形机器人行业深度：具身智能，迈向广阔蓝海市场

专知会员服务

51+阅读 · 2023年7月2日

《集群机器人中自组织任务分配的全局到局部设计》2022最新12页论文，布鲁塞尔自由大学等

《集群机器人中自组织任务分配的全局到局部设计》2022最新12页论文，布鲁塞尔自由大学等

专知会员服务

50+阅读 · 2022年11月14日

301页pdf伯克利博士论文《可扩展机器人学习》，系统全面阐述机器人技术

301页pdf伯克利博士论文《可扩展机器人学习》，系统全面阐述机器人技术

专知会员服务

36+阅读 · 2022年8月16日

【含源代码】《用机器学习提高超视距空战中的态势感知能力》最新论文，巴西空军高级研究学院、卡内基梅隆大学机器人研究所

【含源代码】《用机器学习提高超视距空战中的态势感知能力》最新论文，巴西空军高级研究学院、卡内基梅隆大学机器人研究所

专知会员服务

117+阅读 · 2022年6月20日

【2020新书】基于人工智能的机器人安全学习和控制，138页pdf

【2020新书】基于人工智能的机器人安全学习和控制，138页pdf

专知会员服务

52+阅读 · 2020年12月12日

热门VIP内容

开通专知VIP会员享更多权益服务

《可信人工智能赋能系统的支柱》

《从经典神经网络到不确定性下的拓扑神经网络：军事应用》2026最新40页报告

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

《人工智能：对战略与力量的影响》slides

相关资讯

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

专知

12+阅读 · 2023年4月4日

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

26+阅读 · 2022年11月24日

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

专知

29+阅读 · 2022年11月23日

【硬核书】《现代机器人学：机构、规划与控制》，642页pdf

【硬核书】《现代机器人学：机构、规划与控制》，642页pdf

专知

13+阅读 · 2022年5月2日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

105+阅读 · 2022年4月28日

【干货书】《Transformers 机器学习:深度探究》，284页pdf

【干货书】《Transformers 机器学习:深度探究》，284页pdf

专知

72+阅读 · 2022年4月21日

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人大讲堂

18+阅读 · 2019年7月5日

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

专知

10+阅读 · 2019年1月18日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

从信息瓶颈理论一瞥机器学习的“大一统理论”

从信息瓶颈理论一瞥机器学习的“大一统理论”

PaperWeekly

14+阅读 · 2019年1月4日

相关论文

Learning Humanoid End-Effector Control for Open-Vocabulary Visual Loco-Manipulation

Arxiv

0+阅读 · 2月18日

TRANS: Terrain-aware Reinforcement Learning for Agile Navigation of Quadruped Robots under Social Interactions

Arxiv

0+阅读 · 2月13日

APEX: Learning Adaptive High-Platform Traversal for Humanoid Robots

Arxiv

0+阅读 · 2月11日

Morphogenetic Assembly and Adaptive Control for Heterogeneous Modular Robots

Arxiv

0+阅读 · 2月11日

A Survey of Behavior Foundation Model: Next-Generation Whole-Body Control System of Humanoid Robots

Arxiv

0+阅读 · 2月9日

TextOp: Real-time Interactive Text-Driven Humanoid Robot Motion Generation and Control

Arxiv

0+阅读 · 2月7日

Scalable Dexterous Robot Learning with AR-based Remote Human-Robot Interactions

Arxiv

0+阅读 · 2月7日

Now You See That: Learning End-to-End Humanoid Locomotion from Raw Pixels

Arxiv

0+阅读 · 2月6日

Scalable and General Whole-Body Control for Cross-Humanoid Locomotion

Arxiv

0+阅读 · 2月5日

Embodiment-Aware Generalist Specialist Distillation for Unified Humanoid Whole-Body Control

Arxiv

0+阅读 · 2月3日

相关基金

共融机器人战略规划研究和学术交流

国家自然科学基金

13+阅读 · 2016年12月31日

人类步行机理认知下的双足机器人步态与智能协同进化理论基础

国家自然科学基金

0+阅读 · 2015年12月31日

三维空间基于角度测量的多机器人系统协同定位与编队控制

国家自然科学基金

11+阅读 · 2015年12月31日

人机协调稳定约束的单腿外骨骼机器人自适应式动平衡助行控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于智能空间的云机器人行为知识驱动服务机制研究

国家自然科学基金

3+阅读 · 2015年12月31日

多旋翼空中操作机器人的一体化设计及动态运动规划

国家自然科学基金

1+阅读 · 2015年12月31日

基于形态改变的多体空间系统动力学建模、运动规划与最优控制

国家自然科学基金

0+阅读 · 2014年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员