Unified Walking, Running, and Recovery for Humanoids via State-Dependent Adversarial Motion Priors - 专知论文

会员服务 ·

0

判别器 · Learning · Performer · 阈值 · Projection ·

Unified Walking, Running, and Recovery for Humanoids via State-Dependent Adversarial Motion Priors

翻译：统一行走、奔跑与摔倒恢复：基于状态依赖对抗运动先验的人形机器人控制框架

Yidan Lu,Yichao Zhong,Liu Zhao,Wanyue Li,Peng Lu

We propose a unified reinforcement learning framework that enables a single policy to perform walking, running, and fall recovery on the Unitree G1 humanoid robot, validated on physical hardware without any explicit mode-switching command at deployment. The framework extends Adversarial Motion Priors (AMP) by replacing the conventional global reference distribution with a state-dependent gate that routes each training transition to one of two discriminators: a dedicated recovery discriminator and a velocity-conditioned locomotion discriminator that jointly covers walking and running. The gate is defined by a single fixed threshold on projected gravity: the recovery discriminator is activated when body tilt exceeds approximately $37^\circ$ from vertical ($|g_z+1|>0.6$); otherwise the locomotion discriminator is used, with the normalized commanded velocity serving as a condition that selects the appropriate reference trajectory between walk and run clips. Only three LAFAN1 reference clips are required to regularize the complete behavior set. At deployment, a single frozen ONNX policy executes at 50\,Hz with no runtime mode logic; hardware experiments demonstrate successful recovery from both prone and supine falls and smooth walk-to-run transitions under the same controller.

翻译：我们提出一种统一强化学习框架，使单个策略能够完成Unitree G1人形机器人的行走、奔跑及摔倒恢复，并在物理硬件上完成验证，部署时无需任何显式模式切换指令。该框架扩展了对抗运动先验（AMP），通过用状态依赖门控替代传统全局参考分布，将每次训练转移路由至两个判别器之一：专用的恢复判别器和速度条件化运动判别器（该判别器联合覆盖行走与奔跑）。门控由投影重力的单一固定阈值定义：当身体倾斜超过垂直方向约37°时（|g_z+1|>0.6）激活恢复判别器；否则使用运动判别器，并以归一化指令速度作为条件在行走与奔跑参考轨迹间选择。仅需三个LAFAN1参考片段即可正则化完整行为集。部署时，单个冻结ONNX策略以50Hz频率执行，无需运行时模式逻辑；硬件实验证明该控制器可在无模式切换条件下实现俯卧与仰卧摔倒恢复及平滑的行走-奔跑过渡。

0

相关内容

判别器

【博士论文】重新审视机器人安全性：面向真实世界自主运行的自适应与可扩展方法

【博士论文】重新审视机器人安全性：面向真实世界自主运行的自适应与可扩展方法

专知会员服务

12+阅读 · 2月25日

《自主机器人系统帕累托最优感知架构的多目标生成》2025最新100页

《自主机器人系统帕累托最优感知架构的多目标生成》2025最新100页

专知会员服务

24+阅读 · 2025年11月10日

《迈向真正的机器人队友：推断与运用认知状态以实现新型人类-自主系统协作能力》最新博士论文

《迈向真正的机器人队友：推断与运用认知状态以实现新型人类-自主系统协作能力》最新博士论文

专知会员服务

26+阅读 · 2025年9月27日

《复合人工智能决策优势：面向军事行动的人类数字孪生智能体编队与群体建模》最新文献

《复合人工智能决策优势：面向军事行动的人类数字孪生智能体编队与群体建模》最新文献

专知会员服务

39+阅读 · 2025年9月26日

构建具身智能新范式：人形机器人技术现状及发展趋势综述

构建具身智能新范式：人形机器人技术现状及发展趋势综述

专知会员服务

28+阅读 · 2025年5月12日

CVPR 2025 Highlight | OmniManip：以对象为中心的机器人通用操作框架

CVPR 2025 Highlight | OmniManip：以对象为中心的机器人通用操作框架

专知会员服务

9+阅读 · 2025年4月15日

《多机器人系统协作效能提升：基于模型与数据驱动的具身智能方法》339页

《多机器人系统协作效能提升：基于模型与数据驱动的具身智能方法》339页

专知会员服务

61+阅读 · 2025年4月6日

人形机器人系列报告：AI超预期助力产业落地，核心零部件配套星辰大海

人形机器人系列报告：AI超预期助力产业落地，核心零部件配套星辰大海

专知会员服务

45+阅读 · 2024年3月12日

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

专知会员服务

22+阅读 · 2022年3月29日

基于深度强化学习的机器人运动控制研究进展

专知会员服务

66+阅读 · 2021年4月22日

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

专知

23+阅读 · 2023年4月8日

推荐！【美国国防分析顶点报告】《机器人和自主系统：有人/无人组队(RAS-MUM-T)》107页报告

推荐！【美国国防分析顶点报告】《机器人和自主系统：有人/无人组队(RAS-MUM-T)》107页报告

专知

39+阅读 · 2022年9月12日

推荐！《机器人和自主系统：有人/无人组队(RAS-MUM-T)》107页报告

推荐！《机器人和自主系统：有人/无人组队(RAS-MUM-T)》107页报告

专知

55+阅读 · 2022年9月11日

【硬核书】《现代机器人学：机构、规划与控制》，642页pdf

【硬核书】《现代机器人学：机构、规划与控制》，642页pdf

专知

13+阅读 · 2022年5月2日

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人大讲堂

19+阅读 · 2019年7月5日

【前沿】让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法！

【前沿】让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法！

中国自动化学会

11+阅读 · 2019年6月18日

国外有人/无人平台协同作战概述

国外有人/无人平台协同作战概述

无人机

123+阅读 · 2019年5月28日

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

专知

10+阅读 · 2019年1月18日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

【泡泡机器人公开课】第九十六课：单目相机动态场景三维重建 ‐‐ 从几何驱动到学习驱动--戴玉超

【泡泡机器人公开课】第九十六课：单目相机动态场景三维重建 ‐‐ 从几何驱动到学习驱动--戴玉超

泡泡机器人SLAM

12+阅读 · 2018年9月1日

基于身心共融运动训练的肢体康复机器人多模态反馈方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

面向复杂环境的四足机器人自适应和快速稳定运动控制方法研究及应用

国家自然科学基金

0+阅读 · 2017年12月31日

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

人类步行机理认知下的双足机器人步态与智能协同进化理论基础

国家自然科学基金

0+阅读 · 2015年12月31日

融合人脑意图与力觉反馈的外骨骼机器人步态控制CPG模型及调节方法

国家自然科学基金

0+阅读 · 2015年12月31日

人机协调稳定约束的单腿外骨骼机器人自适应式动平衡助行控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

康复外骨骼机器人主-从无约束辅助行走训练中生物反馈信息的量化表征方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

仿人轻型机械臂人机协作模式关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于脑电与上肢运动信息融合的助行机器人运动控制信息表征方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

ADAPT: Analytical Disturbance-Aware Policy Training for Humanoid Locomotion

Arxiv

0+阅读 · 6月15日

GuideWalk: Learning Unified Autonomous Navigation and Locomotion for Humanoid Robots across Versatile Terrains

Arxiv

0+阅读 · 6月13日

ParkourFormer: Integrating Predictive Supervision and Sequence Modeling into Parkour Locomotion

Arxiv

0+阅读 · 6月12日

X-Loco: Towards Generalist Humanoid Locomotion Control via Synergetic Policy Distillation

Arxiv

0+阅读 · 6月12日

Stubborn: A Streamlined and Unified Reinforcement Learning Framework for Robust Motion Tracking and Fall Recovery for Humanoids

Arxiv

0+阅读 · 6月11日

Critic Architecture Matters: Dual vs. Unified Critics for Humanoid Loco-Manipulation

Arxiv

0+阅读 · 6月10日

Scalable and General Whole-Body Control for Cross-Humanoid Locomotion

Arxiv

0+阅读 · 6月9日

Perceptive Behavior Foundation Model: Adapting Human Motion Priors to Robot-Centric Terrain

Arxiv

0+阅读 · 6月6日

Predictive Style Matching: Natural and Robust Humanoid Locomotion

Arxiv

0+阅读 · 6月5日

Unify Robot Actions in Camera Frame

Arxiv

0+阅读 · 5月13日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

3+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

4+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

6+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

5+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

21+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

【博士论文】重新审视机器人安全性：面向真实世界自主运行的自适应与可扩展方法

【博士论文】重新审视机器人安全性：面向真实世界自主运行的自适应与可扩展方法

专知会员服务

12+阅读 · 2月25日

《自主机器人系统帕累托最优感知架构的多目标生成》2025最新100页

《自主机器人系统帕累托最优感知架构的多目标生成》2025最新100页

专知会员服务

24+阅读 · 2025年11月10日

《迈向真正的机器人队友：推断与运用认知状态以实现新型人类-自主系统协作能力》最新博士论文

《迈向真正的机器人队友：推断与运用认知状态以实现新型人类-自主系统协作能力》最新博士论文

专知会员服务

26+阅读 · 2025年9月27日

《复合人工智能决策优势：面向军事行动的人类数字孪生智能体编队与群体建模》最新文献

《复合人工智能决策优势：面向军事行动的人类数字孪生智能体编队与群体建模》最新文献

专知会员服务

39+阅读 · 2025年9月26日

构建具身智能新范式：人形机器人技术现状及发展趋势综述

构建具身智能新范式：人形机器人技术现状及发展趋势综述

专知会员服务

28+阅读 · 2025年5月12日

CVPR 2025 Highlight | OmniManip：以对象为中心的机器人通用操作框架

CVPR 2025 Highlight | OmniManip：以对象为中心的机器人通用操作框架

专知会员服务

9+阅读 · 2025年4月15日

《多机器人系统协作效能提升：基于模型与数据驱动的具身智能方法》339页

《多机器人系统协作效能提升：基于模型与数据驱动的具身智能方法》339页

专知会员服务

61+阅读 · 2025年4月6日

人形机器人系列报告：AI超预期助力产业落地，核心零部件配套星辰大海

人形机器人系列报告：AI超预期助力产业落地，核心零部件配套星辰大海

专知会员服务

45+阅读 · 2024年3月12日

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

专知会员服务

22+阅读 · 2022年3月29日

基于深度强化学习的机器人运动控制研究进展

专知会员服务

66+阅读 · 2021年4月22日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

专知

23+阅读 · 2023年4月8日

推荐！【美国国防分析顶点报告】《机器人和自主系统：有人/无人组队(RAS-MUM-T)》107页报告

推荐！【美国国防分析顶点报告】《机器人和自主系统：有人/无人组队(RAS-MUM-T)》107页报告

专知

39+阅读 · 2022年9月12日

推荐！《机器人和自主系统：有人/无人组队(RAS-MUM-T)》107页报告

推荐！《机器人和自主系统：有人/无人组队(RAS-MUM-T)》107页报告

专知

55+阅读 · 2022年9月11日

【硬核书】《现代机器人学：机构、规划与控制》，642页pdf

【硬核书】《现代机器人学：机构、规划与控制》，642页pdf

专知

13+阅读 · 2022年5月2日

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人大讲堂

19+阅读 · 2019年7月5日

【前沿】让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法！

【前沿】让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法！

中国自动化学会

11+阅读 · 2019年6月18日

国外有人/无人平台协同作战概述

国外有人/无人平台协同作战概述

无人机

123+阅读 · 2019年5月28日

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

【Science机器人2019子刊AI5篇新论文】不止模仿：通过学习概念的认知程序实现机器人零数据任务迁移

专知

10+阅读 · 2019年1月18日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

【泡泡机器人公开课】第九十六课：单目相机动态场景三维重建 ‐‐ 从几何驱动到学习驱动--戴玉超

【泡泡机器人公开课】第九十六课：单目相机动态场景三维重建 ‐‐ 从几何驱动到学习驱动--戴玉超

泡泡机器人SLAM

12+阅读 · 2018年9月1日

相关论文

ADAPT: Analytical Disturbance-Aware Policy Training for Humanoid Locomotion

Arxiv

0+阅读 · 6月15日

GuideWalk: Learning Unified Autonomous Navigation and Locomotion for Humanoid Robots across Versatile Terrains

Arxiv

0+阅读 · 6月13日

ParkourFormer: Integrating Predictive Supervision and Sequence Modeling into Parkour Locomotion

Arxiv

0+阅读 · 6月12日

X-Loco: Towards Generalist Humanoid Locomotion Control via Synergetic Policy Distillation

Arxiv

0+阅读 · 6月12日

Stubborn: A Streamlined and Unified Reinforcement Learning Framework for Robust Motion Tracking and Fall Recovery for Humanoids

Arxiv

0+阅读 · 6月11日

Critic Architecture Matters: Dual vs. Unified Critics for Humanoid Loco-Manipulation

Arxiv

0+阅读 · 6月10日

Scalable and General Whole-Body Control for Cross-Humanoid Locomotion

Arxiv

0+阅读 · 6月9日

Perceptive Behavior Foundation Model: Adapting Human Motion Priors to Robot-Centric Terrain

Arxiv

0+阅读 · 6月6日

Predictive Style Matching: Natural and Robust Humanoid Locomotion

Arxiv

0+阅读 · 6月5日

Unify Robot Actions in Camera Frame

Arxiv

0+阅读 · 5月13日

相关基金

基于身心共融运动训练的肢体康复机器人多模态反馈方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

面向复杂环境的四足机器人自适应和快速稳定运动控制方法研究及应用

国家自然科学基金

0+阅读 · 2017年12月31日

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

人类步行机理认知下的双足机器人步态与智能协同进化理论基础

国家自然科学基金

0+阅读 · 2015年12月31日

融合人脑意图与力觉反馈的外骨骼机器人步态控制CPG模型及调节方法

国家自然科学基金

0+阅读 · 2015年12月31日

人机协调稳定约束的单腿外骨骼机器人自适应式动平衡助行控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

康复外骨骼机器人主-从无约束辅助行走训练中生物反馈信息的量化表征方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

仿人轻型机械臂人机协作模式关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于脑电与上肢运动信息融合的助行机器人运动控制信息表征方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员