Sim-to-Real of Humanoid Locomotion Policies via Joint Torque Space Perturbation Injection - 专知论文

会员服务 ·

0

扰动 · 人体运动 · 控制策略 · 前向 · 生成器 ·

Sim-to-Real of Humanoid Locomotion Policies via Joint Torque Space Perturbation Injection

翻译：面向人体运动策略的仿真到现实转换：基于关节力矩空间扰动注入方法

Junhyeok Rui Cha,Woohyun Cha,Jaeyong Shin,Donghyeon Kim,Jaeheung Park

This paper proposes a novel alternative to existing sim-to-real methods for training control policies with simulated experiences. Unlike prior methods that typically rely on domain randomization over a fixed finite set of parameters, the proposed approach injects state-dependent perturbations into the input joint torque during forward simulation. These perturbations are designed to simulate a broader spectrum of reality gaps than standard parameter randomization without requiring additional training. By using neural networks as flexible perturbation generators, the proposed method can represent complex, state-dependent uncertainties, such as nonlinear actuator dynamics and contact compliance, that parametric randomization cannot capture. Experimental results demonstrate that the proposed approach enables humanoid locomotion policies to achieve superior robustness against complex, unseen reality gaps in both simulation and real-world deployment.

翻译：本文提出一种新颖的替代现有仿真到现实（Sim-to-Real）方法，用于通过仿真经验训练控制策略。与以往依赖固定有限参数集进行域随机化的方法不同，本方法在前向仿真过程中向输入关节力矩注入状态依赖的扰动。这些扰动旨在模拟比标准参数随机化更广泛的实际差距，且无需额外训练。通过使用神经网络作为灵活的扰动生成器，所提方法能够表达参数随机化无法捕捉的复杂、状态依赖的不确定性，例如非线性作动器动力学和接触柔顺性。实验结果表明，本方法使人体运动策略在仿真和实际部署中均能对复杂、未知的实际差距展现出卓越的鲁棒性。

0

相关内容

《基于仿真的空军任务规划优化》

《基于仿真的空军任务规划优化》

专知会员服务

19+阅读 · 6月9日

《采用智能弹药的仿生无人机蜂群实施目标压制》

《采用智能弹药的仿生无人机蜂群实施目标压制》

专知会员服务

22+阅读 · 2025年12月4日

《基于分层多智能体强化学习的逼真空战协同策略》

《基于分层多智能体强化学习的逼真空战协同策略》

专知会员服务

48+阅读 · 2025年10月30日

《战术训练虚拟士兵：一种用于自适应军事模拟的生成式人工智能框架》最新文献

《战术训练虚拟士兵：一种用于自适应军事模拟的生成式人工智能框架》最新文献

专知会员服务

28+阅读 · 2025年9月24日

虚拟人运动控制策略学习方法的研究进展与展望

虚拟人运动控制策略学习方法的研究进展与展望

专知会员服务

19+阅读 · 2024年8月17日

面向机器人系统的虚实迁移强化学习综述

面向机器人系统的虚实迁移强化学习综述

专知会员服务

45+阅读 · 2024年2月8日

虚实结合仿真在军事领域的应用综述

虚实结合仿真在军事领域的应用综述

专知会员服务

101+阅读 · 2023年11月19日

《基于机器和因果学习研究空军模拟器真实感差距》CMU 项目总结15页slides

《基于机器和因果学习研究空军模拟器真实感差距》CMU 项目总结15页slides

专知会员服务

31+阅读 · 2023年1月5日

《机器人导航系统的虚假数据注入：概念和模拟》美海军2022最新73页论文

《机器人导航系统的虚假数据注入：概念和模拟》美海军2022最新73页论文

专知会员服务

34+阅读 · 2022年12月8日

【完整译文】《使用Shapley加和解释基于Agent仿真的军事作战场景》加拿大国防研究与发展部

【完整译文】《使用Shapley加和解释基于Agent仿真的军事作战场景》加拿大国防研究与发展部

专知会员服务

76+阅读 · 2022年8月10日

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

专知

10+阅读 · 2023年4月12日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

52+阅读 · 2022年11月16日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

66+阅读 · 2022年8月25日

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

专知

15+阅读 · 2022年2月16日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

【学界】虚拟对抗训练：一种新颖的半监督学习正则化方法

【学界】虚拟对抗训练：一种新颖的半监督学习正则化方法

GAN生成式对抗网络

10+阅读 · 2019年6月9日

基于 Carsim 2016 和 Simulink的无人车运动控制联合仿真（一）

基于 Carsim 2016 和 Simulink的无人车运动控制联合仿真（一）

无人机

29+阅读 · 2019年5月2日

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

产业智能官

16+阅读 · 2018年12月27日

FAGAN：完全注意力机制（Full Attention）GAN，Self-attention+GAN

FAGAN：完全注意力机制（Full Attention）GAN，Self-attention+GAN

专知

32+阅读 · 2018年8月14日

基于虚拟现实的认知负荷与情绪干扰交互性分析关键技术研究

国家自然科学基金

1+阅读 · 2017年12月31日

基于人机交互的数据驱动式人群行为建模与仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向SEM的惯性粘滑驱动跨尺度精密运动机理和实现方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

非对称扰动下的拟线性椭圆方程解的多重性研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向城市交通通道仿真的交通流建模与组织优化

国家自然科学基金

0+阅读 · 2015年12月31日

空间微装配中基于多维微力及力矩的主动柔顺控制关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

柔性多体系统动力学仿真算法数值稳定性研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于形态改变的多体空间系统动力学建模、运动规划与最优控制

国家自然科学基金

0+阅读 · 2014年12月31日

面向人与Agent混合的多团队协作仿真训练方法研究

国家自然科学基金

19+阅读 · 2012年12月31日

数据和模型混合驱动的虚拟人群行为仿真技术研究及其在军事中的应用

国家自然科学基金

10+阅读 · 2011年12月31日

QuadVerse: An Integrated Framework Aligning Visual-Physical Reality for Quadruped Simulation

Arxiv

0+阅读 · 6月8日

Seeing Realism from Simulation: Efficient Video Transfer for Vision-Language-Action Data Augmentation

Arxiv

0+阅读 · 5月4日

Make Tracking Easy: Neural Motion Retargeting for Humanoid Whole-body Control

Arxiv

0+阅读 · 4月17日

Sim-to-Real Transfer for Muscle-Actuated Robots via Generalized Actuator Networks

Arxiv

0+阅读 · 4月10日

Leaderless Collective Motion in Affine Formation Control over the Complex Plane

Arxiv

0+阅读 · 4月7日

Neural Assistive Impulses: Synthesizing Exaggerated Motions for Physics-based Characters

Arxiv

0+阅读 · 4月7日

A virtual-variable-length method for robust inverse kinematics of multi-segment continuum robots

Arxiv

0+阅读 · 4月2日

Enabling topography-resolving structural dynamic contact simulation

Arxiv

0+阅读 · 3月27日

Toward Reliable Sim-to-Real Predictability for MoE-based Robust Quadrupedal Locomotion

Arxiv

0+阅读 · 3月26日

Sim-to-Real of Humanoid Locomotion Policies via Joint Torque Space Perturbation Injection

Arxiv

0+阅读 · 3月25日

VIP会员

文章信息

相关主题

最新内容

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

4+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

5+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

5+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

5+阅读 · 7月20日

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

3+阅读 · 7月20日

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

5+阅读 · 7月20日

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

专知会员服务

5+阅读 · 7月20日

深入Project Maven：为何人工智能在战场上依然失灵

深入Project Maven：为何人工智能在战场上依然失灵

专知会员服务

14+阅读 · 7月19日

锻造未来士兵：外骨骼、基因工程与赛博格

锻造未来士兵：外骨骼、基因工程与赛博格

专知会员服务

7+阅读 · 7月19日

《无人机系统（UAS）通信网状网络试验性部署》50页报告

《无人机系统（UAS）通信网状网络试验性部署》50页报告

专知会员服务

7+阅读 · 7月19日

《无人机蜂群通信技术研究》50页

《无人机蜂群通信技术研究》50页

专知会员服务

8+阅读 · 7月19日

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

专知会员服务

12+阅读 · 7月18日

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

专知会员服务

8+阅读 · 7月18日

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

专知会员服务

13+阅读 · 7月18日

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

专知会员服务

10+阅读 · 7月18日

相关VIP内容

《基于仿真的空军任务规划优化》

《基于仿真的空军任务规划优化》

专知会员服务

19+阅读 · 6月9日

《采用智能弹药的仿生无人机蜂群实施目标压制》

《采用智能弹药的仿生无人机蜂群实施目标压制》

专知会员服务

22+阅读 · 2025年12月4日

《基于分层多智能体强化学习的逼真空战协同策略》

《基于分层多智能体强化学习的逼真空战协同策略》

专知会员服务

48+阅读 · 2025年10月30日

《战术训练虚拟士兵：一种用于自适应军事模拟的生成式人工智能框架》最新文献

《战术训练虚拟士兵：一种用于自适应军事模拟的生成式人工智能框架》最新文献

专知会员服务

28+阅读 · 2025年9月24日

虚拟人运动控制策略学习方法的研究进展与展望

虚拟人运动控制策略学习方法的研究进展与展望

专知会员服务

19+阅读 · 2024年8月17日

面向机器人系统的虚实迁移强化学习综述

面向机器人系统的虚实迁移强化学习综述

专知会员服务

45+阅读 · 2024年2月8日

虚实结合仿真在军事领域的应用综述

虚实结合仿真在军事领域的应用综述

专知会员服务

101+阅读 · 2023年11月19日

《基于机器和因果学习研究空军模拟器真实感差距》CMU 项目总结15页slides

《基于机器和因果学习研究空军模拟器真实感差距》CMU 项目总结15页slides

专知会员服务

31+阅读 · 2023年1月5日

《机器人导航系统的虚假数据注入：概念和模拟》美海军2022最新73页论文

《机器人导航系统的虚假数据注入：概念和模拟》美海军2022最新73页论文

专知会员服务

34+阅读 · 2022年12月8日

【完整译文】《使用Shapley加和解释基于Agent仿真的军事作战场景》加拿大国防研究与发展部

【完整译文】《使用Shapley加和解释基于Agent仿真的军事作战场景》加拿大国防研究与发展部

专知会员服务

76+阅读 · 2022年8月10日

热门VIP内容

开通专知VIP会员享更多权益服务

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

印度精确打击与指挥架构的断层

美空军AI完成F-16战斗机自主空战历史性试飞

相关资讯

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

【斯坦福博士论文】机器人仿真与控制的组合优化，210页pdf

专知

10+阅读 · 2023年4月12日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

52+阅读 · 2022年11月16日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

66+阅读 · 2022年8月25日

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

专知

15+阅读 · 2022年2月16日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

【学界】虚拟对抗训练：一种新颖的半监督学习正则化方法

【学界】虚拟对抗训练：一种新颖的半监督学习正则化方法

GAN生成式对抗网络

10+阅读 · 2019年6月9日

基于 Carsim 2016 和 Simulink的无人车运动控制联合仿真（一）

基于 Carsim 2016 和 Simulink的无人车运动控制联合仿真（一）

无人机

29+阅读 · 2019年5月2日

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

产业智能官

16+阅读 · 2018年12月27日

FAGAN：完全注意力机制（Full Attention）GAN，Self-attention+GAN

FAGAN：完全注意力机制（Full Attention）GAN，Self-attention+GAN

专知

32+阅读 · 2018年8月14日

相关论文

QuadVerse: An Integrated Framework Aligning Visual-Physical Reality for Quadruped Simulation

Arxiv

0+阅读 · 6月8日

Seeing Realism from Simulation: Efficient Video Transfer for Vision-Language-Action Data Augmentation

Arxiv

0+阅读 · 5月4日

Make Tracking Easy: Neural Motion Retargeting for Humanoid Whole-body Control

Arxiv

0+阅读 · 4月17日

Sim-to-Real Transfer for Muscle-Actuated Robots via Generalized Actuator Networks

Arxiv

0+阅读 · 4月10日

Leaderless Collective Motion in Affine Formation Control over the Complex Plane

Arxiv

0+阅读 · 4月7日

Neural Assistive Impulses: Synthesizing Exaggerated Motions for Physics-based Characters

Arxiv

0+阅读 · 4月7日

A virtual-variable-length method for robust inverse kinematics of multi-segment continuum robots

Arxiv

0+阅读 · 4月2日

Enabling topography-resolving structural dynamic contact simulation

Arxiv

0+阅读 · 3月27日

Toward Reliable Sim-to-Real Predictability for MoE-based Robust Quadrupedal Locomotion

Arxiv

0+阅读 · 3月26日

Sim-to-Real of Humanoid Locomotion Policies via Joint Torque Space Perturbation Injection

Arxiv

0+阅读 · 3月25日

相关基金

基于虚拟现实的认知负荷与情绪干扰交互性分析关键技术研究

国家自然科学基金

1+阅读 · 2017年12月31日

基于人机交互的数据驱动式人群行为建模与仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向SEM的惯性粘滑驱动跨尺度精密运动机理和实现方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

非对称扰动下的拟线性椭圆方程解的多重性研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向城市交通通道仿真的交通流建模与组织优化

国家自然科学基金

0+阅读 · 2015年12月31日

空间微装配中基于多维微力及力矩的主动柔顺控制关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

柔性多体系统动力学仿真算法数值稳定性研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于形态改变的多体空间系统动力学建模、运动规划与最优控制

国家自然科学基金

0+阅读 · 2014年12月31日

面向人与Agent混合的多团队协作仿真训练方法研究

国家自然科学基金

19+阅读 · 2012年12月31日

数据和模型混合驱动的虚拟人群行为仿真技术研究及其在军事中的应用

国家自然科学基金

10+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员