AME-2: Agile and Generalized Legged Locomotion via Attention-Based Neural Map Encoding - 专知论文

会员服务 ·

0

遮挡 · 敏捷性 · 泛化 · 泛化能力 · 图流 ·

AME-2: Agile and Generalized Legged Locomotion via Attention-Based Neural Map Encoding

翻译：AME-2：基于注意力神经地图编码的敏捷与通用腿部运动

Chong Zhang,Victor Klemm,Fan Yang,Marco Hutter

from arxiv, under review

Achieving agile and generalized legged locomotion across terrains requires tight integration of perception and control, especially under occlusions and sparse footholds. Existing methods have demonstrated agility on parkour courses but often rely on end-to-end sensorimotor models with limited generalization and interpretability. By contrast, methods targeting generalized locomotion typically exhibit limited agility and struggle with visual occlusions. We introduce AME-2, a unified reinforcement learning (RL) framework for agile and generalized locomotion that incorporates a novel attention-based map encoder in the control policy. This encoder extracts local and global mapping features and uses attention mechanisms to focus on salient regions, producing an interpretable and generalized embedding for RL-based control. We further propose a learning-based mapping pipeline that provides fast, uncertainty-aware terrain representations robust to noise and occlusions, serving as policy inputs. It uses neural networks to convert depth observations into local elevations with uncertainties, and fuses them with odometry. The pipeline also integrates with parallel simulation so that we can train controllers with online mapping, aiding sim-to-real transfer. We validate AME-2 with the proposed mapping pipeline on a quadruped and a biped robot, and the resulting controllers demonstrate strong agility and generalization to unseen terrains in simulation and in real-world experiments.

翻译：实现跨地形敏捷且通用的腿部运动，需要感知与控制的紧密整合，尤其在遮挡和稀疏立足点条件下。现有方法已在跑酷动作中展示出敏捷性，但常依赖端到端感知运动模型，存在泛化能力有限及可解释性不足的问题。相比之下，针对通用运动的方法通常敏捷性有限，且难以应对视觉遮挡。我们提出AME-2——一个统一的强化学习框架，用于实现敏捷与通用腿部运动，其在控制策略中引入了新型基于注意力机制的地图编码器。该编码器提取局部与全局地图特征，并利用注意力机制聚焦显著区域，为基于强化学习的控制生成可解释且通用的嵌入表征。我们进一步提出基于学习的建图流程，该流程能快速提供具有不确定性感知的地形表征，对噪声与遮挡具有鲁棒性，并作为策略输入。该流程利用神经网络将深度观测转换为带有不确定性的局部高程值，并与里程计数据融合。该流程还与并行仿真集成，使我们能够通过在线建图训练控制器，助力仿真到现实的迁移。我们利用所提出的建图流程在四足机器人和双足机器人上验证了AME-2，所得控制器在仿真和真实世界实验中展现出强大的敏捷性以及对未知地形的泛化能力。

0

相关内容

《机器人弹性物体感知技术研究》227页

《机器人弹性物体感知技术研究》227页

专知会员服务

17+阅读 · 2025年11月20日

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

专知会员服务

26+阅读 · 2025年11月17日

《战场GPS拒止环境下基于地标定位的安全路径导航》

《战场GPS拒止环境下基于地标定位的安全路径导航》

专知会员服务

18+阅读 · 2025年5月22日

【CVPR2025】MixerMDM：可学习的人体运动扩散模型组合

【CVPR2025】MixerMDM：可学习的人体运动扩散模型组合

专知会员服务

10+阅读 · 2025年4月3日

虚拟人运动控制策略学习方法的研究进展与展望

虚拟人运动控制策略学习方法的研究进展与展望

专知会员服务

19+阅读 · 2024年8月17日

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

专知会员服务

22+阅读 · 2022年3月29日

【CVPR 2022】AME：超参数优化中的注意力和记忆增强，AME: Attention and Memory Enhancement in Hyper-Parameter Optimization

【CVPR 2022】AME：超参数优化中的注意力和记忆增强，AME: Attention and Memory Enhancement in Hyper-Parameter Optimization

专知会员服务

11+阅读 · 2022年3月19日

【ACMMM2021】通用近似交叉验证的模型选择：监督、半监督与比对学习

专知会员服务

16+阅读 · 2021年10月10日

【Nature论文】用于理解图像分类决策和改进神经网络鲁棒性的对抗性解释（Adversarial Explanations for Understanding Image Classiﬁcation Decisions and Improved Neural Network Robustness ）

【Nature论文】用于理解图像分类决策和改进神经网络鲁棒性的对抗性解释（Adversarial Explanations for Understanding Image Classiﬁcation Decisions and Improved Neural Network Robustness ）

专知会员服务

13+阅读 · 2019年11月25日

【南洋理工大学课程】注意力神经网络，Attention Neural Networks，附78页PPT

【南洋理工大学课程】注意力神经网络，Attention Neural Networks，附78页PPT

专知会员服务

157+阅读 · 2019年11月9日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

超全汇总 | ORB-SLAM2 / ORB-SLAM3 相关改进代码！

超全汇总 | ORB-SLAM2 / ORB-SLAM3 相关改进代码！

计算机视觉life

35+阅读 · 2020年11月22日

注意力机制在分类网络中的应用：SENet、SKNet、CBAM

注意力机制在分类网络中的应用：SENet、SKNet、CBAM

极市平台

15+阅读 · 2020年5月17日

图神经网络（Graph Neural Networks，GNN）综述

图神经网络（Graph Neural Networks，GNN）综述

极市平台

104+阅读 · 2019年11月27日

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

泡泡机器人SLAM

14+阅读 · 2019年6月28日

【泡泡机器人】也来谈语义SLAM/语义地图

【泡泡机器人】也来谈语义SLAM/语义地图

泡泡机器人SLAM

21+阅读 · 2019年3月12日

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

10+阅读 · 2019年2月18日

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

AINLP

35+阅读 · 2018年11月6日

目标跟踪算法分类

目标跟踪算法分类

算法与数据结构

20+阅读 · 2018年9月28日

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

专知

12+阅读 · 2018年1月12日

基于单目RGB/RGBD相机的身体运动和面部运动同步捕获方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

融合人脑意图与力觉反馈的外骨骼机器人步态控制CPG模型及调节方法

国家自然科学基金

0+阅读 · 2015年12月31日

视频场景下大位移运动目标的持续性跟踪方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的高频地波雷达特定目标跟踪方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

仿动物大脑网格细胞神经定位机制的同步定位与地图构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于可穿戴传感和触觉反馈的膝骨关节炎患者步态训练系统研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向人体运动干扰和生物安全的无线体域网协作通信技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

由偏振标记，由光纤远程柔性、共路传输的二合一固体微片激光回馈干涉仪

国家自然科学基金

0+阅读 · 2014年12月31日

基于视觉注意与眼动跟踪的地图认知计算模型与方法研究

国家自然科学基金

6+阅读 · 2014年12月31日

基于目标导向MI-EEGas的上肢运动康复方法双向适应性研究

国家自然科学基金

0+阅读 · 2014年12月31日

MoCapAnything V2: End-to-End Motion Capture for Arbitrary Skeletons

Arxiv

0+阅读 · 4月30日

Make Tracking Easy: Neural Motion Retargeting for Humanoid Whole-body Control

Arxiv

0+阅读 · 4月17日

Goal2Skill: Long-Horizon Manipulation with Adaptive Planning and Reflection

Arxiv

0+阅读 · 4月15日

Tele-Catch: Adaptive Teleoperation for Dexterous Dynamic 3D Object Catching

Arxiv

0+阅读 · 3月30日

Search2Motion: Training-Free Object-Level Motion Control via Attention-Consensus Search

Arxiv

0+阅读 · 3月18日

GOT-JEPA: Generic Object Tracking with Model Adaptation and Occlusion Handling using Joint-Embedding Predictive Architecture

Arxiv

0+阅读 · 3月15日

Vision-Guided MPPI for Agile Drone Racing: Navigating Arbitrary Gate Poses via Neural Signed Distance Fields

Arxiv

0+阅读 · 3月7日

Look Forward to Walk Backward: Efficient Terrain Memory for Backward Locomotion with Forward Vision

Arxiv

0+阅读 · 3月3日

InCoM: Intent-Driven Perception and Structured Coordination for Whole-Body Mobile Manipulation

Arxiv

0+阅读 · 2月26日

KCFRC: Kinematic Collision-Aware Foothold Reachability Criteria for Legged Locomotion

Arxiv

0+阅读 · 2月24日

VIP会员

文章信息

相关主题

最新内容

ICML 2026｜ECA：面向开放式图文生成的高效持续对齐

ICML 2026｜ECA：面向开放式图文生成的高效持续对齐

专知会员服务

1+阅读 · 今天15:19

可信智能体AI综述：安全、鲁棒性、隐私与系统安全

可信智能体AI综述：安全、鲁棒性、隐私与系统安全

专知会员服务

1+阅读 · 今天15:17

俄乌战场地面机器人如何改写战争规则

俄乌战场地面机器人如何改写战争规则

专知会员服务

3+阅读 · 今天13:58

美国海军研究生院第23届年度采购研究研讨会与创新峰会：主题“加速作战能力”，附会议报告论文集1300页

美国海军研究生院第23届年度采购研究研讨会与创新峰会：主题“加速作战能力”，附会议报告论文集1300页

专知会员服务

3+阅读 · 今天13:36

《新空中力量概念：来自敏捷战斗运用的启示》2026最新50页报告

《新空中力量概念：来自敏捷战斗运用的启示》2026最新50页报告

专知会员服务

3+阅读 · 今天13:33

《无人水面艇文献综述与结构设计》135页

《无人水面艇文献综述与结构设计》135页

专知会员服务

10+阅读 · 6月13日

《自主蜂群系统的战略架构：多域一体化、抗毁韧性及海上作战框架（2025—2035）》46页报告

《自主蜂群系统的战略架构：多域一体化、抗毁韧性及海上作战框架（2025—2035）》46页报告

专知会员服务

9+阅读 · 6月13日

ICML 2026｜MEMOPILOT：用强化学习训练会进化的智能体记忆

ICML 2026｜MEMOPILOT：用强化学习训练会进化的智能体记忆

专知会员服务

2+阅读 · 6月13日

智能体时间序列系统全景综述：架构、可靠性与研究前沿

智能体时间序列系统全景综述：架构、可靠性与研究前沿

专知会员服务

10+阅读 · 6月13日

AUTOLAB：86亿Token实测前沿模型的长程自动科研能力

AUTOLAB：86亿Token实测前沿模型的长程自动科研能力

专知会员服务

8+阅读 · 6月12日

CVPR 2026趋势报告：视觉AI正在走向世界模型与物理智能，165页ppt

CVPR 2026趋势报告：视觉AI正在走向世界模型与物理智能，165页ppt

专知会员服务

22+阅读 · 6月12日

乌克兰战场背后的新武器

乌克兰战场背后的新武器

专知会员服务

7+阅读 · 6月12日

《信任但需验证：军事决策背景下的大型语言模型品格、能力与控制》2026最新59页报告

《信任但需验证：军事决策背景下的大型语言模型品格、能力与控制》2026最新59页报告

专知会员服务

12+阅读 · 6月12日

未来战争：乌克兰2026年反攻中的作战经验教训 - 新军事战略之“后勤封锁”（中文下载）

未来战争：乌克兰2026年反攻中的作战经验教训 - 新军事战略之“后勤封锁”（中文下载）

专知会员服务

9+阅读 · 6月12日

基于博弈论的陆军人机协同（长文报告）

基于博弈论的陆军人机协同（长文报告）

专知会员服务

13+阅读 · 6月12日

相关VIP内容

《机器人弹性物体感知技术研究》227页

《机器人弹性物体感知技术研究》227页

专知会员服务

17+阅读 · 2025年11月20日

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

《面向大语言模型引导规划、赌徒驱动探索与多智能体导航的分层决策》最新180页

专知会员服务

26+阅读 · 2025年11月17日

《战场GPS拒止环境下基于地标定位的安全路径导航》

《战场GPS拒止环境下基于地标定位的安全路径导航》

专知会员服务

18+阅读 · 2025年5月22日

【CVPR2025】MixerMDM：可学习的人体运动扩散模型组合

【CVPR2025】MixerMDM：可学习的人体运动扩散模型组合

专知会员服务

10+阅读 · 2025年4月3日

虚拟人运动控制策略学习方法的研究进展与展望

虚拟人运动控制策略学习方法的研究进展与展望

专知会员服务

19+阅读 · 2024年8月17日

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

专知会员服务

22+阅读 · 2022年3月29日

【CVPR 2022】AME：超参数优化中的注意力和记忆增强，AME: Attention and Memory Enhancement in Hyper-Parameter Optimization

【CVPR 2022】AME：超参数优化中的注意力和记忆增强，AME: Attention and Memory Enhancement in Hyper-Parameter Optimization

专知会员服务

11+阅读 · 2022年3月19日

【ACMMM2021】通用近似交叉验证的模型选择：监督、半监督与比对学习

专知会员服务

16+阅读 · 2021年10月10日

【Nature论文】用于理解图像分类决策和改进神经网络鲁棒性的对抗性解释（Adversarial Explanations for Understanding Image Classiﬁcation Decisions and Improved Neural Network Robustness ）

【Nature论文】用于理解图像分类决策和改进神经网络鲁棒性的对抗性解释（Adversarial Explanations for Understanding Image Classiﬁcation Decisions and Improved Neural Network Robustness ）

专知会员服务

13+阅读 · 2019年11月25日

【南洋理工大学课程】注意力神经网络，Attention Neural Networks，附78页PPT

【南洋理工大学课程】注意力神经网络，Attention Neural Networks，附78页PPT

专知会员服务

157+阅读 · 2019年11月9日

热门VIP内容

开通专知VIP会员享更多权益服务

可信智能体AI综述：安全、鲁棒性、隐私与系统安全

美国海军研究生院第23届年度采购研究研讨会与创新峰会：主题“加速作战能力”，附会议报告论文集1300页

ICML 2026｜ECA：面向开放式图文生成的高效持续对齐

俄乌战场地面机器人如何改写战争规则

相关资讯

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

超全汇总 | ORB-SLAM2 / ORB-SLAM3 相关改进代码！

超全汇总 | ORB-SLAM2 / ORB-SLAM3 相关改进代码！

计算机视觉life

35+阅读 · 2020年11月22日

注意力机制在分类网络中的应用：SENet、SKNet、CBAM

注意力机制在分类网络中的应用：SENet、SKNet、CBAM

极市平台

15+阅读 · 2020年5月17日

图神经网络（Graph Neural Networks，GNN）综述

图神经网络（Graph Neural Networks，GNN）综述

极市平台

104+阅读 · 2019年11月27日

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

泡泡机器人SLAM

14+阅读 · 2019年6月28日

【泡泡机器人】也来谈语义SLAM/语义地图

【泡泡机器人】也来谈语义SLAM/语义地图

泡泡机器人SLAM

21+阅读 · 2019年3月12日

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

10+阅读 · 2019年2月18日

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

AINLP

35+阅读 · 2018年11月6日

目标跟踪算法分类

目标跟踪算法分类

算法与数据结构

20+阅读 · 2018年9月28日

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

专知

12+阅读 · 2018年1月12日

相关论文

MoCapAnything V2: End-to-End Motion Capture for Arbitrary Skeletons

Arxiv

0+阅读 · 4月30日

Make Tracking Easy: Neural Motion Retargeting for Humanoid Whole-body Control

Arxiv

0+阅读 · 4月17日

Goal2Skill: Long-Horizon Manipulation with Adaptive Planning and Reflection

Arxiv

0+阅读 · 4月15日

Tele-Catch: Adaptive Teleoperation for Dexterous Dynamic 3D Object Catching

Arxiv

0+阅读 · 3月30日

Search2Motion: Training-Free Object-Level Motion Control via Attention-Consensus Search

Arxiv

0+阅读 · 3月18日

GOT-JEPA: Generic Object Tracking with Model Adaptation and Occlusion Handling using Joint-Embedding Predictive Architecture

Arxiv

0+阅读 · 3月15日

Vision-Guided MPPI for Agile Drone Racing: Navigating Arbitrary Gate Poses via Neural Signed Distance Fields

Arxiv

0+阅读 · 3月7日

Look Forward to Walk Backward: Efficient Terrain Memory for Backward Locomotion with Forward Vision

Arxiv

0+阅读 · 3月3日

InCoM: Intent-Driven Perception and Structured Coordination for Whole-Body Mobile Manipulation

Arxiv

0+阅读 · 2月26日

KCFRC: Kinematic Collision-Aware Foothold Reachability Criteria for Legged Locomotion

Arxiv

0+阅读 · 2月24日

相关基金

基于单目RGB/RGBD相机的身体运动和面部运动同步捕获方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

融合人脑意图与力觉反馈的外骨骼机器人步态控制CPG模型及调节方法

国家自然科学基金

0+阅读 · 2015年12月31日

视频场景下大位移运动目标的持续性跟踪方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的高频地波雷达特定目标跟踪方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

仿动物大脑网格细胞神经定位机制的同步定位与地图构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于可穿戴传感和触觉反馈的膝骨关节炎患者步态训练系统研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向人体运动干扰和生物安全的无线体域网协作通信技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

由偏振标记，由光纤远程柔性、共路传输的二合一固体微片激光回馈干涉仪

国家自然科学基金

0+阅读 · 2014年12月31日

基于视觉注意与眼动跟踪的地图认知计算模型与方法研究

国家自然科学基金

6+阅读 · 2014年12月31日

基于目标导向MI-EEGas的上肢运动康复方法双向适应性研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员