一步式均值流策略：基于方向对齐的机器人操作框架 (OMP: One-step Meanflow Policy with Directional Alignment) - 专知论文

会员服务 ·

0

均值 · 操作 · 机器人操作 · 对齐 · 机器人 ·

OMP: One-step Meanflow Policy with Directional Alignment

翻译：一步式均值流策略：基于方向对齐的机器人操作框架

Han Fang,Yize Huang,Yuheng Zhao,Paul Weng,Xiao Li,Yutong Ban

Robot manipulation has increasingly adopted data-driven generative policy frameworks, yet the field faces a persistent trade-off: diffusion models suffer from high inference latency, while flow-based methods often require complex architectural constraints. Although in image generation domain, the MeanFlow paradigm offers a path to single-step inference, its direct application to robotics is impeded by critical theoretical pathologies, specifically spectral bias and gradient starvation in low-velocity regimes. To overcome these limitations, we propose the One-step MeanFlow Policy (OMP), a novel framework designed for high-fidelity, real-time manipulation. We introduce a lightweight directional alignment mechanism to explicitly synchronize predicted velocities with true mean velocities. Furthermore, we implement a Differential Derivation Equation (DDE) to approximate the Jacobian-Vector Product (JVP) operator, which decouples forward and backward passes to significantly reduce memory complexity. Extensive experiments on the Adroit and Meta-World benchmarks demonstrate that OMP outperforms state-of-the-art methods in success rate and trajectory accuracy, particularly in high-precision tasks, while retaining the efficiency of single-step generation.

翻译：机器人操作领域日益广泛采用数据驱动的生成式策略框架，然而该领域始终面临一个权衡难题：扩散模型存在高推理延迟，而基于流的方法通常需要复杂的架构约束。尽管在图像生成领域，均值流范式为实现单步推理提供了可行路径，但其直接应用于机器人操作时受到关键理论缺陷的阻碍，特别是低频速度区域中的谱偏差与梯度匮乏问题。为突破这些局限，我们提出一步式均值流策略——一种专为高保真实时操作设计的新型框架。我们引入轻量级方向对齐机制，显式同步预测速度与真实均值速度。此外，我们实现了微分推导方程来近似雅可比向量积算子，通过解耦前向与反向传播显著降低内存复杂度。在Adroit和Meta-World基准测试上的大量实验表明，OMP在成功率和轨迹精度方面均优于现有先进方法，尤其在高精度任务中表现突出，同时保持了单步生成的高效性。

0

相关内容

【伯克利博士论文】物理世界中可泛化且可扩展的机器人学习

【伯克利博士论文】物理世界中可泛化且可扩展的机器人学习

专知会员服务

21+阅读 · 1月18日

扩散模型中的缓存方法综述：迈向高效的多模态生成

扩散模型中的缓存方法综述：迈向高效的多模态生成

专知会员服务

8+阅读 · 2025年10月23日

面向机器人操作的基于大型视觉‑语言模型（VLM）的视觉‑语言‑动作（VLA）模型综述

面向机器人操作的基于大型视觉‑语言模型（VLM）的视觉‑语言‑动作（VLA）模型综述

专知会员服务

34+阅读 · 2025年8月19日

CVPR 2025 Highlight | OmniManip：以对象为中心的机器人通用操作框架

CVPR 2025 Highlight | OmniManip：以对象为中心的机器人通用操作框架

专知会员服务

9+阅读 · 2025年4月15日

机器人操作扩散模型综述

机器人操作扩散模型综述

专知会员服务

21+阅读 · 2025年4月14日

生成式人工智能在机器人操作中的应用：综述

生成式人工智能在机器人操作中的应用：综述

专知会员服务

29+阅读 · 2025年3月6日

【CMU博士论文】构建通用机器人生成范式：基础设施、规模化与策略学习

【CMU博士论文】构建通用机器人生成范式：基础设施、规模化与策略学习

专知会员服务

23+阅读 · 2025年2月9日

【CMU博士论文】构建通用机器人生成范式：基础设施、扩展性与策略学习

【CMU博士论文】构建通用机器人生成范式：基础设施、扩展性与策略学习

专知会员服务

30+阅读 · 2024年12月6日

人机协作|《基于机器人的流程自动化》61页报告，美国国防采办大学

人机协作|《基于机器人的流程自动化》61页报告，美国国防采办大学

专知会员服务

36+阅读 · 2023年3月30日

【AAAI 2022】机器学习模型的解释方法效果如何？MIT、微软学者为你解读，Do Feature Attribution Methods Correctly Attribute Features?

【AAAI 2022】机器学习模型的解释方法效果如何？MIT、微软学者为你解读，Do Feature Attribution Methods Correctly Attribute Features?

专知会员服务

31+阅读 · 2022年3月12日

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

专知

10+阅读 · 2023年4月6日

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

专知

29+阅读 · 2022年11月23日

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

专知

15+阅读 · 2022年2月16日

【开放书】MLOps导论：构建企业机器学习生产系统，185页pdf

【开放书】MLOps导论：构建企业机器学习生产系统，185页pdf

专知

51+阅读 · 2021年4月8日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

Pytorch多模态框架MMF

Pytorch多模态框架MMF

专知

50+阅读 · 2020年6月20日

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

专知

14+阅读 · 2019年10月9日

【书籍】深度学习框架：PyTorch入门与实践（附代码）

【书籍】深度学习框架：PyTorch入门与实践（附代码）

专知

16+阅读 · 2018年1月21日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

一文读懂机器学习概率图模型（附示例&学习资源）

一文读懂机器学习概率图模型（附示例&学习资源）

数据派THU

47+阅读 · 2017年12月10日

基于多策略融合粒子群算法的点焊机器人路径多目标优化

国家自然科学基金

1+阅读 · 2017年12月31日

共融机器人战略规划研究和学术交流

国家自然科学基金

14+阅读 · 2016年12月31日

面向类人机器人动作规划的参数最优控制技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

网络化遥操作多机器人系统时滞相关控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

大数据背景下面向操作模式的约简算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

空地机器人网络的同时视觉目标定位与分布式运动规划

国家自然科学基金

4+阅读 · 2015年12月31日

不确定非完整移动机器人基于一致性的分布式编队控制研究

国家自然科学基金

13+阅读 · 2015年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

云环境中支持混合并行模式的科学工作流的执行优化

国家自然科学基金

0+阅读 · 2014年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

FreqPolicy: Efficient Flow-based Visuomotor Policy via Frequency Consistency

Arxiv

0+阅读 · 2月18日

Constraining Streaming Flow Models for Adapting Learned Robot Trajectory Distributions

Arxiv

0+阅读 · 2月17日

HybridFlow: A Two-Step Generative Policy for Robotic Manipulation

Arxiv

0+阅读 · 2月14日

CoLA-Flow Policy: Temporally Coherent Imitation Learning via Continuous Latent Action Flow Matching for Robotic Manipulation

Arxiv

0+阅读 · 2月10日

Flow Policy Gradients for Robot Control

Arxiv

0+阅读 · 2月2日

Temporally Coherent Imitation Learning via Latent Action Flow Matching for Robotic Manipulation

Arxiv

0+阅读 · 1月30日

One-step Latent-free Image Generation with Pixel Mean Flows

Arxiv

0+阅读 · 1月29日

One Step Is Enough: Dispersive MeanFlow Policy Optimization

Arxiv

0+阅读 · 1月28日

TwinFlow: Realizing One-step Generation on Large Models with Self-adversarial Flows

Arxiv

0+阅读 · 1月28日

UniConFlow: A Unified Constrained Flow-Matching Framework for Certified Motion Planning

Arxiv

0+阅读 · 1月14日

VIP会员

文章信息

相关主题

机器人操作

相关VIP内容

【伯克利博士论文】物理世界中可泛化且可扩展的机器人学习

【伯克利博士论文】物理世界中可泛化且可扩展的机器人学习

专知会员服务

21+阅读 · 1月18日

扩散模型中的缓存方法综述：迈向高效的多模态生成

扩散模型中的缓存方法综述：迈向高效的多模态生成

专知会员服务

8+阅读 · 2025年10月23日

面向机器人操作的基于大型视觉‑语言模型（VLM）的视觉‑语言‑动作（VLA）模型综述

面向机器人操作的基于大型视觉‑语言模型（VLM）的视觉‑语言‑动作（VLA）模型综述

专知会员服务

34+阅读 · 2025年8月19日

CVPR 2025 Highlight | OmniManip：以对象为中心的机器人通用操作框架

CVPR 2025 Highlight | OmniManip：以对象为中心的机器人通用操作框架

专知会员服务

9+阅读 · 2025年4月15日

机器人操作扩散模型综述

机器人操作扩散模型综述

专知会员服务

21+阅读 · 2025年4月14日

生成式人工智能在机器人操作中的应用：综述

生成式人工智能在机器人操作中的应用：综述

专知会员服务

29+阅读 · 2025年3月6日

【CMU博士论文】构建通用机器人生成范式：基础设施、规模化与策略学习

【CMU博士论文】构建通用机器人生成范式：基础设施、规模化与策略学习

专知会员服务

23+阅读 · 2025年2月9日

【CMU博士论文】构建通用机器人生成范式：基础设施、扩展性与策略学习

【CMU博士论文】构建通用机器人生成范式：基础设施、扩展性与策略学习

专知会员服务

30+阅读 · 2024年12月6日

人机协作|《基于机器人的流程自动化》61页报告，美国国防采办大学

人机协作|《基于机器人的流程自动化》61页报告，美国国防采办大学

专知会员服务

36+阅读 · 2023年3月30日

【AAAI 2022】机器学习模型的解释方法效果如何？MIT、微软学者为你解读，Do Feature Attribution Methods Correctly Attribute Features?

【AAAI 2022】机器学习模型的解释方法效果如何？MIT、微软学者为你解读，Do Feature Attribution Methods Correctly Attribute Features?

专知会员服务

31+阅读 · 2022年3月12日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人机与战争：被忽视的环境影响及无人机保护潜力》

俄罗斯规划未来无人机驱动军队

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

《人工智能、武器与影响力：前沿模型在模拟核危机中展现复杂推理》2026最新46页报告

相关资讯

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

专知

10+阅读 · 2023年4月6日

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

专知

29+阅读 · 2022年11月23日

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

专知

15+阅读 · 2022年2月16日

【开放书】MLOps导论：构建企业机器学习生产系统，185页pdf

【开放书】MLOps导论：构建企业机器学习生产系统，185页pdf

专知

51+阅读 · 2021年4月8日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

Pytorch多模态框架MMF

Pytorch多模态框架MMF

专知

50+阅读 · 2020年6月20日

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

专知

14+阅读 · 2019年10月9日

【书籍】深度学习框架：PyTorch入门与实践（附代码）

【书籍】深度学习框架：PyTorch入门与实践（附代码）

专知

16+阅读 · 2018年1月21日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

一文读懂机器学习概率图模型（附示例&学习资源）

一文读懂机器学习概率图模型（附示例&学习资源）

数据派THU

47+阅读 · 2017年12月10日

相关论文

FreqPolicy: Efficient Flow-based Visuomotor Policy via Frequency Consistency

Arxiv

0+阅读 · 2月18日

Constraining Streaming Flow Models for Adapting Learned Robot Trajectory Distributions

Arxiv

0+阅读 · 2月17日

HybridFlow: A Two-Step Generative Policy for Robotic Manipulation

Arxiv

0+阅读 · 2月14日

CoLA-Flow Policy: Temporally Coherent Imitation Learning via Continuous Latent Action Flow Matching for Robotic Manipulation

Arxiv

0+阅读 · 2月10日

Flow Policy Gradients for Robot Control

Arxiv

0+阅读 · 2月2日

Temporally Coherent Imitation Learning via Latent Action Flow Matching for Robotic Manipulation

Arxiv

0+阅读 · 1月30日

One-step Latent-free Image Generation with Pixel Mean Flows

Arxiv

0+阅读 · 1月29日

One Step Is Enough: Dispersive MeanFlow Policy Optimization

Arxiv

0+阅读 · 1月28日

TwinFlow: Realizing One-step Generation on Large Models with Self-adversarial Flows

Arxiv

0+阅读 · 1月28日

UniConFlow: A Unified Constrained Flow-Matching Framework for Certified Motion Planning

Arxiv

0+阅读 · 1月14日

相关基金

基于多策略融合粒子群算法的点焊机器人路径多目标优化

国家自然科学基金

1+阅读 · 2017年12月31日

共融机器人战略规划研究和学术交流

国家自然科学基金

14+阅读 · 2016年12月31日

面向类人机器人动作规划的参数最优控制技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

网络化遥操作多机器人系统时滞相关控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

大数据背景下面向操作模式的约简算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

空地机器人网络的同时视觉目标定位与分布式运动规划

国家自然科学基金

4+阅读 · 2015年12月31日

不确定非完整移动机器人基于一致性的分布式编队控制研究

国家自然科学基金

13+阅读 · 2015年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

云环境中支持混合并行模式的科学工作流的执行优化

国家自然科学基金

0+阅读 · 2014年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员