基于专家混合扩散策略的机器人操作技能抽象 (Abstracting Robot Manipulation Skills via Mixture-of-Experts Diffusion Policies) - 专知论文

会员服务 ·

0

混合 · 操作 · 社会媒体处理 · 机器人操作 · 混合策略 ·

Abstracting Robot Manipulation Skills via Mixture-of-Experts Diffusion Policies

翻译：基于专家混合扩散策略的机器人操作技能抽象

Ce Hao,Xuanran Zhai,Yaohua Liu,Harold Soh

Diffusion-based policies have recently shown strong results in robot manipulation, but their extension to multi-task scenarios is hindered by the high cost of scaling model size and demonstrations. We introduce Skill Mixture-of-Experts Policy (SMP), a diffusion-based mixture-of-experts policy that learns a compact orthogonal skill basis and uses sticky routing to compose actions from a small, task-relevant subset of experts at each step. A variational training objective supports this design, and adaptive expert activation at inference yields fast sampling without oversized backbones. We validate SMP in simulation and on a real dual-arm platform with multi-task learning and transfer learning tasks, where SMP achieves higher success rates and markedly lower inference cost than large diffusion baselines. These results indicate a practical path toward scalable, transferable multi-task manipulation: learn reusable skills once, activate only what is needed, and adapt quickly when tasks change.

翻译：基于扩散的策略最近在机器人操作中展现出优异性能，但其向多任务场景的扩展受限于模型规模与演示数据的高昂扩展成本。本文提出技能专家混合策略（SMP），这是一种基于扩散的专家混合策略，它学习紧凑正交的技能基，并通过粘性路由机制在每一步从少量任务相关专家子集中组合动作。变分训练目标支持该设计，而推理阶段的自适应专家激活实现了无需超大骨干网络的快速采样。我们在仿真环境及真实双臂平台上通过多任务学习与迁移学习任务验证SMP，结果表明SMP相比大型扩散基线方法获得更高成功率，且推理成本显著降低。这些发现为可扩展、可迁移的多任务操作提供了一条实用路径：一次性学习可复用技能，仅激活所需模块，并在任务变更时快速适应。

0

相关内容

【伯克利博士论文】物理世界中可泛化且可扩展的机器人学习

【伯克利博士论文】物理世界中可泛化且可扩展的机器人学习

专知会员服务

21+阅读 · 1月18日

【AAAI2026】专家数量何为最优？面向混合专家模型的语义专业化优化研究

【AAAI2026】专家数量何为最优？面向混合专家模型的语义专业化优化研究

专知会员服务

15+阅读 · 2025年12月28日

基础模型驱动的机器人技术：全面综述

基础模型驱动的机器人技术：全面综述

专知会员服务

30+阅读 · 2025年7月15日

混合专家模型简述

混合专家模型简述

专知会员服务

17+阅读 · 2025年5月30日

机器人操作扩散模型综述

机器人操作扩散模型综述

专知会员服务

21+阅读 · 2025年4月14日

生成式人工智能在机器人操作中的应用：综述

生成式人工智能在机器人操作中的应用：综述

专知会员服务

29+阅读 · 2025年3月6日

《混合专家模型推理优化技术综述》

《混合专家模型推理优化技术综述》

专知会员服务

45+阅读 · 2024年12月21日

GPT-4o核心技术？哈工大最新《Uni-MoE：使用专家混合模型扩展统一多模态大语言模型》

GPT-4o核心技术？哈工大最新《Uni-MoE：使用专家混合模型扩展统一多模态大语言模型》

专知会员服务

35+阅读 · 2024年5月26日

西工大等最新《大型语言模型机器人技术》综述，详述多模态 GPT-4V 机器人技术

西工大等最新《大型语言模型机器人技术》综述，详述多模态 GPT-4V 机器人技术

专知会员服务

78+阅读 · 2024年1月10日

扩散模型和强化学习如何结合？上交最新《强化学习中的扩散模型》综述

扩散模型和强化学习如何结合？上交最新《强化学习中的扩散模型》综述

专知会员服务

83+阅读 · 2023年11月3日

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

专知

67+阅读 · 2022年11月2日

推荐！《基于人工智能（AI）的空中和导弹防御（AMD）：以结果为导向的辅助决策》美国海军研究生院系统工程顶点报告145页

推荐！《基于人工智能（AI）的空中和导弹防御（AMD）：以结果为导向的辅助决策》美国海军研究生院系统工程顶点报告145页

专知

114+阅读 · 2022年9月1日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

105+阅读 · 2022年4月28日

【AI+军事】《AI/ML在支持混合军事行动中情报和目标定位方面的优势和挑战》加拿大国防研究和发展部

【AI+军事】《AI/ML在支持混合军事行动中情报和目标定位方面的优势和挑战》加拿大国防研究和发展部

专知

102+阅读 · 2022年4月7日

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

专知

15+阅读 · 2022年2月16日

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

极市平台

11+阅读 · 2021年11月18日

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

专知

23+阅读 · 2021年2月16日

开始报名！SMP机器人群聊比赛

开始报名！SMP机器人群聊比赛

哈工大SCIR

13+阅读 · 2019年6月28日

有关军事人机混合智能的再再思考

有关军事人机混合智能的再再思考

人工智能学家

20+阅读 · 2019年6月23日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

共融机器人战略规划研究和学术交流

国家自然科学基金

13+阅读 · 2016年12月31日

网络化遥操作多机器人系统时滞相关控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

求解一类公平疏散问题的高性能混合算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

随机混杂预测控制的插电式混合动力系统能量管理策略优化机理

国家自然科学基金

0+阅读 · 2015年12月31日

基于模块结合面微观接触机理的模块化机器人动态特性分析与研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

Learning Diffusion Policies for Robotic Manipulation of Timber Joinery under Fabrication Uncertainty

Arxiv

0+阅读 · 2月17日

A Review of Online Diffusion Policy RL Algorithms for Scalable Robotic Control

Arxiv

0+阅读 · 2月9日

Simultaneous Tactile-Visual Perception for Learning Multimodal Robot Manipulation

Arxiv

0+阅读 · 2月9日

Temporally Coherent Imitation Learning via Latent Action Flow Matching for Robotic Manipulation

Arxiv

0+阅读 · 1月30日

MoE-ACT: Improving Surgical Imitation Learning Policies through Supervised Mixture-of-Experts

Arxiv

0+阅读 · 1月29日

Understanding Multilingualism in Mixture-of-Experts LLMs: Routing Mechanism, Expert Specialization, and Layerwise Steering

Arxiv

0+阅读 · 1月20日

ForeDiffusion: Foresight-Conditioned Diffusion Policy via Future View Construction for Robot Manipulation

Arxiv

0+阅读 · 1月19日

Learning Diverse Skills for Behavior Models with Mixture of Experts

Arxiv

0+阅读 · 1月18日

Skill-Aware Diffusion for Generalizable Robotic Manipulation

Arxiv

0+阅读 · 1月16日

Generalizable Geometric Prior and Recurrent Spiking Feature Learning for Humanoid Robot Manipulation

Arxiv

0+阅读 · 1月13日

VIP会员

文章信息

相关主题

社会媒体处理

机器人操作

相关VIP内容

【伯克利博士论文】物理世界中可泛化且可扩展的机器人学习

【伯克利博士论文】物理世界中可泛化且可扩展的机器人学习

专知会员服务

21+阅读 · 1月18日

【AAAI2026】专家数量何为最优？面向混合专家模型的语义专业化优化研究

【AAAI2026】专家数量何为最优？面向混合专家模型的语义专业化优化研究

专知会员服务

15+阅读 · 2025年12月28日

基础模型驱动的机器人技术：全面综述

基础模型驱动的机器人技术：全面综述

专知会员服务

30+阅读 · 2025年7月15日

混合专家模型简述

混合专家模型简述

专知会员服务

17+阅读 · 2025年5月30日

机器人操作扩散模型综述

机器人操作扩散模型综述

专知会员服务

21+阅读 · 2025年4月14日

生成式人工智能在机器人操作中的应用：综述

生成式人工智能在机器人操作中的应用：综述

专知会员服务

29+阅读 · 2025年3月6日

《混合专家模型推理优化技术综述》

《混合专家模型推理优化技术综述》

专知会员服务

45+阅读 · 2024年12月21日

GPT-4o核心技术？哈工大最新《Uni-MoE：使用专家混合模型扩展统一多模态大语言模型》

GPT-4o核心技术？哈工大最新《Uni-MoE：使用专家混合模型扩展统一多模态大语言模型》

专知会员服务

35+阅读 · 2024年5月26日

西工大等最新《大型语言模型机器人技术》综述，详述多模态 GPT-4V 机器人技术

西工大等最新《大型语言模型机器人技术》综述，详述多模态 GPT-4V 机器人技术

专知会员服务

78+阅读 · 2024年1月10日

扩散模型和强化学习如何结合？上交最新《强化学习中的扩散模型》综述

扩散模型和强化学习如何结合？上交最新《强化学习中的扩散模型》综述

专知会员服务

83+阅读 · 2023年11月3日

热门VIP内容

开通专知VIP会员享更多权益服务

《可信人工智能赋能系统的支柱》

《从经典神经网络到不确定性下的拓扑神经网络：军事应用》2026最新40页报告

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

《人工智能：对战略与力量的影响》slides

相关资讯

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

专知

67+阅读 · 2022年11月2日

推荐！《基于人工智能（AI）的空中和导弹防御（AMD）：以结果为导向的辅助决策》美国海军研究生院系统工程顶点报告145页

推荐！《基于人工智能（AI）的空中和导弹防御（AMD）：以结果为导向的辅助决策》美国海军研究生院系统工程顶点报告145页

专知

114+阅读 · 2022年9月1日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

105+阅读 · 2022年4月28日

【AI+军事】《AI/ML在支持混合军事行动中情报和目标定位方面的优势和挑战》加拿大国防研究和发展部

【AI+军事】《AI/ML在支持混合军事行动中情报和目标定位方面的优势和挑战》加拿大国防研究和发展部

专知

102+阅读 · 2022年4月7日

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

专知

15+阅读 · 2022年2月16日

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

极市平台

11+阅读 · 2021年11月18日

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

机器学习与组合优化如何结合？这份AAAI2021教程讲述「机器学习组合优化」进展，附240页ppt

专知

23+阅读 · 2021年2月16日

开始报名！SMP机器人群聊比赛

开始报名！SMP机器人群聊比赛

哈工大SCIR

13+阅读 · 2019年6月28日

有关军事人机混合智能的再再思考

有关军事人机混合智能的再再思考

人工智能学家

20+阅读 · 2019年6月23日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

相关论文

Learning Diffusion Policies for Robotic Manipulation of Timber Joinery under Fabrication Uncertainty

Arxiv

0+阅读 · 2月17日

A Review of Online Diffusion Policy RL Algorithms for Scalable Robotic Control

Arxiv

0+阅读 · 2月9日

Simultaneous Tactile-Visual Perception for Learning Multimodal Robot Manipulation

Arxiv

0+阅读 · 2月9日

Temporally Coherent Imitation Learning via Latent Action Flow Matching for Robotic Manipulation

Arxiv

0+阅读 · 1月30日

MoE-ACT: Improving Surgical Imitation Learning Policies through Supervised Mixture-of-Experts

Arxiv

0+阅读 · 1月29日

Understanding Multilingualism in Mixture-of-Experts LLMs: Routing Mechanism, Expert Specialization, and Layerwise Steering

Arxiv

0+阅读 · 1月20日

ForeDiffusion: Foresight-Conditioned Diffusion Policy via Future View Construction for Robot Manipulation

Arxiv

0+阅读 · 1月19日

Learning Diverse Skills for Behavior Models with Mixture of Experts

Arxiv

0+阅读 · 1月18日

Skill-Aware Diffusion for Generalizable Robotic Manipulation

Arxiv

0+阅读 · 1月16日

Generalizable Geometric Prior and Recurrent Spiking Feature Learning for Humanoid Robot Manipulation

Arxiv

0+阅读 · 1月13日

相关基金

共融机器人战略规划研究和学术交流

国家自然科学基金

13+阅读 · 2016年12月31日

网络化遥操作多机器人系统时滞相关控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

求解一类公平疏散问题的高性能混合算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

随机混杂预测控制的插电式混合动力系统能量管理策略优化机理

国家自然科学基金

0+阅读 · 2015年12月31日

基于模块结合面微观接触机理的模块化机器人动态特性分析与研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

48+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员