MOMO: A framework for seamless physical, verbal, and graphical robot skill learning and adaptation - 专知论文

会员服务 ·

0

适配 · 模态 · 机器人 · 交互 · 工具 ·

MOMO: A framework for seamless physical, verbal, and graphical robot skill learning and adaptation

翻译：MOMO: 一种实现机器人物理、语言及图形化技能无缝学习与适配的框架

Markus Knauer,Edoardo Fiorini,Maximilian Mühlbauer,Stefan Schneyer,Promwat Angsuratanawech,Florian Samuel Lay,Timo Bachmann,Samuel Bustamante,Korbinian Nottensteiner,Freek Stulp,Alin Albu-Schäffer,João Silvério,Thomas Eiband

from arxiv, 15 pages, 13 figures, 3 tables

Industrial robot applications require increasingly flexible systems that non-expert users can easily adapt for varying tasks and environments. However, different adaptations benefit from different interaction modalities. We present an interactive framework that enables robot skill adaptation through three complementary modalities: kinesthetic touch for precise spatial corrections, natural language for high-level semantic modifications, and a graphical web interface for visualizing geometric relations and trajectories, inspecting and adjusting parameters, and editing via-points by drag-and-drop. The framework integrates five components: energy-based human-intention detection, a tool-based LLM architecture (where the LLM selects and parameterizes predefined functions rather than generating code) for safe natural language adaptation, Kernelized Movement Primitives (KMPs) for motion encoding, probabilistic Virtual Fixtures for guided demonstration recording, and ergodic control for surface finishing. We demonstrate that this tool-based LLM architecture generalizes skill adaptation from KMPs to ergodic control, enabling voice-commanded surface finishing. Validation on a 7-DoF torque-controlled robot at the Automatica 2025 trade fair demonstrates the practical applicability of our approach in industrial settings.

翻译：工业机器人应用需要日益灵活的智能系统，以便非专业用户能够轻松适应不同任务及环境。然而，不同的适配需求受益于不同的交互模式。我们提出了一种交互式框架，通过三种互补的模态实现机器人技能适配：力觉引导触觉模态用于精确的空间校正，自然语言模态用于高层语义修改，以及图形化网络界面模态用于可视化几何关系与轨迹、检查调整参数、并通过拖拽编辑途经点。该框架整合了五个组件：基于能量的人体意图检测、基于工具的大语言模型架构（其中大语言模型选择并参数化预定义函数而非生成代码）以实现安全的自然语言适配、核化运动基元用于运动编码、概率虚拟夹具用于引导式示教记录、以及遍历控制用于表面精加工。我们证明了该基于工具的LLM架构能够将技能适配从核化运动基元推广至遍历控制，从而支持语音指令驱动的表面精加工。在2025年Automatica贸易展上，通过7自由度力矩控制机器人的验证实验，证明了该方法在工业场景中的实际应用性。

0

相关内容

空间模块化机器人自重构机理与算法研究现状

空间模块化机器人自重构机理与算法研究现状

专知会员服务

17+阅读 · 1月31日

【伯克利博士论文】物理世界中可泛化且可扩展的机器人学习

【伯克利博士论文】物理世界中可泛化且可扩展的机器人学习

专知会员服务

22+阅读 · 1月18日

国内机器人行业梳理：量产元年，百家争鸣

国内机器人行业梳理：量产元年，百家争鸣

专知会员服务

17+阅读 · 2025年2月4日

人形机器人深度：产业化渐行渐近，未来前景广阔

人形机器人深度：产业化渐行渐近，未来前景广阔

专知会员服务

39+阅读 · 2024年7月17日

国家标准《人工智能面向机器学习的系统规范（征求意见稿）》

国家标准《人工智能面向机器学习的系统规范（征求意见稿）》

专知会员服务

53+阅读 · 2024年5月25日

人形机器人系列报告：AI超预期助力产业落地，核心零部件配套星辰大海

人形机器人系列报告：AI超预期助力产业落地，核心零部件配套星辰大海

专知会员服务

45+阅读 · 2024年3月12日

重磅！国家标准《人工智能面向机器学习的系统技术要求》征求意见稿发布，17页pdf详细规定机器学习系统框架

重磅！国家标准《人工智能面向机器学习的系统技术要求》征求意见稿发布，17页pdf详细规定机器学习系统框架

专知会员服务

92+阅读 · 2023年5月7日

阿里云发布《中国机器人产业图谱（2022）》，122页pdf

阿里云发布《中国机器人产业图谱（2022）》，122页pdf

专知会员服务

71+阅读 · 2022年6月29日

达摩院基于元学习的对话系统

达摩院基于元学习的对话系统

专知会员服务

25+阅读 · 2021年1月1日

【斯坦福&Google】面向机器人的机器学习，63页PPT

【斯坦福&Google】面向机器人的机器学习，63页PPT

专知会员服务

26+阅读 · 2019年11月19日

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

专知

23+阅读 · 2023年4月8日

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人大讲堂

19+阅读 · 2019年7月5日

价值2980元的廖雪峰人工智能入门课程，终终终于免费了！！！

价值2980元的廖雪峰人工智能入门课程，终终终于免费了！！！

计算机视觉战队

14+阅读 · 2019年4月23日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

【机器视觉】工业视觉新方向起底、人工智能检测设备实现手机外观缺陷全自动检测、康耐视：当深度学习遇见机器视觉

【机器视觉】工业视觉新方向起底、人工智能检测设备实现手机外观缺陷全自动检测、康耐视：当深度学习遇见机器视觉

产业智能官

25+阅读 · 2019年1月4日

这可能是「多模态机器学习」最通俗易懂的介绍

这可能是「多模态机器学习」最通俗易懂的介绍

计算机视觉life

113+阅读 · 2018年12月20日

【机器人】机器人PID控制

【机器人】机器人PID控制

产业智能官

10+阅读 · 2018年11月25日

最新人机对话系统简略综述

最新人机对话系统简略综述

专知

26+阅读 · 2018年3月10日

【论文推荐】最新5篇聊天机器人（Chatbot）相关论文—深度强化学习、社交聊天机器人小冰、对话聊天助手、序列-序列、动态词汇

【论文推荐】最新5篇聊天机器人（Chatbot）相关论文—深度强化学习、社交聊天机器人小冰、对话聊天助手、序列-序列、动态词汇

专知

23+阅读 · 2018年1月30日

【智能制造】见识一下某航空企业的智能制造技术架构！

【智能制造】见识一下某航空企业的智能制造技术架构！

产业智能官

13+阅读 · 2017年12月7日

面向复杂环境的四足机器人自适应和快速稳定运动控制方法研究及应用

国家自然科学基金

0+阅读 · 2017年12月31日

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

网络化遥操作多机器人系统时滞相关控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于模块结合面微观接触机理的模块化机器人动态特性分析与研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向聋儿言语康复的多模态人机交互模型及技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

仿人轻型机械臂人机协作模式关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向电子制造的多机器人高速协调的关键理论与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

Adaptive vs. Static Robot-to-Human Handover: A Study on Orientation and Approach Direction

Arxiv

0+阅读 · 4月24日

MOMO: A framework for seamless physical, verbal, and graphical robot skill learning and adaptation

Arxiv

0+阅读 · 4月23日

IROSA: Interactive Robot Skill Adaptation using Natural Language

Arxiv

0+阅读 · 4月16日

MARLIN: Multi-Agent Reinforcement Learning Guided by Language-Based Inter-Robot Negotiation

Arxiv

0+阅读 · 4月13日

Biologically Inspired Event-Based Perception and Sample-Efficient Learning for High-Speed Table Tennis Robots

Arxiv

0+阅读 · 4月6日

ManipArena: Comprehensive Real-world Evaluation of Reasoning-Oriented Generalist Robot Manipulation

Arxiv

0+阅读 · 3月30日

Tele-Catch: Adaptive Teleoperation for Dexterous Dynamic 3D Object Catching

Arxiv

0+阅读 · 3月30日

A Multimodal Framework for Human-Multi-Agent Interaction

Arxiv

0+阅读 · 3月24日

MineRobot: A Unified Framework for Kinematics Modeling and Solving of Underground Mining Robots in Virtual Environments

Arxiv

0+阅读 · 3月23日

DiT4DiT: Jointly Modeling Video Dynamics and Actions for Generalizable Robot Control

Arxiv

0+阅读 · 3月22日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

2+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

4+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

5+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

6+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

10+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

11+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

7+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

15+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

8+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

6+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

8+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

10+阅读 · 6月17日

相关VIP内容

空间模块化机器人自重构机理与算法研究现状

空间模块化机器人自重构机理与算法研究现状

专知会员服务

17+阅读 · 1月31日

【伯克利博士论文】物理世界中可泛化且可扩展的机器人学习

【伯克利博士论文】物理世界中可泛化且可扩展的机器人学习

专知会员服务

22+阅读 · 1月18日

国内机器人行业梳理：量产元年，百家争鸣

国内机器人行业梳理：量产元年，百家争鸣

专知会员服务

17+阅读 · 2025年2月4日

人形机器人深度：产业化渐行渐近，未来前景广阔

人形机器人深度：产业化渐行渐近，未来前景广阔

专知会员服务

39+阅读 · 2024年7月17日

国家标准《人工智能面向机器学习的系统规范（征求意见稿）》

国家标准《人工智能面向机器学习的系统规范（征求意见稿）》

专知会员服务

53+阅读 · 2024年5月25日

人形机器人系列报告：AI超预期助力产业落地，核心零部件配套星辰大海

人形机器人系列报告：AI超预期助力产业落地，核心零部件配套星辰大海

专知会员服务

45+阅读 · 2024年3月12日

重磅！国家标准《人工智能面向机器学习的系统技术要求》征求意见稿发布，17页pdf详细规定机器学习系统框架

重磅！国家标准《人工智能面向机器学习的系统技术要求》征求意见稿发布，17页pdf详细规定机器学习系统框架

专知会员服务

92+阅读 · 2023年5月7日

阿里云发布《中国机器人产业图谱（2022）》，122页pdf

阿里云发布《中国机器人产业图谱（2022）》，122页pdf

专知会员服务

71+阅读 · 2022年6月29日

达摩院基于元学习的对话系统

达摩院基于元学习的对话系统

专知会员服务

25+阅读 · 2021年1月1日

【斯坦福&Google】面向机器人的机器学习，63页PPT

【斯坦福&Google】面向机器人的机器学习，63页PPT

专知会员服务

26+阅读 · 2019年11月19日

热门VIP内容

开通专知VIP会员享更多权益服务

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

相关资讯

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

专知

23+阅读 · 2023年4月8日

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人4.0白皮书（附下载）：云-边-端融合的机器人系统和架构

机器人大讲堂

19+阅读 · 2019年7月5日

价值2980元的廖雪峰人工智能入门课程，终终终于免费了！！！

价值2980元的廖雪峰人工智能入门课程，终终终于免费了！！！

计算机视觉战队

14+阅读 · 2019年4月23日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

【机器视觉】工业视觉新方向起底、人工智能检测设备实现手机外观缺陷全自动检测、康耐视：当深度学习遇见机器视觉

【机器视觉】工业视觉新方向起底、人工智能检测设备实现手机外观缺陷全自动检测、康耐视：当深度学习遇见机器视觉

产业智能官

25+阅读 · 2019年1月4日

这可能是「多模态机器学习」最通俗易懂的介绍

这可能是「多模态机器学习」最通俗易懂的介绍

计算机视觉life

113+阅读 · 2018年12月20日

【机器人】机器人PID控制

【机器人】机器人PID控制

产业智能官

10+阅读 · 2018年11月25日

最新人机对话系统简略综述

最新人机对话系统简略综述

专知

26+阅读 · 2018年3月10日

【论文推荐】最新5篇聊天机器人（Chatbot）相关论文—深度强化学习、社交聊天机器人小冰、对话聊天助手、序列-序列、动态词汇

【论文推荐】最新5篇聊天机器人（Chatbot）相关论文—深度强化学习、社交聊天机器人小冰、对话聊天助手、序列-序列、动态词汇

专知

23+阅读 · 2018年1月30日

【智能制造】见识一下某航空企业的智能制造技术架构！

【智能制造】见识一下某航空企业的智能制造技术架构！

产业智能官

13+阅读 · 2017年12月7日

相关论文

Adaptive vs. Static Robot-to-Human Handover: A Study on Orientation and Approach Direction

Arxiv

0+阅读 · 4月24日

MOMO: A framework for seamless physical, verbal, and graphical robot skill learning and adaptation

Arxiv

0+阅读 · 4月23日

IROSA: Interactive Robot Skill Adaptation using Natural Language

Arxiv

0+阅读 · 4月16日

MARLIN: Multi-Agent Reinforcement Learning Guided by Language-Based Inter-Robot Negotiation

Arxiv

0+阅读 · 4月13日

Biologically Inspired Event-Based Perception and Sample-Efficient Learning for High-Speed Table Tennis Robots

Arxiv

0+阅读 · 4月6日

ManipArena: Comprehensive Real-world Evaluation of Reasoning-Oriented Generalist Robot Manipulation

Arxiv

0+阅读 · 3月30日

Tele-Catch: Adaptive Teleoperation for Dexterous Dynamic 3D Object Catching

Arxiv

0+阅读 · 3月30日

A Multimodal Framework for Human-Multi-Agent Interaction

Arxiv

0+阅读 · 3月24日

MineRobot: A Unified Framework for Kinematics Modeling and Solving of Underground Mining Robots in Virtual Environments

Arxiv

0+阅读 · 3月23日

DiT4DiT: Jointly Modeling Video Dynamics and Actions for Generalizable Robot Control

Arxiv

0+阅读 · 3月22日

相关基金

面向复杂环境的四足机器人自适应和快速稳定运动控制方法研究及应用

国家自然科学基金

0+阅读 · 2017年12月31日

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

网络化遥操作多机器人系统时滞相关控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于模块结合面微观接触机理的模块化机器人动态特性分析与研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向聋儿言语康复的多模态人机交互模型及技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

仿人轻型机械臂人机协作模式关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向电子制造的多机器人高速协调的关键理论与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员