Learning Visually Interpretable Oscillator Networks for Soft Continuum Robots from Video - 专知论文

会员服务 ·

0

振荡 · 潜在 · 视频 · 连续体机器人 · 可解释性 ·

Learning Visually Interpretable Oscillator Networks for Soft Continuum Robots from Video

翻译：从视频中学习软体连续体机器人的视觉可解释振荡器网络

Henrik Krauss,Johann Licher,Naoya Takeishi,Annika Raatz,Takehisa Yairi

from arxiv, Code available at: https://github.com/UThenrik/visual_oscillators_for_SCR Dataset available at: https://zenodo.org/records/17812071 Video available at: https://youtu.be/i80H8erVISM

Learning soft continuum robot (SCR) dynamics from video offers flexibility but existing methods lack interpretability or rely on prior assumptions. Model-based approaches require prior knowledge and manual design. We bridge this gap by introducing: (1) The Attention Broadcast Decoder (ABCD), a plug-and-play module for autoencoder-based latent dynamics learning that generates pixel-accurate attention maps localizing each latent dimension's contribution while filtering static backgrounds, enabling visual interpretability via spatially grounded latents and on-image overlays. (2) Visual Oscillator Networks (VONs), a 2D latent oscillator network coupled to ABCD attention maps for on-image visualization of learned masses, coupling stiffness, and forces, thereby enabling mechanical interpretability. We validate our approach on single- and double-segment SCRs, demonstrating that ABCD-based models significantly improve multi-step prediction accuracy with 5.8x error reduction for Koopman operators and 3.5x for oscillator networks on a two-segment robot. VONs autonomously discover a chain structure of oscillators. This fully data-driven approach yields compact, mechanically interpretable models with potential relevance for future control applications.

翻译：从视频中学习软体连续体机器人（SCR）动力学具有灵活性，但现有方法缺乏可解释性或依赖先验假设。基于模型的方法需要先验知识和人工设计。我们通过引入以下方法弥合这一差距：(1) 注意力广播解码器（ABCD），一种用于基于自编码器的潜在动力学学习的即插即用模块，可生成像素级精度的注意力图，定位每个潜在维度的贡献，同时过滤静态背景，通过空间基底的潜在变量和图像叠加实现视觉可解释性。(2) 视觉振荡器网络（VONs），一种二维潜在振荡器网络，与ABCD注意力图耦合，用于在图像上可视化学习到的质量、耦合刚度和力，从而实现机械可解释性。我们在单段和双段SCR上验证了该方法，证明基于ABCD的模型显著提高了多步预测精度，在双段机器人上，Koopman算子的误差降低了5.8倍，振荡器网络的误差降低了3.5倍。VONs自主发现了振荡器的链式结构。这种完全数据驱动的方法生成了紧凑且具有机械可解释性的模型，对未来控制应用具有潜在意义。

0

相关内容

【斯坦福博士论文】利用在线交互经验提升机器人学习稳健性的算法研究

【斯坦福博士论文】利用在线交互经验提升机器人学习稳健性的算法研究

专知会员服务

18+阅读 · 3月19日

面向机器人操作的基于大型视觉‑语言模型（VLM）的视觉‑语言‑动作（VLA）模型综述

面向机器人操作的基于大型视觉‑语言模型（VLM）的视觉‑语言‑动作（VLA）模型综述

专知会员服务

34+阅读 · 2025年8月19日

【斯坦福大学博士论文】学习连续体机器人控制中的主要动力学

【斯坦福大学博士论文】学习连续体机器人控制中的主要动力学

专知会员服务

16+阅读 · 2025年4月19日

【UIUC博士论文】《从视频中进行机器人学习》

【UIUC博士论文】《从视频中进行机器人学习》

专知会员服务

25+阅读 · 2024年12月20日

来自互联网视频的通用机器人学习：综述

来自互联网视频的通用机器人学习：综述

专知会员服务

28+阅读 · 2024年5月4日

可解释的机器学习模型和架构

可解释的机器学习模型和架构

专知会员服务

92+阅读 · 2023年9月17日

基于神经网络的机器人学习与控制：回顾与展望

基于神经网络的机器人学习与控制：回顾与展望

专知会员服务

33+阅读 · 2023年9月10日

强化学习在机器人中的应用，附视频与Slides，Animesh Garg, UoT

强化学习在机器人中的应用，附视频与Slides，Animesh Garg, UoT

专知会员服务

37+阅读 · 2022年7月12日

机器人运动轨迹的模仿学习综述

机器人运动轨迹的模仿学习综述

专知会员服务

45+阅读 · 2021年6月8日

【ICCV 2019 Toturial】Interpretable Machine Learning for Computer Vision（用于计算机视觉的可解释性机器学习）

【ICCV 2019 Toturial】Interpretable Machine Learning for Computer Vision（用于计算机视觉的可解释性机器学习）

专知会员服务

32+阅读 · 2019年10月30日

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

专知

12+阅读 · 2023年4月4日

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

专知

13+阅读 · 2019年10月12日

【泡泡图灵智库】RelocNet：一种通过连续度量学习实现相机重定位的神经网络框架

【泡泡图灵智库】RelocNet：一种通过连续度量学习实现相机重定位的神经网络框架

泡泡机器人SLAM

14+阅读 · 2019年9月5日

干货 | 可解释的机器学习

干货 | 可解释的机器学习

AI科技评论

20+阅读 · 2019年7月3日

【前沿】让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法！

【前沿】让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法！

中国自动化学会

11+阅读 · 2019年6月18日

【综述】IBM 自动机器学习网络架构搜索最新综述，附45页全文下载

【综述】IBM 自动机器学习网络架构搜索最新综述，附45页全文下载

专知

20+阅读 · 2019年5月8日

在线元学习：通过持续元学习解决传统机器学习方式的致命不足

在线元学习：通过持续元学习解决传统机器学习方式的致命不足

新智元

12+阅读 · 2019年3月3日

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

专知

29+阅读 · 2019年3月1日

可解释的机器学习

可解释的机器学习

平均机器

25+阅读 · 2019年2月25日

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

产业智能官

16+阅读 · 2018年12月27日

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

空地机器人网络的同时视觉目标定位与分布式运动规划

国家自然科学基金

4+阅读 · 2015年12月31日

面向智能机器人柔性装配系统自主控制的主动视觉感知技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向无线多媒体传感器网络的高效压缩视频感知

国家自然科学基金

0+阅读 · 2015年12月31日

基于刚柔-机电耦合的主动约束层阻尼柔性机器人动力学建模与振动控制研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

CoMo: Learning Continuous Latent Motion from Internet Videos for Scalable Robot Learning

Arxiv

0+阅读 · 6月18日

AetheRock: An Arm-Worn Robot Teaching System for Force-Guided Vision-Tactile Learning

Arxiv

0+阅读 · 6月14日

LUCID: Learning Embodiment-Agnostic Intent Models from Unstructured Human Videos for Scalable Dexterous Robot Skill Acquisition

Arxiv

0+阅读 · 6月10日

Rod models in continuum and soft robot control: a review

Arxiv

0+阅读 · 6月9日

AetheRock: An Arm-Worn Robot Teaching System for Force-Guided Vision-Tactile Learning

Arxiv

0+阅读 · 6月8日

DynaFLIP: Rethinking Robotics Perception via Tri-Modal-Dynamics Guided Representation

Arxiv

0+阅读 · 5月28日

Data-Driven Dynamic Modeling of a Tendon-Actuated Continuum Robot

Arxiv

0+阅读 · 5月18日

VER: Vision Expert Transformer for Robot Learning via Foundation Distillation and Dynamic Routing

Arxiv

0+阅读 · 5月14日

Design of Magnetic Continuum Robots with Tunable Force Response Using Rotational Ring Pairs

Arxiv

0+阅读 · 5月13日

Efficient Model-Based Reinforcement Learning for Robot Control via Online Optimization

Arxiv

0+阅读 · 5月6日

VIP会员

文章信息

相关主题

连续体机器人

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

4+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

5+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

9+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

6+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

8+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

7+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

11+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

5+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

7+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

7+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

6+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

7+阅读 · 6月16日

相关VIP内容

【斯坦福博士论文】利用在线交互经验提升机器人学习稳健性的算法研究

【斯坦福博士论文】利用在线交互经验提升机器人学习稳健性的算法研究

专知会员服务

18+阅读 · 3月19日

面向机器人操作的基于大型视觉‑语言模型（VLM）的视觉‑语言‑动作（VLA）模型综述

面向机器人操作的基于大型视觉‑语言模型（VLM）的视觉‑语言‑动作（VLA）模型综述

专知会员服务

34+阅读 · 2025年8月19日

【斯坦福大学博士论文】学习连续体机器人控制中的主要动力学

【斯坦福大学博士论文】学习连续体机器人控制中的主要动力学

专知会员服务

16+阅读 · 2025年4月19日

【UIUC博士论文】《从视频中进行机器人学习》

【UIUC博士论文】《从视频中进行机器人学习》

专知会员服务

25+阅读 · 2024年12月20日

来自互联网视频的通用机器人学习：综述

来自互联网视频的通用机器人学习：综述

专知会员服务

28+阅读 · 2024年5月4日

可解释的机器学习模型和架构

可解释的机器学习模型和架构

专知会员服务

92+阅读 · 2023年9月17日

基于神经网络的机器人学习与控制：回顾与展望

基于神经网络的机器人学习与控制：回顾与展望

专知会员服务

33+阅读 · 2023年9月10日

强化学习在机器人中的应用，附视频与Slides，Animesh Garg, UoT

强化学习在机器人中的应用，附视频与Slides，Animesh Garg, UoT

专知会员服务

37+阅读 · 2022年7月12日

机器人运动轨迹的模仿学习综述

机器人运动轨迹的模仿学习综述

专知会员服务

45+阅读 · 2021年6月8日

【ICCV 2019 Toturial】Interpretable Machine Learning for Computer Vision（用于计算机视觉的可解释性机器学习）

【ICCV 2019 Toturial】Interpretable Machine Learning for Computer Vision（用于计算机视觉的可解释性机器学习）

专知会员服务

32+阅读 · 2019年10月30日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

专知

12+阅读 · 2023年4月4日

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

专知

13+阅读 · 2019年10月12日

【泡泡图灵智库】RelocNet：一种通过连续度量学习实现相机重定位的神经网络框架

【泡泡图灵智库】RelocNet：一种通过连续度量学习实现相机重定位的神经网络框架

泡泡机器人SLAM

14+阅读 · 2019年9月5日

干货 | 可解释的机器学习

干货 | 可解释的机器学习

AI科技评论

20+阅读 · 2019年7月3日

【前沿】让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法！

【前沿】让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法！

中国自动化学会

11+阅读 · 2019年6月18日

【综述】IBM 自动机器学习网络架构搜索最新综述，附45页全文下载

【综述】IBM 自动机器学习网络架构搜索最新综述，附45页全文下载

专知

20+阅读 · 2019年5月8日

在线元学习：通过持续元学习解决传统机器学习方式的致命不足

在线元学习：通过持续元学习解决传统机器学习方式的致命不足

新智元

12+阅读 · 2019年3月3日

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

专知

29+阅读 · 2019年3月1日

可解释的机器学习

可解释的机器学习

平均机器

25+阅读 · 2019年2月25日

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

【强化学习】用于真实机器人的高效深度强化学习算法、全面解读深度强化学习

产业智能官

16+阅读 · 2018年12月27日

相关论文

CoMo: Learning Continuous Latent Motion from Internet Videos for Scalable Robot Learning

Arxiv

0+阅读 · 6月18日

AetheRock: An Arm-Worn Robot Teaching System for Force-Guided Vision-Tactile Learning

Arxiv

0+阅读 · 6月14日

LUCID: Learning Embodiment-Agnostic Intent Models from Unstructured Human Videos for Scalable Dexterous Robot Skill Acquisition

Arxiv

0+阅读 · 6月10日

Rod models in continuum and soft robot control: a review

Arxiv

0+阅读 · 6月9日

AetheRock: An Arm-Worn Robot Teaching System for Force-Guided Vision-Tactile Learning

Arxiv

0+阅读 · 6月8日

DynaFLIP: Rethinking Robotics Perception via Tri-Modal-Dynamics Guided Representation

Arxiv

0+阅读 · 5月28日

Data-Driven Dynamic Modeling of a Tendon-Actuated Continuum Robot

Arxiv

0+阅读 · 5月18日

VER: Vision Expert Transformer for Robot Learning via Foundation Distillation and Dynamic Routing

Arxiv

0+阅读 · 5月14日

Design of Magnetic Continuum Robots with Tunable Force Response Using Rotational Ring Pairs

Arxiv

0+阅读 · 5月13日

Efficient Model-Based Reinforcement Learning for Robot Control via Online Optimization

Arxiv

0+阅读 · 5月6日

相关基金

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

空地机器人网络的同时视觉目标定位与分布式运动规划

国家自然科学基金

4+阅读 · 2015年12月31日

面向智能机器人柔性装配系统自主控制的主动视觉感知技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向无线多媒体传感器网络的高效压缩视频感知

国家自然科学基金

0+阅读 · 2015年12月31日

基于刚柔-机电耦合的主动约束层阻尼柔性机器人动力学建模与振动控制研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员