Targeting World Models to Compromise Robot Learning Pipelines - 专知论文

会员服务 ·

0

攻击 · 机器人学 · 机器人 · 世界模型 · 机器人学习 ·

Targeting World Models to Compromise Robot Learning Pipelines

翻译：针对世界模型攻击以破坏机器人学习流程的论文目标

Ethan Rathbun,Ahmed Agha,Saaduddin Mahmud,Christopher Amato,Alina Oprea,Eugene Bagdasarian

from arxiv, 8 Pages, CoRL Preprint

World models have recently seen a rapid growth in both their popularity and capability as more data efficient tools for generating robot training data or simulating real world environments, with many works proposing their integration into the robot learning pipeline. While highly practical, in this work we demonstrate that world models introduce a uniquely stealthy and effective data poisoning entry point into the robot learning supply chain that can result in the deployment of unsafe or otherwise compromised robotic policies despite training on seemingly safe ground truth training data. In contrast to traditional data poisoning techniques which directly implant dangerous trajectories into sold or uploaded datasets, our novel attack methods inject malicious prompts or compromising transition dynamics into visibly safe teleoperated datasets which are only activated once fed through a world model as input. This can result in the generation of synthetic, dangerous robot training trajectories and subsequently unsafe or compromised robot policies. We demonstrate the effectiveness of our attacks against both state of the art action conditioned and text conditioned world models, showing a full end-to-end backdoor on a downstream DRL policy and a proof-of-concept for the VLA setting. Overall these findings necessitate research into more secure world models and reevaluating their position within the robot learning supply chain.

翻译：世界模型近年来在生成机器人训练数据或模拟真实环境方面，因其高效的数据利用能力而迅速普及且能力激增，许多研究提出将其整合到机器人学习流程中。尽管这些模型极具实用性，但本研究表明，世界模型为机器人学习供应链引入了一种独特且隐蔽的数据投毒入口点，可能导致在基于看似安全的真实训练数据完成训练后，部署不安全的或存在后门的机器人策略。与传统数据投毒技术直接向已出售或公开数据集植入危险轨迹不同，我们的新型攻击方法将恶意提示或有问题的转换动态注入到视觉安全的遥操作数据集中，这些恶意数据仅在被用作世界模型输入时才会激活。这可能导致生成合成型危险机器人训练轨迹，并最终形成不安全或受操控的机器人策略。我们针对当前最先进的动作条件型与文本条件型世界模型验证了攻击的有效性，展示了针对下游深度强化学习策略的全链路后门攻击，并在视觉-语言-动作（VLA）场景中完成了概念验证。总体而言，这些发现要求对更安全的世界模型展开研究，并重新评估其在机器人学习供应链中的位置。

0

相关内容

【综述】世界模型：架构、方法、推理与应用全景

【综述】世界模型：架构、方法、推理与应用全景

专知会员服务

34+阅读 · 6月2日

【MIT博士论文】通过神经物理构建世界模型

【MIT博士论文】通过神经物理构建世界模型

专知会员服务

36+阅读 · 2025年4月3日

【UIUC博士论文】《从视频中进行机器人学习》

【UIUC博士论文】《从视频中进行机器人学习》

专知会员服务

25+阅读 · 2024年12月20日

【NTU博士论文】开放世界中机器学习的自然鲁棒性，175页pdf

【NTU博士论文】开放世界中机器学习的自然鲁棒性，175页pdf

专知会员服务

34+阅读 · 2023年12月24日

【MIT博士论文】对对抗样本和后门攻击鲁棒的机器学习模型

【MIT博士论文】对对抗样本和后门攻击鲁棒的机器学习模型

专知会员服务

48+阅读 · 2023年3月31日

面向机器学习模型安全的测试与修复

面向机器学习模型安全的测试与修复

专知会员服务

55+阅读 · 2023年2月5日

黑盒机器学习模型的成员推断攻击研究

专知会员服务

24+阅读 · 2021年8月22日

华东师大最新《人在环路机器学习》综述论文，224篇文献30页pdf

华东师大最新《人在环路机器学习》综述论文，224篇文献30页pdf

专知会员服务

82+阅读 · 2021年8月3日

针对深度学习模型的对抗性攻击与防御

专知会员服务

49+阅读 · 2021年5月17日

机器学习模型部署都有哪些坑？剑桥研究者梳理了99篇相关研究

专知会员服务

41+阅读 · 2020年12月13日

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

专知

12+阅读 · 2023年4月4日

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知

28+阅读 · 2022年9月11日

最新《可解释机器学习》报告，164页ppt建模阐述XAI进展

最新《可解释机器学习》报告，164页ppt建模阐述XAI进展

专知

10+阅读 · 2022年8月25日

【AI与军事】机器学习的军事应用，一种文献计量视角

【AI与军事】机器学习的军事应用，一种文献计量视角

专知

55+阅读 · 2022年4月25日

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

专知

15+阅读 · 2022年2月16日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

78+阅读 · 2019年10月20日

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

专知

14+阅读 · 2019年10月9日

一文读懂机器学习模型的选择与取舍

一文读懂机器学习模型的选择与取舍

DBAplus社群

13+阅读 · 2019年8月25日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

【干货】Python机器学习机器学习项目实战3——模型解释与结果分析（附代码）

【干货】Python机器学习机器学习项目实战3——模型解释与结果分析（附代码）

专知

16+阅读 · 2018年5月24日

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

52+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

面向大规模数据流的集成学习模型与方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

Critique of World Model: A Generative Latent Prediction Architecture for World Modeling

Arxiv

0+阅读 · 6月16日

BadWorld: Adversarial Attacks on World Models

Arxiv

0+阅读 · 6月15日

LaWAM: Latent World Action Models for Efficient Dynamics-Aware Robot Policies

Arxiv

0+阅读 · 6月14日

An Attention-based Model for Robust Forecasting with Missing Modality

Arxiv

0+阅读 · 6月11日

Making Foresight Actionable: Repurposing Representation Alignment in World Action Models

Arxiv

0+阅读 · 6月10日

Unifying Object-Centric World Models and Diffusion Policy: A Hierarchical Framework for Multi-Stage Robotic Tasks

Arxiv

0+阅读 · 6月7日

Generalization of World Models under Environmental Variability for Vision-based Quadrotor Navigation

Arxiv

0+阅读 · 6月3日

RoboDream: Compositional World Models for Scalable Robot Data Synthesis

Arxiv

0+阅读 · 6月1日

Simulation Distillation: Pretraining World Models in Simulation for Rapid Real-World Adaptation

Arxiv

0+阅读 · 5月12日

Hi-WM: Human-in-the-World-Model for Scalable Robot Post-Training

Arxiv

0+阅读 · 5月5日

VIP会员

文章信息

相关主题

机器人学习

最新内容

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

5+阅读 · 今天4:35

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

3+阅读 · 今天4:24

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

3+阅读 · 今天4:18

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 今天4:15

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 今天4:08

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

7+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

7+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

7+阅读 · 7月31日

“史诗怒火”行动：现代多域作战的重要节点

“史诗怒火”行动：现代多域作战的重要节点

专知会员服务

8+阅读 · 7月30日

《下一代无线网络中的多无人机通信资源管理》

《下一代无线网络中的多无人机通信资源管理》

专知会员服务

8+阅读 · 7月30日

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

专知会员服务

9+阅读 · 7月30日

《人机协同在安全关键型操作决策中的应用》120页

《人机协同在安全关键型操作决策中的应用》120页

专知会员服务

8+阅读 · 7月30日

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

专知会员服务

6+阅读 · 7月30日

相关VIP内容

【综述】世界模型：架构、方法、推理与应用全景

【综述】世界模型：架构、方法、推理与应用全景

专知会员服务

34+阅读 · 6月2日

【MIT博士论文】通过神经物理构建世界模型

【MIT博士论文】通过神经物理构建世界模型

专知会员服务

36+阅读 · 2025年4月3日

【UIUC博士论文】《从视频中进行机器人学习》

【UIUC博士论文】《从视频中进行机器人学习》

专知会员服务

25+阅读 · 2024年12月20日

【NTU博士论文】开放世界中机器学习的自然鲁棒性，175页pdf

【NTU博士论文】开放世界中机器学习的自然鲁棒性，175页pdf

专知会员服务

34+阅读 · 2023年12月24日

【MIT博士论文】对对抗样本和后门攻击鲁棒的机器学习模型

【MIT博士论文】对对抗样本和后门攻击鲁棒的机器学习模型

专知会员服务

48+阅读 · 2023年3月31日

面向机器学习模型安全的测试与修复

面向机器学习模型安全的测试与修复

专知会员服务

55+阅读 · 2023年2月5日

黑盒机器学习模型的成员推断攻击研究

专知会员服务

24+阅读 · 2021年8月22日

华东师大最新《人在环路机器学习》综述论文，224篇文献30页pdf

华东师大最新《人在环路机器学习》综述论文，224篇文献30页pdf

专知会员服务

82+阅读 · 2021年8月3日

针对深度学习模型的对抗性攻击与防御

专知会员服务

49+阅读 · 2021年5月17日

机器学习模型部署都有哪些坑？剑桥研究者梳理了99篇相关研究

专知会员服务

41+阅读 · 2020年12月13日

热门VIP内容

开通专知VIP会员享更多权益服务

隐身技术前沿综述：物理机理、工程实践与战略展望

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

相关资讯

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

专知

12+阅读 · 2023年4月4日

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

【斯坦福博士论文】利用先验知识和结构进行数据高效的机器学习，154页pdf

专知

28+阅读 · 2022年9月11日

最新《可解释机器学习》报告，164页ppt建模阐述XAI进展

最新《可解释机器学习》报告，164页ppt建模阐述XAI进展

专知

10+阅读 · 2022年8月25日

【AI与军事】机器学习的军事应用，一种文献计量视角

【AI与军事】机器学习的军事应用，一种文献计量视角

专知

55+阅读 · 2022年4月25日

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

专知

15+阅读 · 2022年2月16日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

78+阅读 · 2019年10月20日

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

专知

14+阅读 · 2019年10月9日

一文读懂机器学习模型的选择与取舍

一文读懂机器学习模型的选择与取舍

DBAplus社群

13+阅读 · 2019年8月25日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

【干货】Python机器学习机器学习项目实战3——模型解释与结果分析（附代码）

【干货】Python机器学习机器学习项目实战3——模型解释与结果分析（附代码）

专知

16+阅读 · 2018年5月24日

相关论文

Critique of World Model: A Generative Latent Prediction Architecture for World Modeling

Arxiv

0+阅读 · 6月16日

BadWorld: Adversarial Attacks on World Models

Arxiv

0+阅读 · 6月15日

LaWAM: Latent World Action Models for Efficient Dynamics-Aware Robot Policies

Arxiv

0+阅读 · 6月14日

An Attention-based Model for Robust Forecasting with Missing Modality

Arxiv

0+阅读 · 6月11日

Making Foresight Actionable: Repurposing Representation Alignment in World Action Models

Arxiv

0+阅读 · 6月10日

Unifying Object-Centric World Models and Diffusion Policy: A Hierarchical Framework for Multi-Stage Robotic Tasks

Arxiv

0+阅读 · 6月7日

Generalization of World Models under Environmental Variability for Vision-based Quadrotor Navigation

Arxiv

0+阅读 · 6月3日

RoboDream: Compositional World Models for Scalable Robot Data Synthesis

Arxiv

0+阅读 · 6月1日

Simulation Distillation: Pretraining World Models in Simulation for Rapid Real-World Adaptation

Arxiv

0+阅读 · 5月12日

Hi-WM: Human-in-the-World-Model for Scalable Robot Post-Training

Arxiv

0+阅读 · 5月5日

相关基金

共融机器人战略规划研究和学术交流

国家自然科学基金

15+阅读 · 2016年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

52+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

面向大规模数据流的集成学习模型与方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员