Taming OpenClaw: Security Analysis and Mitigation of Autonomous LLM Agent Threats - 专知论文

会员服务 ·

0

分析 · OpenClaw · 系统 · 智能体 · 安全分析 ·

Taming OpenClaw: Security Analysis and Mitigation of Autonomous LLM Agent Threats

翻译：驯服OpenClaw：自主LLM智能体威胁的安全分析与缓解

Xinhao Deng,Yixiang Zhang,Jiaqing Wu,Jiaqi Bai,Sibo Yi,Zhuoheng Zou,Yue Xiao,Rennai Qiu,Jianan Ma,Jialuo Chen,Xiaohu Du,Xiaofang Yang,Shiwen Cui,Changhua Meng,Weiqiang Wang,Jiaxing Song,Ke Xu,Qi Li

Autonomous Large Language Model (LLM) agents, exemplified by OpenClaw, demonstrate remarkable capabilities in executing complex, long-horizon tasks. However, their tightly coupled instant-messaging interaction paradigm and high-privilege execution capabilities substantially expand the system attack surface. In this paper, we present a comprehensive security threat analysis of OpenClaw. To structure our analysis, we introduce a five-layer lifecycle-oriented security framework that captures key stages of agent operation, i.e., initialization, input, inference, decision, and execution, and systematically examine compound threats across the agent's operational lifecycle, including indirect prompt injection, skill supply chain contamination, memory poisoning, and intent drift. Through detailed case studies on OpenClaw, we demonstrate the prevalence and severity of these threats and analyze the limitations of existing defenses. Our findings reveal critical weaknesses in current point-based defense mechanisms when addressing cross-temporal and multi-stage systemic risks, highlighting the need for holistic security architectures for autonomous LLM agents. Within this framework, we further examine representative defense strategies at each lifecycle stage, including plugin vetting frameworks, context-aware instruction filtering, memory integrity validation protocols, intent verification mechanisms, and capability enforcement architectures.

翻译：以OpenClaw为代表的自主大型语言模型智能体在执行复杂、长周期任务方面展现出卓越能力。然而，其紧密耦合的即时消息交互范式与高权限执行能力显著扩大了系统攻击面。本文对OpenClaw进行了全面的安全威胁分析。为构建分析框架，我们提出了一个五层面向生命周期的安全框架，涵盖智能体运行的关键阶段——初始化、输入、推理、决策与执行，并系统性地审视了贯穿智能体运行生命周期的复合威胁，包括间接提示注入、技能供应链污染、记忆毒化与意图漂移。通过对OpenClaw的详细案例研究，我们论证了这些威胁的普遍性与严重性，并分析了现有防御机制的局限性。我们的研究揭示了当前基于单点防御的机制在处理跨时序、多阶段系统性风险时的关键缺陷，凸显了为自主LLM智能体构建整体性安全架构的必要性。在此框架内，我们进一步探讨了各生命周期阶段的代表性防御策略，包括插件审查框架、上下文感知指令过滤、记忆完整性验证协议、意图验证机制以及能力执行架构。

0

相关内容

AI原生组织：OpenClaw推动组织形态重塑，47页pdf

AI原生组织：OpenClaw推动组织形态重塑，47页pdf

专知会员服务

25+阅读 · 3月27日

OpenClaw完全指南：从入门到精通｜附629页PDF文件下载

OpenClaw完全指南：从入门到精通｜附629页PDF文件下载

专知会员服务

89+阅读 · 3月14日

AI大模型·白皮书 | OpenClaw自我研究1.0报告-清新研究-66页

AI大模型·白皮书 | OpenClaw自我研究1.0报告-清新研究-66页

专知会员服务

66+阅读 · 3月7日

清华大学：OpenClaw发展研究1.0报告｜附75页PDF文件下载

清华大学：OpenClaw发展研究1.0报告｜附75页PDF文件下载

专知会员服务

122+阅读 · 3月6日

AI智能体时代大模型安全风险与攻防新挑战

AI智能体时代大模型安全风险与攻防新挑战

专知会员服务

13+阅读 · 2月27日

《人工智能增强监视分析：利用跨网络、陆地、空中及海上领域的威胁向量实时建模》

《人工智能增强监视分析：利用跨网络、陆地、空中及海上领域的威胁向量实时建模》

专知会员服务

28+阅读 · 2025年12月11日

《利用人工智能增强的监视分析在网络、陆地、空中和海上领域实时建模威胁向量》

《利用人工智能增强的监视分析在网络、陆地、空中和海上领域实时建模威胁向量》

专知会员服务

22+阅读 · 2025年11月2日

智能体安全综述：应用、威胁与防御

智能体安全综述：应用、威胁与防御

专知会员服务

41+阅读 · 2025年10月12日

可信赖LLM智能体的研究综述：威胁与应对措施

可信赖LLM智能体的研究综述：威胁与应对措施

专知会员服务

36+阅读 · 2025年3月17日

AI Agent下一个热点？复旦最新86页《大型语言模型智能体的崛起与潜力》综述，详述LLM Agent: 大脑、感知和行动

AI Agent下一个热点？复旦最新86页《大型语言模型智能体的崛起与潜力》综述，详述LLM Agent: 大脑、感知和行动

专知会员服务

170+阅读 · 2023年9月15日

OpenAI超级对话模型ChatGPT发布！智能回答堪比雅思口语满分案例

OpenAI超级对话模型ChatGPT发布！智能回答堪比雅思口语满分案例

新智元

29+阅读 · 2022年12月1日

推荐！【中美俄AI军用方向】中文版《为国家安全和国防开发人工智能》，美军重大AI应用案例及未来发展布局

推荐！【中美俄AI军用方向】中文版《为国家安全和国防开发人工智能》，美军重大AI应用案例及未来发展布局

专知

73+阅读 · 2022年6月30日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

91+阅读 · 2022年4月17日

《人工智能安全测评白皮书》，99页pdf

《人工智能安全测评白皮书》，99页pdf

专知

36+阅读 · 2022年2月26日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

中国信通院：人工智能安全白皮书（2018年）（附解读及白皮书下载）

中国信通院：人工智能安全白皮书（2018年）（附解读及白皮书下载）

走向智能论坛

27+阅读 · 2018年9月18日

【下载】面向Open AI, TensorFlow, Keras的强化学习书籍《Reinforcement Learning》

【下载】面向Open AI, TensorFlow, Keras的强化学习书籍《Reinforcement Learning》

专知

27+阅读 · 2017年12月17日

资源 | 清华大学开源OpenKE：知识表示学习平台

资源 | 清华大学开源OpenKE：知识表示学习平台

机器之心

10+阅读 · 2017年11月4日

网络安全态势感知浅析

网络安全态势感知浅析

计算机与网络安全

18+阅读 · 2017年10月13日

基于学习的智能化漏洞挖掘关键技术研究

国家自然科学基金

6+阅读 · 2017年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向主动安全控制的工程车辆动态信息获取与状态辨识

国家自然科学基金

0+阅读 · 2015年12月31日

网络空间安全关键技术研究

国家自然科学基金

20+阅读 · 2015年12月31日

复杂需求场景驱动的软件安全防护模型检测技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

隐写模糊安全性测度及其优化嵌入算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向CCMANET网络可证明安全命名与名字路由机制关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向生物威胁快速反应的大数据分析关键技术

国家自然科学基金

0+阅读 · 2014年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

ClawKeeper: Comprehensive Safety Protection for OpenClaw Agents Through Skills, Plugins, and Watchers

Arxiv

0+阅读 · 3月25日

Caging the Agents: A Zero Trust Security Architecture for Autonomous AI in Healthcare

Arxiv

0+阅读 · 3月18日

Defensible Design for OpenClaw: Securing Autonomous Tool-Invoking Agents

Arxiv

0+阅读 · 3月13日

Governance Architecture for Autonomous Agent Systems: Threats, Framework, and Engineering Practice

Arxiv

0+阅读 · 3月10日

Agent Tools Orchestration Leaks More: Dataset, Benchmark, and Mitigation

Arxiv

0+阅读 · 3月6日

AgentSentry: Mitigating Indirect Prompt Injection in LLM Agents via Temporal Causal Diagnostics and Context Purification

Arxiv

0+阅读 · 2月26日

How Well Can LLM Agents Simulate End-User Security and Privacy Attitudes and Behaviors?

Arxiv

0+阅读 · 2月24日

The LLMbda Calculus: AI Agents, Conversations, and Information Flow

Arxiv

0+阅读 · 2月23日

Agentic AI as a Cybersecurity Attack Surface: Threats, Exploits, and Defenses in Runtime Supply Chains

Arxiv

0+阅读 · 2月23日

LLM Scalability Risk for Agentic-AI and Model Supply Chain Security

Arxiv

0+阅读 · 2月22日

VIP会员

文章信息

相关主题

最新内容

DeepSeek 版Claude Code，免费小白安装教程来了！

DeepSeek 版Claude Code，免费小白安装教程来了！

专知会员服务

7+阅读 · 5月5日

【ICML Spotlight 2026】 T²PO: 不确定性引导的探索控制框架，实现稳定多轮Agentic强化学习

【ICML Spotlight 2026】 T²PO: 不确定性引导的探索控制框架，实现稳定多轮Agentic强化学习

专知会员服务

4+阅读 · 5月5日

基础模型驱动的工业智能体：技术成熟度、能力变迁与未竟之挑战

基础模型驱动的工业智能体：技术成熟度、能力变迁与未竟之挑战

专知会员服务

4+阅读 · 5月5日

《机动炮兵的演进与未来：技术进步、历史沿革与炮兵作战前瞻》

《机动炮兵的演进与未来：技术进步、历史沿革与炮兵作战前瞻》

专知会员服务

5+阅读 · 5月5日

《火炮弹药快速效能建模：提升互操作性与技术优势》（报告）

《火炮弹药快速效能建模：提升互操作性与技术优势》（报告）

专知会员服务

7+阅读 · 5月5日

《美空军条令出版物 2-0：情报（2026版）》

《美空军条令出版物 2-0：情报（2026版）》

专知会员服务

13+阅读 · 5月5日

美陆军“飞蝇陷阱5.0”项目将新兴技术交到作战人员手中

美陆军“飞蝇陷阱5.0”项目将新兴技术交到作战人员手中

专知会员服务

5+阅读 · 5月5日

帕兰提尔 Gotham：一个游戏规则改变器

帕兰提尔 Gotham：一个游戏规则改变器

专知会员服务

7+阅读 · 5月5日

【ICML 2026】用测试时训练线性化视觉Transformer：T⁵ 实现 Softmax 注意力到线性复杂度的快速转换

【ICML 2026】用测试时训练线性化视觉Transformer：T⁵ 实现 Softmax 注意力到线性复杂度的快速转换

专知会员服务

3+阅读 · 5月5日

【AAAI 2026】大模型做知识蒸馏：CMM将LLM特征拆解给小模型协同学习

【AAAI 2026】大模型做知识蒸馏：CMM将LLM特征拆解给小模型协同学习

专知会员服务

3+阅读 · 5月5日

【ICML Spotlight 2026 】NonZero：交互引导探索的多智能体蒙特卡洛树搜索

【ICML Spotlight 2026 】NonZero：交互引导探索的多智能体蒙特卡洛树搜索

专知会员服务

8+阅读 · 5月4日

【综述】机器人学习中的世界模型：全面综述

【综述】机器人学习中的世界模型：全面综述

专知会员服务

11+阅读 · 5月4日

伊朗的导弹-无人机行动及其对美国威慑的影响

伊朗的导弹-无人机行动及其对美国威慑的影响

专知会员服务

9+阅读 · 5月4日

《未来战术无人机系统案例研究：量身定制采办策略方法》100页报告

《未来战术无人机系统案例研究：量身定制采办策略方法》100页报告

专知会员服务

9+阅读 · 5月4日

战争贩子：2026年第一季度美国对中东潜在军售激增

战争贩子：2026年第一季度美国对中东潜在军售激增

专知会员服务

7+阅读 · 5月4日

相关VIP内容

AI原生组织：OpenClaw推动组织形态重塑，47页pdf

AI原生组织：OpenClaw推动组织形态重塑，47页pdf

专知会员服务

25+阅读 · 3月27日

OpenClaw完全指南：从入门到精通｜附629页PDF文件下载

OpenClaw完全指南：从入门到精通｜附629页PDF文件下载

专知会员服务

89+阅读 · 3月14日

AI大模型·白皮书 | OpenClaw自我研究1.0报告-清新研究-66页

AI大模型·白皮书 | OpenClaw自我研究1.0报告-清新研究-66页

专知会员服务

66+阅读 · 3月7日

清华大学：OpenClaw发展研究1.0报告｜附75页PDF文件下载

清华大学：OpenClaw发展研究1.0报告｜附75页PDF文件下载

专知会员服务

122+阅读 · 3月6日

AI智能体时代大模型安全风险与攻防新挑战

AI智能体时代大模型安全风险与攻防新挑战

专知会员服务

13+阅读 · 2月27日

《人工智能增强监视分析：利用跨网络、陆地、空中及海上领域的威胁向量实时建模》

《人工智能增强监视分析：利用跨网络、陆地、空中及海上领域的威胁向量实时建模》

专知会员服务

28+阅读 · 2025年12月11日

《利用人工智能增强的监视分析在网络、陆地、空中和海上领域实时建模威胁向量》

《利用人工智能增强的监视分析在网络、陆地、空中和海上领域实时建模威胁向量》

专知会员服务

22+阅读 · 2025年11月2日

智能体安全综述：应用、威胁与防御

智能体安全综述：应用、威胁与防御

专知会员服务

41+阅读 · 2025年10月12日

可信赖LLM智能体的研究综述：威胁与应对措施

可信赖LLM智能体的研究综述：威胁与应对措施

专知会员服务

36+阅读 · 2025年3月17日

AI Agent下一个热点？复旦最新86页《大型语言模型智能体的崛起与潜力》综述，详述LLM Agent: 大脑、感知和行动

AI Agent下一个热点？复旦最新86页《大型语言模型智能体的崛起与潜力》综述，详述LLM Agent: 大脑、感知和行动

专知会员服务

170+阅读 · 2023年9月15日

热门VIP内容

开通专知VIP会员享更多权益服务

【ICML Spotlight 2026】 T²PO: 不确定性引导的探索控制框架，实现稳定多轮Agentic强化学习

《机动炮兵的演进与未来：技术进步、历史沿革与炮兵作战前瞻》

DeepSeek 版Claude Code，免费小白安装教程来了！

基础模型驱动的工业智能体：技术成熟度、能力变迁与未竟之挑战

相关资讯

OpenAI超级对话模型ChatGPT发布！智能回答堪比雅思口语满分案例

OpenAI超级对话模型ChatGPT发布！智能回答堪比雅思口语满分案例

新智元

29+阅读 · 2022年12月1日

推荐！【中美俄AI军用方向】中文版《为国家安全和国防开发人工智能》，美军重大AI应用案例及未来发展布局

推荐！【中美俄AI军用方向】中文版《为国家安全和国防开发人工智能》，美军重大AI应用案例及未来发展布局

专知

73+阅读 · 2022年6月30日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

91+阅读 · 2022年4月17日

《人工智能安全测评白皮书》，99页pdf

《人工智能安全测评白皮书》，99页pdf

专知

36+阅读 · 2022年2月26日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

中国信通院：人工智能安全白皮书（2018年）（附解读及白皮书下载）

中国信通院：人工智能安全白皮书（2018年）（附解读及白皮书下载）

走向智能论坛

27+阅读 · 2018年9月18日

【下载】面向Open AI, TensorFlow, Keras的强化学习书籍《Reinforcement Learning》

【下载】面向Open AI, TensorFlow, Keras的强化学习书籍《Reinforcement Learning》

专知

27+阅读 · 2017年12月17日

资源 | 清华大学开源OpenKE：知识表示学习平台

资源 | 清华大学开源OpenKE：知识表示学习平台

机器之心

10+阅读 · 2017年11月4日

网络安全态势感知浅析

网络安全态势感知浅析

计算机与网络安全

18+阅读 · 2017年10月13日

相关论文

ClawKeeper: Comprehensive Safety Protection for OpenClaw Agents Through Skills, Plugins, and Watchers

Arxiv

0+阅读 · 3月25日

Caging the Agents: A Zero Trust Security Architecture for Autonomous AI in Healthcare

Arxiv

0+阅读 · 3月18日

Defensible Design for OpenClaw: Securing Autonomous Tool-Invoking Agents

Arxiv

0+阅读 · 3月13日

Governance Architecture for Autonomous Agent Systems: Threats, Framework, and Engineering Practice

Arxiv

0+阅读 · 3月10日

Agent Tools Orchestration Leaks More: Dataset, Benchmark, and Mitigation

Arxiv

0+阅读 · 3月6日

AgentSentry: Mitigating Indirect Prompt Injection in LLM Agents via Temporal Causal Diagnostics and Context Purification

Arxiv

0+阅读 · 2月26日

How Well Can LLM Agents Simulate End-User Security and Privacy Attitudes and Behaviors?

Arxiv

0+阅读 · 2月24日

The LLMbda Calculus: AI Agents, Conversations, and Information Flow

Arxiv

0+阅读 · 2月23日

Agentic AI as a Cybersecurity Attack Surface: Threats, Exploits, and Defenses in Runtime Supply Chains

Arxiv

0+阅读 · 2月23日

LLM Scalability Risk for Agentic-AI and Model Supply Chain Security

Arxiv

0+阅读 · 2月22日

相关基金

基于学习的智能化漏洞挖掘关键技术研究

国家自然科学基金

6+阅读 · 2017年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向主动安全控制的工程车辆动态信息获取与状态辨识

国家自然科学基金

0+阅读 · 2015年12月31日

网络空间安全关键技术研究

国家自然科学基金

20+阅读 · 2015年12月31日

复杂需求场景驱动的软件安全防护模型检测技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

隐写模糊安全性测度及其优化嵌入算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向CCMANET网络可证明安全命名与名字路由机制关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向生物威胁快速反应的大数据分析关键技术

国家自然科学基金

0+阅读 · 2014年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员