From Untrusted Input to Trusted Memory: A Systematic Study of Memory Poisoning Attacks in LLM Agents - 专知论文

会员服务 ·

0

Agent · 设计 · AI · 通道 · Prompt ·

From Untrusted Input to Trusted Memory: A Systematic Study of Memory Poisoning Attacks in LLM Agents

翻译：暂无翻译

Pritam Dash,Tongyu Ge,Aditi Jain,Tanmay Shah,Zhiwei Shang

Memory is a core component of AI agents, enabling them to accumulate knowledge across interactions and improve performance. However, persistent memory introduces the risk of memory poisoning, where a single adversarial memory write can exert long-term influence over agent behavior. We present a systematic study of memory poisoning in LLM-based agents. We identify four memory write channels and nine structural vulnerabilities in model capabilities, system prompt design, and agent system architecture that make these channels exploitable. Based on these vulnerabilities, we develop a taxonomy of six classes of memory poisoning attacks. Furthermore, we design MPBench -- a benchmark for evaluating memory poisoning attacks, and show that agents designed to write and retrieve memory more aggressively are more exploitable. We also show that existing prompt injection defenses fail to cover memory poisoning attacks. Our findings provide a foundation for understanding and mitigating memory poisoning attacks against AI agents.

翻译：暂无翻译

0

相关内容

Agent

管理 LLM 智能体中的演进式记忆：风险、机理及稳定性与安全性受控记忆（SSGM）框架

管理 LLM 智能体中的演进式记忆：风险、机理及稳定性与安全性受控记忆（SSGM）框架

专知会员服务

16+阅读 · 3月14日

基于图结构的智能体记忆机制：分类体系、关键技术与应用综述

基于图结构的智能体记忆机制：分类体系、关键技术与应用综述

专知会员服务

31+阅读 · 2月6日

人工智能遇见大脑：从认知神经科学到自主智能体的记忆系统统一综述

人工智能遇见大脑：从认知神经科学到自主智能体的记忆系统统一综述

专知会员服务

26+阅读 · 1月4日

AI智能体时代中的记忆：形式、功能与动态综述

AI智能体时代中的记忆：形式、功能与动态综述

专知会员服务

36+阅读 · 2025年12月16日

【NeurIPS2025】VideoLucy：用于长视频理解的深度记忆回溯机制

【NeurIPS2025】VideoLucy：用于长视频理解的深度记忆回溯机制

专知会员服务

9+阅读 · 2025年10月15日

南大本科生NeurIPS论文！俞扬团队首次揭示强化学习「记忆池」最优利用方法

南大本科生NeurIPS论文！俞扬团队首次揭示强化学习「记忆池」最优利用方法

专知会员服务

25+阅读 · 2021年12月17日

卷积神经网络中的注意力机制综述

卷积神经网络中的注意力机制综述

专知会员服务

77+阅读 · 2021年10月22日

如何洞晓深度学习中记忆与注意力机制？这份Deakin大学212页博士论文给您做解答

如何洞晓深度学习中记忆与注意力机制？这份Deakin大学212页博士论文给您做解答

专知会员服务

68+阅读 · 2021年7月7日

神经网络的持续终身学习综述论文

专知会员服务

44+阅读 · 2021年5月19日

【论文翻译】NLP注意力机制综述论文翻译，Attention, please! A Critical Review of Neural Attention Models in Natural Language Processing

【论文翻译】NLP注意力机制综述论文翻译，Attention, please! A Critical Review of Neural Attention Models in Natural Language Processing

专知会员服务

96+阅读 · 2020年4月18日

GAN新书《生成式深度学习》Generative Deep Learning，附379页全文PDF

GAN新书《生成式深度学习》Generative Deep Learning，附379页全文PDF

专知

96+阅读 · 2019年9月30日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

自然语言处理中注意力机制综述

自然语言处理中注意力机制综述

黑龙江大学自然语言处理实验室

11+阅读 · 2019年2月26日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

44+阅读 · 2019年1月3日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

论文浅尝 | 基于Universal Schema与Memory Network的知识+文本问答

论文浅尝 | 基于Universal Schema与Memory Network的知识+文本问答

开放知识图谱

11+阅读 · 2018年12月16日

【学生论坛】详解记忆增强神经网络

【学生论坛】详解记忆增强神经网络

中国科学院自动化研究所

106+阅读 · 2018年11月15日

论文浅尝 | 嵌入常识知识的注意力 LSTM 模型用于特定目标的基于侧面的情感分析

论文浅尝 | 嵌入常识知识的注意力 LSTM 模型用于特定目标的基于侧面的情感分析

开放知识图谱

28+阅读 · 2018年6月11日

【深度学习Attention详解】记忆力与注意力机制讲义，复旦邱锡鹏老师《神经网络与深度学习》教程系列分享04（附pdf下载）

【深度学习Attention详解】记忆力与注意力机制讲义，复旦邱锡鹏老师《神经网络与深度学习》教程系列分享04（附pdf下载）

专知

10+阅读 · 2017年11月18日

深度学习中的注意力机制

深度学习中的注意力机制

人工智能头条

16+阅读 · 2017年11月2日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

AD小鼠成年海马神经发生异常对空间参考记忆编码的影响及其机制研究

国家自然科学基金

0+阅读 · 2016年12月31日

面向人类工作记忆改善的脑电复杂网络信息反馈非线性计算模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于不完全测量信息的随机忆阻神经网络的参数与状态估计问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

一对多联想记忆中的细胞神经网络建模及参数获取方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

遗忘型轻度认知障碍患者内颞叶记忆网络动态变化研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于记忆学习与免疫系统的仿生控制研究

国家自然科学基金

7+阅读 · 2015年12月31日

学习与记忆的神经动力学研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

Towards Root Memories: Benchmarking and Enhancing Implicit Logical Memory Retrieval for Personalized LLMs

Arxiv

0+阅读 · 6月22日

Defense effectiveness across architectural layers: a mechanistic evaluation of persistent memory attacks on stateful LLM agents

Arxiv

0+阅读 · 6月22日

Managing Procedural Memory in LLM Agents: Control, Adaptation, and Evaluation

Arxiv

0+阅读 · 6月22日

RaMem: Contextual Reinstatement for Long-term Agentic Memory

Arxiv

0+阅读 · 6月22日

A comparative study on power delivery aspects of compute-in/near-memory approaches using DRAM

Arxiv

0+阅读 · 6月20日

AdaMem: Learning What to Remember for Personalized Long-Horizon LLM Agents

Arxiv

0+阅读 · 6月19日

CogniFold: Always-On Proactive Memory via Cognitive Folding

Arxiv

0+阅读 · 6月17日

ActMem: Bridging the Gap Between Memory Retrieval and Reasoning in LLM Agents

Arxiv

0+阅读 · 6月17日

CoreMem: Riemannian Retrieval and Fisher-Guided Distillation for Long-Term Memory in Dialogue Agents

Arxiv

0+阅读 · 6月16日

From Untrusted Input to Trusted Memory: A Systematic Study of Memory Poisoning Attacks in LLM Agents

Arxiv

0+阅读 · 6月3日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

2+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

3+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

4+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

3+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

3+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

管理 LLM 智能体中的演进式记忆：风险、机理及稳定性与安全性受控记忆（SSGM）框架

管理 LLM 智能体中的演进式记忆：风险、机理及稳定性与安全性受控记忆（SSGM）框架

专知会员服务

16+阅读 · 3月14日

基于图结构的智能体记忆机制：分类体系、关键技术与应用综述

基于图结构的智能体记忆机制：分类体系、关键技术与应用综述

专知会员服务

31+阅读 · 2月6日

人工智能遇见大脑：从认知神经科学到自主智能体的记忆系统统一综述

人工智能遇见大脑：从认知神经科学到自主智能体的记忆系统统一综述

专知会员服务

26+阅读 · 1月4日

AI智能体时代中的记忆：形式、功能与动态综述

AI智能体时代中的记忆：形式、功能与动态综述

专知会员服务

36+阅读 · 2025年12月16日

【NeurIPS2025】VideoLucy：用于长视频理解的深度记忆回溯机制

【NeurIPS2025】VideoLucy：用于长视频理解的深度记忆回溯机制

专知会员服务

9+阅读 · 2025年10月15日

南大本科生NeurIPS论文！俞扬团队首次揭示强化学习「记忆池」最优利用方法

南大本科生NeurIPS论文！俞扬团队首次揭示强化学习「记忆池」最优利用方法

专知会员服务

25+阅读 · 2021年12月17日

卷积神经网络中的注意力机制综述

卷积神经网络中的注意力机制综述

专知会员服务

77+阅读 · 2021年10月22日

如何洞晓深度学习中记忆与注意力机制？这份Deakin大学212页博士论文给您做解答

如何洞晓深度学习中记忆与注意力机制？这份Deakin大学212页博士论文给您做解答

专知会员服务

68+阅读 · 2021年7月7日

神经网络的持续终身学习综述论文

专知会员服务

44+阅读 · 2021年5月19日

【论文翻译】NLP注意力机制综述论文翻译，Attention, please! A Critical Review of Neural Attention Models in Natural Language Processing

【论文翻译】NLP注意力机制综述论文翻译，Attention, please! A Critical Review of Neural Attention Models in Natural Language Processing

专知会员服务

96+阅读 · 2020年4月18日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

GAN新书《生成式深度学习》Generative Deep Learning，附379页全文PDF

GAN新书《生成式深度学习》Generative Deep Learning，附379页全文PDF

专知

96+阅读 · 2019年9月30日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

自然语言处理中注意力机制综述

自然语言处理中注意力机制综述

黑龙江大学自然语言处理实验室

11+阅读 · 2019年2月26日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

44+阅读 · 2019年1月3日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

论文浅尝 | 基于Universal Schema与Memory Network的知识+文本问答

论文浅尝 | 基于Universal Schema与Memory Network的知识+文本问答

开放知识图谱

11+阅读 · 2018年12月16日

【学生论坛】详解记忆增强神经网络

【学生论坛】详解记忆增强神经网络

中国科学院自动化研究所

106+阅读 · 2018年11月15日

论文浅尝 | 嵌入常识知识的注意力 LSTM 模型用于特定目标的基于侧面的情感分析

论文浅尝 | 嵌入常识知识的注意力 LSTM 模型用于特定目标的基于侧面的情感分析

开放知识图谱

28+阅读 · 2018年6月11日

【深度学习Attention详解】记忆力与注意力机制讲义，复旦邱锡鹏老师《神经网络与深度学习》教程系列分享04（附pdf下载）

【深度学习Attention详解】记忆力与注意力机制讲义，复旦邱锡鹏老师《神经网络与深度学习》教程系列分享04（附pdf下载）

专知

10+阅读 · 2017年11月18日

深度学习中的注意力机制

深度学习中的注意力机制

人工智能头条

16+阅读 · 2017年11月2日

相关论文

Towards Root Memories: Benchmarking and Enhancing Implicit Logical Memory Retrieval for Personalized LLMs

Arxiv

0+阅读 · 6月22日

Defense effectiveness across architectural layers: a mechanistic evaluation of persistent memory attacks on stateful LLM agents

Arxiv

0+阅读 · 6月22日

Managing Procedural Memory in LLM Agents: Control, Adaptation, and Evaluation

Arxiv

0+阅读 · 6月22日

RaMem: Contextual Reinstatement for Long-term Agentic Memory

Arxiv

0+阅读 · 6月22日

A comparative study on power delivery aspects of compute-in/near-memory approaches using DRAM

Arxiv

0+阅读 · 6月20日

AdaMem: Learning What to Remember for Personalized Long-Horizon LLM Agents

Arxiv

0+阅读 · 6月19日

CogniFold: Always-On Proactive Memory via Cognitive Folding

Arxiv

0+阅读 · 6月17日

ActMem: Bridging the Gap Between Memory Retrieval and Reasoning in LLM Agents

Arxiv

0+阅读 · 6月17日

CoreMem: Riemannian Retrieval and Fisher-Guided Distillation for Long-Term Memory in Dialogue Agents

Arxiv

0+阅读 · 6月16日

From Untrusted Input to Trusted Memory: A Systematic Study of Memory Poisoning Attacks in LLM Agents

Arxiv

0+阅读 · 6月3日

相关基金

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

AD小鼠成年海马神经发生异常对空间参考记忆编码的影响及其机制研究

国家自然科学基金

0+阅读 · 2016年12月31日

面向人类工作记忆改善的脑电复杂网络信息反馈非线性计算模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于不完全测量信息的随机忆阻神经网络的参数与状态估计问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

一对多联想记忆中的细胞神经网络建模及参数获取方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

遗忘型轻度认知障碍患者内颞叶记忆网络动态变化研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于记忆学习与免疫系统的仿生控制研究

国家自然科学基金

7+阅读 · 2015年12月31日

学习与记忆的神经动力学研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员