Privacy leakage in LLM agents is often studied through individual storage or execution components, such as memory modules, retrieval pipelines, or tool-mediated artifacts. However, these settings are typically analyzed in isolation, making it difficult to compare how private internal dependence becomes externally recoverable across heterogeneous agent pipelines. In this paper, we present CIPL (Channel Inversion for Privacy Leakage) as a unified channel-oriented measurement interface for evaluating privacy leakage in LLM agent pipelines. Rather than claiming a universally strongest attack recipe, CIPL provides a shared way to represent a target through its sensitive source, selection, assembly, execution, observation, and extraction stages, and to measure how internal exposure is transformed into attacker-recoverable leakage under a common protocol. Using memory-based, retrieval-mediated, and tool-mediated instantiations under this shared interface, we identify a distinct cross-target risk picture. Memory behaves as a near-saturated high-risk special case, while beyond-memory leakage exhibits a different regime: retrieval-mediated targets show frequent but often incomplete leakage, and tool-mediated targets are strongly shaped by the exposed observation surface and provider behavior. We further show that leakage is governed by channel conditions rather than by a universally dominant recipe: cleaned weak controls sharply suppress leakage, and semantic annotation reveals attacker-useful leakage beyond exact-match extraction. Together, these findings suggest that privacy risk in LLM agent pipelines is better understood through \emph{observable channels}, not just storage components. More broadly, our results motivate channel-oriented privacy evaluation as a necessary complement to component-local or exact-only analyses.


翻译:大语言模型代理中的隐私泄露通常通过个体存储或执行组件(例如记忆模块、检索流水线或工具中介产物)进行研究。然而,这些设置通常被孤立分析,使得难以比较不同异构代理流水线中私有内部依赖关系如何外部可恢复。本文提出CIPL(面向隐私泄露的信道逆映射)作为统一的面向信道的测量接口,用于评估大语言模型代理流水线中的隐私泄露。CIPL并非声称存在普遍最强的攻击配方,而是提供一种共享方式,通过目标实体的敏感源、选取、组装、执行、观测与提取阶段来表征该目标,并在统一协议下衡量内部暴露如何转化为攻击者可恢复的泄露信息。通过在该共享接口下实现基于记忆、检索中介和工具中介的实例化,我们识别出独特的跨目标风险图景。记忆表现为近乎饱和的高风险特例,而超记忆泄露则呈现不同形态:检索中介目标表现出频繁但常不完整的泄露,工具中介目标则受暴露观测表面及提供者行为的强烈塑造。我们进一步证明,泄露受信道条件而非普遍主导配方控制:经过清洗的弱控制可显著抑制泄露,语义标注揭示了超越精确匹配提取的攻击者有用泄露。综合来看,这些发现表明,大语言模型代理流水线中的隐私风险应通过可观测信道而非仅仅存储组件来更好理解。更广泛而言,我们的结果激励将面向信道的隐私评估作为组件局部或仅精确性分析的必要补充。

0
下载
关闭预览

相关内容

综述:面向移动端大语言模型的隐私与安全
专知会员服务
19+阅读 · 2025年9月7日
【新书】大规模语言模型的隐私与安全,
专知会员服务
29+阅读 · 2024年12月4日
大型语言模型代理的安全与隐私综述
专知会员服务
30+阅读 · 2024年8月5日
大语言模型中的提示隐私保护
专知会员服务
24+阅读 · 2024年7月24日
使用 Canal 实现数据异构
性能与架构
20+阅读 · 2019年3月4日
差分隐私保护:从入门到脱坑
FreeBuf
17+阅读 · 2018年9月10日
用模型不确定性理解模型
论智
11+阅读 · 2018年9月5日
NetworkMiner - 网络取证分析工具
黑白之道
16+阅读 · 2018年6月29日
综述——隐私保护集合交集计算技术研究
计算机研究与发展
22+阅读 · 2017年10月24日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
最新内容
美国从乌克兰无人机战争中学习经验
专知会员服务
6+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
2+阅读 · 6月21日
学习数据的几何:形状空间分析数学综述
专知会员服务
9+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
11+阅读 · 6月17日
相关资讯
使用 Canal 实现数据异构
性能与架构
20+阅读 · 2019年3月4日
差分隐私保护:从入门到脱坑
FreeBuf
17+阅读 · 2018年9月10日
用模型不确定性理解模型
论智
11+阅读 · 2018年9月5日
NetworkMiner - 网络取证分析工具
黑白之道
16+阅读 · 2018年6月29日
综述——隐私保护集合交集计算技术研究
计算机研究与发展
22+阅读 · 2017年10月24日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员