SEAL-Tag：基于概率电路的自标记证据聚合用于PII安全的检索增强生成 (SEAL-Tag: Self-Tag Evidence Aggregation with Probabilistic Circuits for PII-Safe Retrieval-Augmented Generation) - 专知论文

会员服务 ·

0

概率 · 检索增强 · 系统 · 自适应 · 效用 ·

SEAL-Tag: Self-Tag Evidence Aggregation with Probabilistic Circuits for PII-Safe Retrieval-Augmented Generation

翻译：SEAL-Tag：基于概率电路的自标记证据聚合用于PII安全的检索增强生成

Jin Xie,Songze Li,Guang Cheng

from arxiv, 13 pages, 5 figures

Retrieval-Augmented Generation (RAG) systems introduce a critical vulnerability: contextual leakage, where adversaries exploit instruction-following to exfiltrate Personally Identifiable Information (PII) via adaptive extraction. Current defenses force a rigid trade-off between semantic utility and latency. We present SEAL-Tag, a privacy-preserving runtime environment that resolves this via a Verify-then-Route paradigm. SEAL-Tag introduces the SEAL-Probe protocol, transforming auditing into a structured tool-use operation where the model generates a verifiable PII-Evidence Table (PET) alongside its draft. To adjudicate this evidence, we employ a Probabilistic Circuit (PC) that enforces verifiable logical constraints for robust decision-making. To overcome the privacy "Cold Start" problem, we introduce the S0--S6 Anchored Synthesis Pipeline, generating high-fidelity, provenanced RAG interactions. We pair this with a Two-Stage Curriculum that first optimizes for entity detection before aligning the model to the rigorous audit protocol. Our evaluation demonstrates that SEAL-Tag establishes a new Pareto frontier, reducing adaptive leakage by over 8$\times$ while matching the utility and speed of unsafe baselines.

翻译：检索增强生成（RAG）系统引入了一个关键漏洞：上下文泄露，即攻击者利用指令跟随功能，通过自适应提取手段泄露个人可识别信息（PII）。现有防御方案迫使系统在语义效用与延迟之间做出僵化的权衡。本文提出SEAL-Tag，一种隐私保护的运行时环境，通过“先验证后路由”范式解决此问题。SEAL-Tag引入了SEAL-Probe协议，将审计转化为一种结构化的工具使用操作，使模型在生成草稿的同时，生成一个可验证的PII证据表（PET）。为裁决此证据，我们采用概率电路（PC），通过可验证的逻辑约束实现鲁棒的决策。为克服隐私“冷启动”问题，我们提出了S0--S6锚定合成流水线，用于生成高保真、可溯源的RAG交互数据。我们将其与两阶段课程学习相结合：首先优化实体检测，随后将模型与严格的审计协议对齐。评估结果表明，SEAL-Tag建立了一个新的帕累托前沿，在保持与不安全基线相当的效用和速度的同时，将自适应泄露降低了超过8倍。

0

相关内容

本话题关于日常用语「概率」，用于讨论生活中的运气、机会，及赌博、彩票、游戏中的「技巧」。关于抽象数学概念「概率」的讨论，请转概率（数学）话题。

【AAAI2026】TruthfulRAG：基于知识图谱解决检索增强生成中的事实层冲突

【AAAI2026】TruthfulRAG：基于知识图谱解决检索增强生成中的事实层冲突

专知会员服务

22+阅读 · 2025年11月15日

检索增强生成（RAG）技术，261页slides

检索增强生成（RAG）技术，261页slides

专知会员服务

42+阅读 · 2025年10月16日

检索增强生成(RAG)与推理的协同作用：一项系统综述

检索增强生成(RAG)与推理的协同作用：一项系统综述

专知会员服务

34+阅读 · 2025年4月27日

迈向可信的检索增强生成：大语言模型综述

迈向可信的检索增强生成：大语言模型综述

专知会员服务

30+阅读 · 2025年2月12日

图增强生成（GraphRAG）

图增强生成（GraphRAG）

专知会员服务

35+阅读 · 2025年1月4日

检索增强生成系统中的可信度：综述

检索增强生成系统中的可信度：综述

专知会员服务

44+阅读 · 2024年9月18日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

111+阅读 · 2023年12月19日

《用对抗样本防御基于深度学习的视频指纹攻击》美海军研究生院2022最新60页论文

《用对抗样本防御基于深度学习的视频指纹攻击》美海军研究生院2022最新60页论文

专知会员服务

27+阅读 · 2022年10月7日

【SIGIR2020-中科院】TAGNN: 基于会话推荐的目标注意力图神经网络，TAGNN: Target Attentive Graph Neural Networks for Session-based Recommendation

【SIGIR2020-中科院】TAGNN: 基于会话推荐的目标注意力图神经网络，TAGNN: Target Attentive Graph Neural Networks for Session-based Recommendation

专知会员服务

42+阅读 · 2020年5月10日

【ECML-PKDD 2019】从AIS数据中发现隐藏的概念:一种用于异常检测的海上交通网络抽象（Uncovering hidden concepts from AIS data: A network abstraction of maritime traffic for anomaly detection）

【ECML-PKDD 2019】从AIS数据中发现隐藏的概念:一种用于异常检测的海上交通网络抽象（Uncovering hidden concepts from AIS data: A network abstraction of maritime traffic for anomaly detection）

专知会员服务

22+阅读 · 2019年9月16日

Link prediction | 三篇SEAL相关工作小结

Link prediction | 三篇SEAL相关工作小结

AINLP

48+阅读 · 2020年11月17日

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

专知

46+阅读 · 2020年7月5日

Xsser 一款自动检测XSS漏洞工具

Xsser 一款自动检测XSS漏洞工具

黑白之道

14+阅读 · 2019年8月26日

搭建自己的searx搜索引擎

搭建自己的searx搜索引擎

黑白之道

13+阅读 · 2019年5月31日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

NetworkMiner - 网络取证分析工具

NetworkMiner - 网络取证分析工具

黑白之道

16+阅读 · 2018年6月29日

【论文推荐】最新6篇目标检测相关论文—场景文本检测、显著对象、语义知识转移、混合监督目标检测、域自适应、车牌识别

【论文推荐】最新6篇目标检测相关论文—场景文本检测、显著对象、语义知识转移、混合监督目标检测、域自适应、车牌识别

专知

19+阅读 · 2018年3月16日

【论文推荐】最新六篇生成式对抗网络（GAN）相关论文—半监督学习、对偶、交互生成对抗网络、激活、纳什均衡、tempoGAN

【论文推荐】最新六篇生成式对抗网络（GAN）相关论文—半监督学习、对偶、交互生成对抗网络、激活、纳什均衡、tempoGAN

专知

23+阅读 · 2018年2月23日

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

专知

10+阅读 · 2018年2月1日

对抗样本再下一城，攻陷目标检测！自动驾驶或受攻击？UIUC学者构建欺骗检测器的对抗样本！

对抗样本再下一城，攻陷目标检测！自动驾驶或受攻击？UIUC学者构建欺骗检测器的对抗样本！

专知

29+阅读 · 2017年12月12日

面向时空特性的社交网络推演攻击与隐私保护关键技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

复杂系统中多密码算法密钥协同安全研究

国家自然科学基金

0+阅读 · 2015年12月31日

多标记文本数据流分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于浮标网络的海上溢油污染跟踪方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

车载网中具有隐私保护功能的车辆声明聚合协议的研究

国家自然科学基金

0+阅读 · 2015年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于多源证据的繁忙水域交管雷达异常目标识别方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

自检测型量子密钥分配研究

国家自然科学基金

0+阅读 · 2014年12月31日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

$p^2$RAG: Privacy-Preserving RAG Service Supporting Arbitrary Top-$k$ Retrieval

Arxiv

0+阅读 · 3月16日

RESCUE: Retrieval Augmented Secure Code Generation

Arxiv

0+阅读 · 3月16日

AgenticOCR: Parsing Only What You Need for Efficient Retrieval-Augmented Generation

Arxiv

0+阅读 · 2月27日

Resisting Contextual Interference in RAG via Parametric-Knowledge Reinforcement

Arxiv

0+阅读 · 2月25日

PII-Bench: Evaluating Query-Aware Privacy Protection Systems

Arxiv

0+阅读 · 2月17日

Differentially Private Retrieval-Augmented Generation

Arxiv

0+阅读 · 2月16日

ReliabilityRAG: Effective and Provably Robust Defense for RAG-based Web-Search

Arxiv

0+阅读 · 2月15日

Toward Faithful Retrieval-Augmented Generation with Sparse Autoencoders

Arxiv

0+阅读 · 2月11日

Benchmarking Knowledge-Extraction Attack and Defense on Retrieval-Augmented Generation

Arxiv

0+阅读 · 2月10日

IGMiRAG: Intuition-Guided Retrieval-Augmented Generation with Adaptive Mining of In-Depth Memory

Arxiv

0+阅读 · 2月7日

VIP会员

文章信息

相关主题

最新内容

【牛津博士论文】以语言为接口的医学影像表示学习

【牛津博士论文】以语言为接口的医学影像表示学习

专知会员服务

0+阅读 · 50分钟前

基于大语言模型的医疗推理研究：综述与 MR-Bench 基准测试

基于大语言模型的医疗推理研究：综述与 MR-Bench 基准测试

专知会员服务

0+阅读 · 52分钟前

从原型到实战：扩展美陆军下一代指挥控制能力（试验进展）

从原型到实战：扩展美陆军下一代指挥控制能力（试验进展）

专知会员服务

1+阅读 · 今天15:10

技术、多域威慑与海上战争（报告）

技术、多域威慑与海上战争（报告）

专知会员服务

2+阅读 · 今天15:04

随机网络效用最大化在战略排队系统中的博弈论方法

随机网络效用最大化在战略排队系统中的博弈论方法

专知会员服务

1+阅读 · 今天14:56

“在云端防御”：提升北约数据韧性（报告）

“在云端防御”：提升北约数据韧性（报告）

专知会员服务

1+阅读 · 今天14:54

从炒作到现实：人工智能在军事应用中的实战经验与建议（综述）

从炒作到现实：人工智能在军事应用中的实战经验与建议（综述）

专知会员服务

1+阅读 · 今天14:49

2026年伊朗战争对美国通胀的影响：情景分析（报告）

2026年伊朗战争对美国通胀的影响：情景分析（报告）

专知会员服务

0+阅读 · 今天14:47

人工智能及其在海军行动中的整合（综述）

人工智能及其在海军行动中的整合（综述）

专知会员服务

1+阅读 · 今天14:07

美以伊冲突：无人机主导的第三次海湾战争反防空作战

美以伊冲突：无人机主导的第三次海湾战争反防空作战

专知会员服务

0+阅读 · 今天13:56

多模态XR-AI训练系统提升联合作战中的沟通技能（中文万字长文）

多模态XR-AI训练系统提升联合作战中的沟通技能（中文万字长文）

专知会员服务

2+阅读 · 今天13:40

美军MAVEN项目全面解析：算法战架构

美军MAVEN项目全面解析：算法战架构

专知会员服务

16+阅读 · 今天8:36

从俄乌战场看“马赛克战”（万字长文）

从俄乌战场看“马赛克战”（万字长文）

专知会员服务

10+阅读 · 今天8:19

人工智能与机器人自主系统等新兴技术革命将如何影响地面作战的指挥控制？

人工智能与机器人自主系统等新兴技术革命将如何影响地面作战的指挥控制？

专知会员服务

10+阅读 · 4月12日

弹性指挥控制：北约、伊朗与俄罗斯指挥控制架构的比较分析

弹性指挥控制：北约、伊朗与俄罗斯指挥控制架构的比较分析

专知会员服务

9+阅读 · 4月12日

相关VIP内容

【AAAI2026】TruthfulRAG：基于知识图谱解决检索增强生成中的事实层冲突

【AAAI2026】TruthfulRAG：基于知识图谱解决检索增强生成中的事实层冲突

专知会员服务

22+阅读 · 2025年11月15日

检索增强生成（RAG）技术，261页slides

检索增强生成（RAG）技术，261页slides

专知会员服务

42+阅读 · 2025年10月16日

检索增强生成(RAG)与推理的协同作用：一项系统综述

检索增强生成(RAG)与推理的协同作用：一项系统综述

专知会员服务

34+阅读 · 2025年4月27日

迈向可信的检索增强生成：大语言模型综述

迈向可信的检索增强生成：大语言模型综述

专知会员服务

30+阅读 · 2025年2月12日

图增强生成（GraphRAG）

图增强生成（GraphRAG）

专知会员服务

35+阅读 · 2025年1月4日

检索增强生成系统中的可信度：综述

检索增强生成系统中的可信度：综述

专知会员服务

44+阅读 · 2024年9月18日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

111+阅读 · 2023年12月19日

《用对抗样本防御基于深度学习的视频指纹攻击》美海军研究生院2022最新60页论文

《用对抗样本防御基于深度学习的视频指纹攻击》美海军研究生院2022最新60页论文

专知会员服务

27+阅读 · 2022年10月7日

【SIGIR2020-中科院】TAGNN: 基于会话推荐的目标注意力图神经网络，TAGNN: Target Attentive Graph Neural Networks for Session-based Recommendation

【SIGIR2020-中科院】TAGNN: 基于会话推荐的目标注意力图神经网络，TAGNN: Target Attentive Graph Neural Networks for Session-based Recommendation

专知会员服务

42+阅读 · 2020年5月10日

【ECML-PKDD 2019】从AIS数据中发现隐藏的概念:一种用于异常检测的海上交通网络抽象（Uncovering hidden concepts from AIS data: A network abstraction of maritime traffic for anomaly detection）

【ECML-PKDD 2019】从AIS数据中发现隐藏的概念:一种用于异常检测的海上交通网络抽象（Uncovering hidden concepts from AIS data: A network abstraction of maritime traffic for anomaly detection）

专知会员服务

22+阅读 · 2019年9月16日

热门VIP内容

开通专知VIP会员享更多权益服务

基于大语言模型的医疗推理研究：综述与 MR-Bench 基准测试

技术、多域威慑与海上战争（报告）

【牛津博士论文】以语言为接口的医学影像表示学习

从原型到实战：扩展美陆军下一代指挥控制能力（试验进展）

相关资讯

Link prediction | 三篇SEAL相关工作小结

Link prediction | 三篇SEAL相关工作小结

AINLP

48+阅读 · 2020年11月17日

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

【ICML2020-南大周志华老师组】针对未见类未标记数据的安全深度半监督学习

专知

46+阅读 · 2020年7月5日

Xsser 一款自动检测XSS漏洞工具

Xsser 一款自动检测XSS漏洞工具

黑白之道

14+阅读 · 2019年8月26日

搭建自己的searx搜索引擎

搭建自己的searx搜索引擎

黑白之道

13+阅读 · 2019年5月31日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

NetworkMiner - 网络取证分析工具

NetworkMiner - 网络取证分析工具

黑白之道

16+阅读 · 2018年6月29日

【论文推荐】最新6篇目标检测相关论文—场景文本检测、显著对象、语义知识转移、混合监督目标检测、域自适应、车牌识别

【论文推荐】最新6篇目标检测相关论文—场景文本检测、显著对象、语义知识转移、混合监督目标检测、域自适应、车牌识别

专知

19+阅读 · 2018年3月16日

【论文推荐】最新六篇生成式对抗网络（GAN）相关论文—半监督学习、对偶、交互生成对抗网络、激活、纳什均衡、tempoGAN

【论文推荐】最新六篇生成式对抗网络（GAN）相关论文—半监督学习、对偶、交互生成对抗网络、激活、纳什均衡、tempoGAN

专知

23+阅读 · 2018年2月23日

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

【论文推荐】最新6篇生成式对抗网络（GAN）相关论文—半监督对抗学习、行人再识别、代表性特征、高分辨率深度卷积、自监督、超分辨

专知

10+阅读 · 2018年2月1日

对抗样本再下一城，攻陷目标检测！自动驾驶或受攻击？UIUC学者构建欺骗检测器的对抗样本！

对抗样本再下一城，攻陷目标检测！自动驾驶或受攻击？UIUC学者构建欺骗检测器的对抗样本！

专知

29+阅读 · 2017年12月12日

相关论文

$p^2$RAG: Privacy-Preserving RAG Service Supporting Arbitrary Top-$k$ Retrieval

Arxiv

0+阅读 · 3月16日

RESCUE: Retrieval Augmented Secure Code Generation

Arxiv

0+阅读 · 3月16日

AgenticOCR: Parsing Only What You Need for Efficient Retrieval-Augmented Generation

Arxiv

0+阅读 · 2月27日

Resisting Contextual Interference in RAG via Parametric-Knowledge Reinforcement

Arxiv

0+阅读 · 2月25日

PII-Bench: Evaluating Query-Aware Privacy Protection Systems

Arxiv

0+阅读 · 2月17日

Differentially Private Retrieval-Augmented Generation

Arxiv

0+阅读 · 2月16日

ReliabilityRAG: Effective and Provably Robust Defense for RAG-based Web-Search

Arxiv

0+阅读 · 2月15日

Toward Faithful Retrieval-Augmented Generation with Sparse Autoencoders

Arxiv

0+阅读 · 2月11日

Benchmarking Knowledge-Extraction Attack and Defense on Retrieval-Augmented Generation

Arxiv

0+阅读 · 2月10日

IGMiRAG: Intuition-Guided Retrieval-Augmented Generation with Adaptive Mining of In-Depth Memory

Arxiv

0+阅读 · 2月7日

相关基金

面向时空特性的社交网络推演攻击与隐私保护关键技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

复杂系统中多密码算法密钥协同安全研究

国家自然科学基金

0+阅读 · 2015年12月31日

多标记文本数据流分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于浮标网络的海上溢油污染跟踪方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

车载网中具有隐私保护功能的车辆声明聚合协议的研究

国家自然科学基金

0+阅读 · 2015年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于多源证据的繁忙水域交管雷达异常目标识别方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

自检测型量子密钥分配研究

国家自然科学基金

0+阅读 · 2014年12月31日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员