What Your Posts Reveal: A Benchmark and Agentic Framework for User-Level Privacy Leakage on Social Media - 专知论文

会员服务 ·

0

Agent · 推断 · INFORMS · 多峰值 · binary ·

What Your Posts Reveal: A Benchmark and Agentic Framework for User-Level Privacy Leakage on Social Media

翻译：什么帖子暴露了你：社交媒体用户级隐私泄露的基准与智能体框架

Zifan Peng,Yini Huang,Aiwen Lu,Qiming Ye,Peixian Zhang,Jingyi Zheng,Yule Liu,Xuechao Wang,Xinlei He,Jiaheng Wei

Public social media posts can reveal private information through weak cues scattered across text, images, or metadata. Such leakage is often cumulative and cross-post: cues that appear harmless in isolation may jointly expose a user's home, workplace, or routine. However, current research lacks a unified benchmark for user-level multimodal privacy leakage and an evaluation metric that captures exposure severity beyond binary accuracy. To address these gaps, we propose SopriBench, a synthetic benchmark guided by leakage patterns abstracted from a private reference corpus of Rednote and Instagram accounts, covering 50 user profiles and 1,569 images with attributes, contextual sensitivity, granularity, leakage type, inference difficulty, and supporting evidence. We further introduce the Privacy Exposure Score (PES), which weights value granularity by contextual sensitivity. Inspired by abductive reasoning, we introduce Argus, a training-free agentic framework for cumulative leakage inference. Argus forms hypotheses from accumulated evidence, verifies supporting evidence, and aggregates cross-post cues into privacy profiles, achieving 0.55 PES, a 25% improvement over the strongest baseline, with the largest gain on cross-post leakage.

翻译：公开的社交媒体帖子可能通过散布在文本、图像或元数据中的微弱线索泄露隐私信息。此类泄露通常具有累积性和跨帖子性：单独看似无害的线索联合起来可能暴露用户的住所、工作地点或日常行程。然而，当前研究缺乏针对用户级多模态隐私泄露的统一基准，以及能超越二元准确率、量化泄露严重程度的评估指标。为填补这些空白，我们提出SopriBench——一个基于从Rednote和Instagram账户私密参考语料库中抽象出的泄露模式构建的合成基准，涵盖50个用户画像和1,569张图像，包含属性、上下文敏感性、粒度、泄露类型、推理难度及支撑证据等维度。我们进一步引入隐私暴露分数（PES），该指标通过上下文敏感性对价值粒度进行加权。受溯因推理启发，我们提出Argus——一个无需训练的累积性泄露推理智能体框架。Argus从累积证据中形成假设，验证支撑证据，并将跨帖子线索聚合为隐私画像，最终达到0.55的PES，相较于最强基线提升25%，其中跨帖子泄露的增益最为显著。

0

相关内容

Agent

差分隐私全指南：从理论基础到用户期望

差分隐私全指南：从理论基础到用户期望

专知会员服务

13+阅读 · 2025年9月8日

【KDD2024】揭示隐私漏洞:调查图数据中结构的作用

【KDD2024】揭示隐私漏洞:调查图数据中结构的作用

专知会员服务

11+阅读 · 2024年8月13日

【斯坦福博士论文】有效的差分隐私深度学习，153页pdf

【斯坦福博士论文】有效的差分隐私深度学习，153页pdf

专知会员服务

19+阅读 · 2024年7月10日

《匿名保密通信框架：基于区块链的概念验证》美海军2022最新154页论文

《匿名保密通信框架：基于区块链的概念验证》美海军2022最新154页论文

专知会员服务

23+阅读 · 2022年12月21日

图数据上的隐私攻击与防御技术

图数据上的隐私攻击与防御技术

专知会员服务

28+阅读 · 2022年4月28日

【AI+军事】附论文《在半自动开源网络情报分析中跟踪网络威胁行为者》

【AI+军事】附论文《在半自动开源网络情报分析中跟踪网络威胁行为者》

专知会员服务

28+阅读 · 2022年4月26日

【开放书】隐私的现代社会技术视角，459页pdf，Modern Socio-Technical Perspectives on Privacy

【开放书】隐私的现代社会技术视角，459页pdf，Modern Socio-Technical Perspectives on Privacy

专知会员服务

21+阅读 · 2022年3月24日

【ICML2021】基于卷积神经网络的隐私保护视频分类

专知会员服务

12+阅读 · 2021年9月10日

UCL最新「机器学习隐私」综述论文，概述隐私挑战

UCL最新「机器学习隐私」综述论文，概述隐私挑战

专知会员服务

37+阅读 · 2021年7月11日

机器学习的安全问题及隐私保护

专知会员服务

41+阅读 · 2020年12月20日

《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】20余位作者2022最新126页技术报告

《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】20余位作者2022最新126页技术报告

专知

12+阅读 · 2022年10月28日

互联网上那些防不胜防的人肉搜索技巧 | 附教程和工具

互联网上那些防不胜防的人肉搜索技巧 | 附教程和工具

黑白之道

126+阅读 · 2019年10月22日

【专题】美国隐私立法进展的总体分析

【专题】美国隐私立法进展的总体分析

蚂蚁金服评论

11+阅读 · 2019年4月25日

I2P - 适用于黑客的Android应用程序

I2P - 适用于黑客的Android应用程序

黑白之道

38+阅读 · 2019年3月6日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

区块链隐私保护研究综述——祝烈煌详解

区块链隐私保护研究综述——祝烈煌详解

计算机研究与发展

23+阅读 · 2018年11月28日

差分隐私保护：从入门到脱坑

差分隐私保护：从入门到脱坑

FreeBuf

17+阅读 · 2018年9月10日

揭秘AI识别虚假新闻背后的原理

揭秘AI识别虚假新闻背后的原理

DeepTech深科技

10+阅读 · 2018年8月5日

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

专知

21+阅读 · 2018年5月14日

综述——隐私保护集合交集计算技术研究

综述——隐私保护集合交集计算技术研究

计算机研究与发展

22+阅读 · 2017年10月24日

基于信号理论和众包的社交媒体平台安全性和可信度群体评估方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

移动互联网的用户隐私保护研究

国家自然科学基金

2+阅读 · 2017年12月31日

面向隐私保护的地理社交网络个性化推荐方法研究

国家自然科学基金

2+阅读 · 2017年12月31日

面向时空特性的社交网络推演攻击与隐私保护关键技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

满足差分隐私的频繁模式挖掘研究

国家自然科学基金

2+阅读 · 2015年12月31日

数据流发布中的隐私保护理论和方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

社交网络中的流言传播与演化

国家自然科学基金

2+阅读 · 2015年12月31日

社交网络级联数据流异常检测模型研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于差分隐私保护模型的交互式社交网络分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络用户隐私担忧与主动性泄露隐私信息之间的悖论：理论探索和基于社交网络的实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

Information Leakage Detection through Approximate Bayes-optimal Prediction

Arxiv

0+阅读 · 6月15日

FraudSMSWalker: Benchmarking Agentic Large Language Models for SMS-to-Webpage Fraud Detection

Arxiv

0+阅读 · 6月15日

AgentLeak: A Benchmark for Internal-Channel Privacy Leakage in Multi-Agent LLM Systems

Arxiv

0+阅读 · 6月15日

Privacy-Preserving Text Sanitization for Distributed Agents Collaboration via Disentangled Representations

Arxiv

0+阅读 · 6月13日

Robust Privacy: Inference-Stage Privacy through Certified Robustness

Arxiv

0+阅读 · 6月10日

Clinically Grounded Privacy Evaluation of Medical LMs

Arxiv

0+阅读 · 6月8日

Unveiling Privacy Risks in Multi-modal Large Language Models: Task-specific Vulnerabilities and Mitigation Challenges

Arxiv

0+阅读 · 6月8日

Ask Safely: Privacy-Aware LLM Query Generation for Knowledge Graphs

Arxiv

0+阅读 · 6月5日

What's on Your Mind? Exploring Privacy of Mental Health Apps

Arxiv

0+阅读 · 5月30日

What's on Your Mind? Exploring Privacy of Mental Health Apps

Arxiv

0+阅读 · 5月10日

VIP会员

文章信息

相关主题

最新内容

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

专知会员服务

1+阅读 · 今天7:13

俄乌无人机战争的六大启示

俄乌无人机战争的六大启示

专知会员服务

3+阅读 · 今天7:07

《无人机空中监控：通信实验洞察》

《无人机空中监控：通信实验洞察》

专知会员服务

2+阅读 · 今天7:05

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

专知会员服务

2+阅读 · 今天6:59

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

12+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

5+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

9+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

11+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

5+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

9+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

7+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

7+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

7+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

5+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

13+阅读 · 7月31日

相关VIP内容

差分隐私全指南：从理论基础到用户期望

差分隐私全指南：从理论基础到用户期望

专知会员服务

13+阅读 · 2025年9月8日

【KDD2024】揭示隐私漏洞:调查图数据中结构的作用

【KDD2024】揭示隐私漏洞:调查图数据中结构的作用

专知会员服务

11+阅读 · 2024年8月13日

【斯坦福博士论文】有效的差分隐私深度学习，153页pdf

【斯坦福博士论文】有效的差分隐私深度学习，153页pdf

专知会员服务

19+阅读 · 2024年7月10日

《匿名保密通信框架：基于区块链的概念验证》美海军2022最新154页论文

《匿名保密通信框架：基于区块链的概念验证》美海军2022最新154页论文

专知会员服务

23+阅读 · 2022年12月21日

图数据上的隐私攻击与防御技术

图数据上的隐私攻击与防御技术

专知会员服务

28+阅读 · 2022年4月28日

【AI+军事】附论文《在半自动开源网络情报分析中跟踪网络威胁行为者》

【AI+军事】附论文《在半自动开源网络情报分析中跟踪网络威胁行为者》

专知会员服务

28+阅读 · 2022年4月26日

【开放书】隐私的现代社会技术视角，459页pdf，Modern Socio-Technical Perspectives on Privacy

【开放书】隐私的现代社会技术视角，459页pdf，Modern Socio-Technical Perspectives on Privacy

专知会员服务

21+阅读 · 2022年3月24日

【ICML2021】基于卷积神经网络的隐私保护视频分类

专知会员服务

12+阅读 · 2021年9月10日

UCL最新「机器学习隐私」综述论文，概述隐私挑战

UCL最新「机器学习隐私」综述论文，概述隐私挑战

专知会员服务

37+阅读 · 2021年7月11日

机器学习的安全问题及隐私保护

专知会员服务

41+阅读 · 2020年12月20日

热门VIP内容

开通专知VIP会员享更多权益服务

俄乌无人机战争的六大启示

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《无人机空中监控：通信实验洞察》

相关资讯

《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】20余位作者2022最新126页技术报告

《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】20余位作者2022最新126页技术报告

专知

12+阅读 · 2022年10月28日

互联网上那些防不胜防的人肉搜索技巧 | 附教程和工具

互联网上那些防不胜防的人肉搜索技巧 | 附教程和工具

黑白之道

126+阅读 · 2019年10月22日

【专题】美国隐私立法进展的总体分析

【专题】美国隐私立法进展的总体分析

蚂蚁金服评论

11+阅读 · 2019年4月25日

I2P - 适用于黑客的Android应用程序

I2P - 适用于黑客的Android应用程序

黑白之道

38+阅读 · 2019年3月6日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

区块链隐私保护研究综述——祝烈煌详解

区块链隐私保护研究综述——祝烈煌详解

计算机研究与发展

23+阅读 · 2018年11月28日

差分隐私保护：从入门到脱坑

差分隐私保护：从入门到脱坑

FreeBuf

17+阅读 · 2018年9月10日

揭秘AI识别虚假新闻背后的原理

揭秘AI识别虚假新闻背后的原理

DeepTech深科技

10+阅读 · 2018年8月5日

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

专知

21+阅读 · 2018年5月14日

综述——隐私保护集合交集计算技术研究

综述——隐私保护集合交集计算技术研究

计算机研究与发展

22+阅读 · 2017年10月24日

相关论文

Information Leakage Detection through Approximate Bayes-optimal Prediction

Arxiv

0+阅读 · 6月15日

FraudSMSWalker: Benchmarking Agentic Large Language Models for SMS-to-Webpage Fraud Detection

Arxiv

0+阅读 · 6月15日

AgentLeak: A Benchmark for Internal-Channel Privacy Leakage in Multi-Agent LLM Systems

Arxiv

0+阅读 · 6月15日

Privacy-Preserving Text Sanitization for Distributed Agents Collaboration via Disentangled Representations

Arxiv

0+阅读 · 6月13日

Robust Privacy: Inference-Stage Privacy through Certified Robustness

Arxiv

0+阅读 · 6月10日

Clinically Grounded Privacy Evaluation of Medical LMs

Arxiv

0+阅读 · 6月8日

Unveiling Privacy Risks in Multi-modal Large Language Models: Task-specific Vulnerabilities and Mitigation Challenges

Arxiv

0+阅读 · 6月8日

Ask Safely: Privacy-Aware LLM Query Generation for Knowledge Graphs

Arxiv

0+阅读 · 6月5日

What's on Your Mind? Exploring Privacy of Mental Health Apps

Arxiv

0+阅读 · 5月30日

What's on Your Mind? Exploring Privacy of Mental Health Apps

Arxiv

0+阅读 · 5月10日

相关基金

基于信号理论和众包的社交媒体平台安全性和可信度群体评估方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

移动互联网的用户隐私保护研究

国家自然科学基金

2+阅读 · 2017年12月31日

面向隐私保护的地理社交网络个性化推荐方法研究

国家自然科学基金

2+阅读 · 2017年12月31日

面向时空特性的社交网络推演攻击与隐私保护关键技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

满足差分隐私的频繁模式挖掘研究

国家自然科学基金

2+阅读 · 2015年12月31日

数据流发布中的隐私保护理论和方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

社交网络中的流言传播与演化

国家自然科学基金

2+阅读 · 2015年12月31日

社交网络级联数据流异常检测模型研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于差分隐私保护模型的交互式社交网络分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络用户隐私担忧与主动性泄露隐私信息之间的悖论：理论探索和基于社交网络的实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员