Large language models (LLMs) are becoming widely deployed as personal AI assistants with access to sensitive user data, making privacy a major challenge for their design and evaluation. Prior work focuses mainly on individual-level risks, overlooking \textbf{interdependent privacy (IDP)}--where one person's data may be revealed by others without their knowledge or consent. We address this gap by introducing \textbf{IDP-Bench}: the first LLM benchmark for IDP scenarios, grounded in the Contextual Integrity (CI) framework. We evaluate eight open-source LLMs on their understanding of IDP scenarios across three levels of IDP reasoning using two LLM judges. Results show strong co-ownership recognition (6/8 models exceed 90\%) but persistent weaknesses in identifying CI parameters (information attribute, primary subject) and IDP-specific parameters such as secondary subjects, where 7/8 models score below 74\%. Models also struggle to judge sharing appropriateness (5/8 scoring below 77\%). While the ability to judge the appropriateness of sharing improves with scale, performance tends to decline in smaller models, and prompt sensitivity remains high on IDP-specific questions--highlighting the need for more targeted study of IDP in LLM privacy research. Data \& code available \href{https://github.com/tisl-lab/Interdependent_Privacy_Bench}{here}.


翻译:大语言模型正被广泛部署为个人AI助手,能够访问敏感用户数据,这使得隐私保护成为其设计与评估中的重大挑战。先前的研究主要关注个体层面风险,忽视了**相互依赖隐私(IDP)**——即一个人的数据可能在他人不知情或未同意的情况下被披露。我们通过引入**IDP-Bench**填补了这一空白:这是首个针对IDP场景的大语言模型基准测试,基于情境完整性(CI)框架构建。我们使用两种大语言模型评估器,对八个开源大语言模型在三个IDP推理层级上的理解能力进行了评估。结果显示,模型在共同所有权识别方面表现强劲(6/8模型超过90%),但在识别CI参数(信息属性、主要主体)及IDP特定参数(如次要主体)方面存在持续弱点——其中7/8模型的得分低于74%。模型在判断共享适当性方面也存在困难(5/8模型得分低于77%)。虽然判断共享适当性的能力随模型规模增大而提升,但较小模型的性能普遍下降,且在对IDP特定问题的提示敏感性仍较高——这凸显了在大语言模型隐私研究中需对IDP进行更有针对性研究的必要性。数据与代码见\href{https://github.com/tisl-lab/Interdependent_Privacy_Bench}{此处}。

0
下载
关闭预览

相关内容

综述:面向移动端大语言模型的隐私与安全
专知会员服务
19+阅读 · 2025年9月7日
【新书】大规模语言模型的隐私与安全,
专知会员服务
29+阅读 · 2024年12月4日
大语言模型中的提示隐私保护
专知会员服务
24+阅读 · 2024年7月24日
大语言模型评估技术研究进展
专知会员服务
49+阅读 · 2024年7月9日
RecInterpreter:架起大语言模型与传统推荐模型的桥梁
专知会员服务
54+阅读 · 2023年11月9日
【ICML2021-Tutorial】机器学习隐私,90页ppt
专知会员服务
38+阅读 · 2021年7月27日
「联邦学习隐私保护 」最新2022研究综述
专知
16+阅读 · 2022年4月1日
《人工智能安全测评白皮书》,99页pdf
专知
36+阅读 · 2022年2月26日
联邦学习安全与隐私保护研究综述
专知
12+阅读 · 2020年8月7日
I2P - 适用于黑客的Android应用程序
黑白之道
38+阅读 · 2019年3月6日
NLP-Progress记录NLP最新数据集、论文和代码: 助你紧跟NLP前沿
中国人工智能学会
12+阅读 · 2018年11月15日
综述——隐私保护集合交集计算技术研究
计算机研究与发展
22+阅读 · 2017年10月24日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
7+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
8+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
6+阅读 · 6月17日
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员