Privacy Amplification by Missing Data - 专知论文

会员服务 ·

0

缺失数据 · 隐私增强 · 分析 · 差分 · 差分隐私 ·

Privacy Amplification by Missing Data

翻译：缺失数据下的隐私增强

Simon Roburin,Rafaël Pinot,Erwan Scornet

Privacy preservation is a fundamental requirement in many high-stakes domains such as medicine and finance, where sensitive personal data must be analyzed without compromising individual confidentiality. At the same time, these applications often involve datasets with missing values due to non-response, data corruption, or deliberate anonymization. Missing data is traditionally viewed as a limitation because it reduces the information available to analysts and can degrade model performance. In this work, we take an alternative perspective and study missing data from a privacy preservation standpoint. Intuitively, when features are missing, less information is revealed about individuals, suggesting that missingness could inherently enhance privacy. We formalize this intuition by analyzing missing data as a privacy amplification mechanism within the framework of differential privacy. We show, for the first time, that incomplete data can yield privacy amplification for differentially private algorithms.

翻译：隐私保护是医疗和金融等高风险领域的基本要求，这些领域必须在分析敏感个人数据时不损害个体隐私。同时，这些应用常涉及因未回应、数据损坏或刻意匿名化导致缺失值的数据集。传统上，缺失数据被视为一种限制，因为它减少了分析者可用的信息，并可能降低模型性能。在本研究中，我们采取另一种视角，从隐私保护的角度研究缺失数据。直观而言，当特征缺失时，个体信息暴露更少，这表明缺失性可能固有地增强隐私。我们通过在差分隐私框架下将缺失数据分析为一种隐私增强机制，将这一直觉形式化。我们首次证明，不完整数据能够为差分隐私算法带来隐私增强效果。

0

相关内容

缺失数据

在统计调查的过程中，由于受访者对问题的遗漏、拒绝，或是调查员与调查问卷本身存在的一些疏忽，使得记录经常会出现缺失数据 (Missing Data) 的问题。但是，几乎所有标准统计方法都假设每个个案具有可用于分析的所有变量信息，因此缺失数据就成为进行统计研究或问卷调查的工作人员所必须解决的一个问题。

【斯坦福博士论文】隐私数据实用分析，200页pdf

【斯坦福博士论文】隐私数据实用分析，200页pdf

专知会员服务

24+阅读 · 2024年7月14日

机器遗忘综述：技术与新出现的隐私风险

机器遗忘综述：技术与新出现的隐私风险

专知会员服务

24+阅读 · 2024年6月16日

【2023新书】实用数据隐私:增强数据的隐私性和安全性，599页pdf

【2023新书】实用数据隐私:增强数据的隐私性和安全性，599页pdf

专知会员服务

83+阅读 · 2023年5月1日

AI时代生物隐私如何保护？马德里自治大学最新《生物特征识别中的隐私增强技术》综述，全面详述生物隐私增强技术

AI时代生物隐私如何保护？马德里自治大学最新《生物特征识别中的隐私增强技术》综述，全面详述生物隐私增强技术

专知会员服务

21+阅读 · 2022年6月24日

【2022新书】数据隐私：工程师手册，799页pdf

【2022新书】数据隐私：工程师手册，799页pdf

专知会员服务

85+阅读 · 2022年6月20日

图数据上的隐私攻击与防御技术

图数据上的隐私攻击与防御技术

专知会员服务

28+阅读 · 2022年4月28日

【干货书】隐私保留机器学习，Privacy-Preserving Machine Learning

【干货书】隐私保留机器学习，Privacy-Preserving Machine Learning

专知会员服务

27+阅读 · 2022年4月6日

数据价值释放与隐私保护计算应用研究报告，64页pdf

数据价值释放与隐私保护计算应用研究报告，64页pdf

专知会员服务

42+阅读 · 2021年11月29日

机器学习的安全问题及隐私保护

专知会员服务

40+阅读 · 2020年12月20日

用户隐私，数据孤岛和联邦学习，香港科技大学杨强教授，第八届全国社会媒体处理大会SMP2019

用户隐私，数据孤岛和联邦学习，香港科技大学杨强教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

57+阅读 · 2019年10月24日

「联邦学习隐私保护」最新2022研究综述

「联邦学习隐私保护」最新2022研究综述

专知

16+阅读 · 2022年4月1日

联邦学习安全与隐私保护研究综述

联邦学习安全与隐私保护研究综述

专知

12+阅读 · 2020年8月7日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

缺失数据统计分析，第三版，462页pdf

缺失数据统计分析，第三版，462页pdf

专知

50+阅读 · 2020年2月28日

用于语音识别的数据增强

用于语音识别的数据增强

AI研习社

24+阅读 · 2019年6月5日

【专题】美国隐私立法进展的总体分析

【专题】美国隐私立法进展的总体分析

蚂蚁金服评论

11+阅读 · 2019年4月25日

区块链隐私保护研究综述——祝烈煌详解

区块链隐私保护研究综述——祝烈煌详解

计算机研究与发展

23+阅读 · 2018年11月28日

差分隐私保护：从入门到脱坑

差分隐私保护：从入门到脱坑

FreeBuf

17+阅读 · 2018年9月10日

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

专知

21+阅读 · 2018年5月14日

综述——隐私保护集合交集计算技术研究

综述——隐私保护集合交集计算技术研究

计算机研究与发展

22+阅读 · 2017年10月24日

移动互联网的用户隐私保护研究

国家自然科学基金

2+阅读 · 2017年12月31日

面向时空特性的社交网络推演攻击与隐私保护关键技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于负调查的云数据隐私保护关键问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

满足差分隐私的频繁模式挖掘研究

国家自然科学基金

2+阅读 · 2015年12月31日

数据流发布中的隐私保护理论和方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

移动云服务中的隐私保护与安全保障机制研究

国家自然科学基金

1+阅读 · 2014年12月31日

网络用户隐私担忧与主动性泄露隐私信息之间的悖论：理论探索和基于社交网络的实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向隐私保护的云数据访问模型与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

大规模在线社会网络社区发现及隐私保护研究

国家自然科学基金

1+阅读 · 2014年12月31日

Beyond Data Splitting: Full-Data Conformal Prediction by Differential Privacy

Arxiv

0+阅读 · 3月8日

The influence of missing data mechanisms and simple missing data handling techniques on fairness

Arxiv

0+阅读 · 2月19日

Privacy-Utility Tradeoffs in Quantum Information Processing

Arxiv

0+阅读 · 2月11日

Privacy Amplification for Synthetic data using Range Restriction

Arxiv

0+阅读 · 2月6日

Privacy utility trade offs for parameter estimation in degree heterogeneous higher order networks

Arxiv

0+阅读 · 2月3日

Privacy Amplification Persists under Unlimited Synthetic Data Release

Arxiv

0+阅读 · 2月3日

Learning from Anonymized and Incomplete Tabular Data

Arxiv

0+阅读 · 2月1日

Computing Maximal Per-Record Leakage and Leakage-Distortion Functions for Privacy Mechanisms under Entropy-Constrained Adversaries

Arxiv

0+阅读 · 1月31日

Putting Privacy to the Test: Introducing Red Teaming for Research Data Anonymization

Arxiv

0+阅读 · 1月30日

Rethinking Anonymity Claims in Synthetic Data Generation: A Model-Centric Privacy Attack Perspective

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

专知会员服务

0+阅读 · 今天15:55

GNN跨域综述：从消息传递到图基础模型

GNN跨域综述：从消息传递到图基础模型

专知会员服务

0+阅读 · 今天15:53

无人机自主控制与人工智能：系统性综述

无人机自主控制与人工智能：系统性综述

专知会员服务

11+阅读 · 今天7:25

巡飞弹与反无人机系统——现代战场的两大支柱

巡飞弹与反无人机系统——现代战场的两大支柱

专知会员服务

3+阅读 · 今天6:54

《打造“黄金舰队”》57页报告

《打造“黄金舰队”》57页报告

专知会员服务

3+阅读 · 今天6:52

《北约数字教官网络发展路径》128页报告

《北约数字教官网络发展路径》128页报告

专知会员服务

2+阅读 · 今天6:33

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

7+阅读 · 6月25日

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

6+阅读 · 6月25日

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

10+阅读 · 6月25日

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

8+阅读 · 6月25日

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

8+阅读 · 6月25日

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

8+阅读 · 6月25日

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

专知会员服务

10+阅读 · 6月25日

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

专知会员服务

9+阅读 · 6月25日

《国防领域敏感性分析白皮书》

《国防领域敏感性分析白皮书》

专知会员服务

9+阅读 · 6月25日

相关VIP内容

【斯坦福博士论文】隐私数据实用分析，200页pdf

【斯坦福博士论文】隐私数据实用分析，200页pdf

专知会员服务

24+阅读 · 2024年7月14日

机器遗忘综述：技术与新出现的隐私风险

机器遗忘综述：技术与新出现的隐私风险

专知会员服务

24+阅读 · 2024年6月16日

【2023新书】实用数据隐私:增强数据的隐私性和安全性，599页pdf

【2023新书】实用数据隐私:增强数据的隐私性和安全性，599页pdf

专知会员服务

83+阅读 · 2023年5月1日

AI时代生物隐私如何保护？马德里自治大学最新《生物特征识别中的隐私增强技术》综述，全面详述生物隐私增强技术

AI时代生物隐私如何保护？马德里自治大学最新《生物特征识别中的隐私增强技术》综述，全面详述生物隐私增强技术

专知会员服务

21+阅读 · 2022年6月24日

【2022新书】数据隐私：工程师手册，799页pdf

【2022新书】数据隐私：工程师手册，799页pdf

专知会员服务

85+阅读 · 2022年6月20日

图数据上的隐私攻击与防御技术

图数据上的隐私攻击与防御技术

专知会员服务

28+阅读 · 2022年4月28日

【干货书】隐私保留机器学习，Privacy-Preserving Machine Learning

【干货书】隐私保留机器学习，Privacy-Preserving Machine Learning

专知会员服务

27+阅读 · 2022年4月6日

数据价值释放与隐私保护计算应用研究报告，64页pdf

数据价值释放与隐私保护计算应用研究报告，64页pdf

专知会员服务

42+阅读 · 2021年11月29日

机器学习的安全问题及隐私保护

专知会员服务

40+阅读 · 2020年12月20日

用户隐私，数据孤岛和联邦学习，香港科技大学杨强教授，第八届全国社会媒体处理大会SMP2019

用户隐私，数据孤岛和联邦学习，香港科技大学杨强教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

57+阅读 · 2019年10月24日

热门VIP内容

开通专知VIP会员享更多权益服务

GNN跨域综述：从消息传递到图基础模型

巡飞弹与反无人机系统——现代战场的两大支柱

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

无人机自主控制与人工智能：系统性综述

相关资讯

「联邦学习隐私保护」最新2022研究综述

「联邦学习隐私保护」最新2022研究综述

专知

16+阅读 · 2022年4月1日

联邦学习安全与隐私保护研究综述

联邦学习安全与隐私保护研究综述

专知

12+阅读 · 2020年8月7日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

缺失数据统计分析，第三版，462页pdf

缺失数据统计分析，第三版，462页pdf

专知

50+阅读 · 2020年2月28日

用于语音识别的数据增强

用于语音识别的数据增强

AI研习社

24+阅读 · 2019年6月5日

【专题】美国隐私立法进展的总体分析

【专题】美国隐私立法进展的总体分析

蚂蚁金服评论

11+阅读 · 2019年4月25日

区块链隐私保护研究综述——祝烈煌详解

区块链隐私保护研究综述——祝烈煌详解

计算机研究与发展

23+阅读 · 2018年11月28日

差分隐私保护：从入门到脱坑

差分隐私保护：从入门到脱坑

FreeBuf

17+阅读 · 2018年9月10日

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

专知

21+阅读 · 2018年5月14日

综述——隐私保护集合交集计算技术研究

综述——隐私保护集合交集计算技术研究

计算机研究与发展

22+阅读 · 2017年10月24日

相关论文

Beyond Data Splitting: Full-Data Conformal Prediction by Differential Privacy

Arxiv

0+阅读 · 3月8日

The influence of missing data mechanisms and simple missing data handling techniques on fairness

Arxiv

0+阅读 · 2月19日

Privacy-Utility Tradeoffs in Quantum Information Processing

Arxiv

0+阅读 · 2月11日

Privacy Amplification for Synthetic data using Range Restriction

Arxiv

0+阅读 · 2月6日

Privacy utility trade offs for parameter estimation in degree heterogeneous higher order networks

Arxiv

0+阅读 · 2月3日

Privacy Amplification Persists under Unlimited Synthetic Data Release

Arxiv

0+阅读 · 2月3日

Learning from Anonymized and Incomplete Tabular Data

Arxiv

0+阅读 · 2月1日

Computing Maximal Per-Record Leakage and Leakage-Distortion Functions for Privacy Mechanisms under Entropy-Constrained Adversaries

Arxiv

0+阅读 · 1月31日

Putting Privacy to the Test: Introducing Red Teaming for Research Data Anonymization

Arxiv

0+阅读 · 1月30日

Rethinking Anonymity Claims in Synthetic Data Generation: A Model-Centric Privacy Attack Perspective

Arxiv

0+阅读 · 1月30日

相关基金

移动互联网的用户隐私保护研究

国家自然科学基金

2+阅读 · 2017年12月31日

面向时空特性的社交网络推演攻击与隐私保护关键技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于负调查的云数据隐私保护关键问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

满足差分隐私的频繁模式挖掘研究

国家自然科学基金

2+阅读 · 2015年12月31日

数据流发布中的隐私保护理论和方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

移动云服务中的隐私保护与安全保障机制研究

国家自然科学基金

1+阅读 · 2014年12月31日

网络用户隐私担忧与主动性泄露隐私信息之间的悖论：理论探索和基于社交网络的实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向隐私保护的云数据访问模型与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

大规模在线社会网络社区发现及隐私保护研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员