The Adverse Effects of Omitting Records in Differential Privacy: How Sampling and Suppression Degrade the Privacy--Utility Tradeoff (Long Version) - 专知论文

会员服务 ·

0

效用 · 差分 · 差分隐私 · 噪声 · 预处理 ·

The Adverse Effects of Omitting Records in Differential Privacy: How Sampling and Suppression Degrade the Privacy--Utility Tradeoff (Long Version)

翻译：差分隐私中省略记录的不利影响：采样与抑制如何降低隐私-效用权衡（完整版）

Àlex Miranda-Pascual,Javier Parra-Arnau,Thorsten Strufe

from arxiv, Long version of the paper accepted at USENIX Security '26

Sampling is renowned for its privacy amplification in differential privacy (DP), and is often assumed to improve the utility of a DP mechanism by allowing a noise reduction. In this paper, we further show that this last assumption is flawed: When measuring utility at equal privacy levels, sampling as preprocessing consistently yields penalties due to utility loss from omitting records over all canonical DP mechanisms -- Laplace, Gaussian, exponential, and report noisy max -- , as well as recent applications of sampling, such as clustering. Extending this analysis, we investigate suppression as a generalized method of choosing, or omitting, records. Developing a theoretical analysis of this technique, we derive privacy bounds for arbitrary suppression strategies under unbounded approximate DP. We find that our tested suppression strategy also fails to improve the privacy--utility tradeoff. Surprisingly, uniform sampling emerges as one of the best suppression methods -- despite its still degrading effect. Our results call into question common preprocessing assumptions in DP practice.

翻译：采样在差分隐私（DP）中以其隐私放大效应而著称，并且通常被认为能够通过降低噪声来改善DP机制的效用。本文进一步指出后一假设存在缺陷：在相同隐私水平下衡量效用时，作为预处理步骤的采样在所有经典DP机制（拉普拉斯、高斯、指数机制及报告噪声最大值机制）以及采样的最新应用（如聚类）中，均会因记录省略导致效用损失而产生负面效应。扩展此分析，我们将抑制视为选择或省略记录的广义方法。通过建立该技术的理论分析框架，我们推导了无界近似差分隐私下任意抑制策略的隐私界限。研究发现，我们测试的抑制策略同样未能改善隐私-效用权衡。值得注意的是，均匀采样成为最优抑制方法之一——尽管其仍存在效用降低效应。我们的研究结果对DP实践中常见的预处理假设提出了质疑。

0

相关内容

差分隐私全指南：从理论基础到用户期望

差分隐私全指南：从理论基础到用户期望

专知会员服务

13+阅读 · 2025年9月8日

【新书】差分隐私，246页pdf

【新书】差分隐私，246页pdf

专知会员服务

27+阅读 · 2025年4月5日

【普林斯顿博士论文】在差分隐私机器学习中有效地从数据中学习并生成数据，189页pdf

【普林斯顿博士论文】在差分隐私机器学习中有效地从数据中学习并生成数据，189页pdf

专知会员服务

20+阅读 · 2024年10月18日

【普林斯顿博士论文】在差分隐私机器学习中有效地从数据中学习和生成数据

【普林斯顿博士论文】在差分隐私机器学习中有效地从数据中学习和生成数据

专知会员服务

16+阅读 · 2024年10月7日

【斯坦福博士论文】隐私数据实用分析，200页pdf

【斯坦福博士论文】隐私数据实用分析，200页pdf

专知会员服务

24+阅读 · 2024年7月14日

【斯坦福博士论文】有效的差分隐私深度学习，153页pdf

【斯坦福博士论文】有效的差分隐私深度学习，153页pdf

专知会员服务

19+阅读 · 2024年7月10日

【新书】差分隐私实战：使用OpenDP进行理论与实践介绍，389页pdf

【新书】差分隐私实战：使用OpenDP进行理论与实践介绍，389页pdf

专知会员服务

29+阅读 · 2024年5月29日

「机器学习中差分隐私」最新2022进展综述

「机器学习中差分隐私」最新2022进展综述

专知会员服务

53+阅读 · 2022年9月9日

面向推荐应用的差分隐私方案综述

专知会员服务

14+阅读 · 2021年9月14日

最新《分布式差分隐私》报告，65页ppt

专知会员服务

41+阅读 · 2020年12月1日

「联邦学习隐私保护」最新2022研究综述

「联邦学习隐私保护」最新2022研究综述

专知

16+阅读 · 2022年4月1日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

用深度学习揭示数据的因果关系

用深度学习揭示数据的因果关系

专知

28+阅读 · 2019年5月18日

【专题】美国隐私立法进展的总体分析

【专题】美国隐私立法进展的总体分析

蚂蚁金服评论

11+阅读 · 2019年4月25日

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

开放知识图谱

29+阅读 · 2019年1月17日

差分隐私保护：从入门到脱坑

差分隐私保护：从入门到脱坑

FreeBuf

17+阅读 · 2018年9月10日

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

专知

21+阅读 · 2018年5月14日

见微知著：语义分割中的弱监督学习

见微知著：语义分割中的弱监督学习

深度学习大讲堂

11+阅读 · 2017年12月6日

关于处理样本不平衡问题的Trick整理

关于处理样本不平衡问题的Trick整理

机器学习算法与Python学习

14+阅读 · 2017年12月3日

综述——隐私保护集合交集计算技术研究

综述——隐私保护集合交集计算技术研究

计算机研究与发展

22+阅读 · 2017年10月24日

面向网络系统的一致性安全隐私分析与防护机制设计

国家自然科学基金

2+阅读 · 2017年12月31日

面向隐私保护的地理社交网络个性化推荐方法研究

国家自然科学基金

2+阅读 · 2017年12月31日

基于微型批量采样的分布式多智能个体网络协同优化算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

处理效应差异中位数的有效估计

国家自然科学基金

0+阅读 · 2015年12月31日

基于负调查的云数据隐私保护关键问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

满足差分隐私的频繁模式挖掘研究

国家自然科学基金

2+阅读 · 2015年12月31日

数据流发布中的隐私保护理论和方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

面向隐私保护的云数据访问模型与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

Efficient privacy loss accounting for subsampling and random allocation

Efficient privacy loss accounting for subsampling and random allocation

Arxiv

0+阅读 · 2月19日

Reveal-or-Obscure: A Differentially Private Sampling Algorithm for Discrete Distributions

Arxiv

0+阅读 · 2月17日

Differentially Private Two-Stage Empirical Risk Minimization and Applications to Individualized Treatment Rule

Arxiv

0+阅读 · 2月13日

$f$-Differential Privacy Filters: Validity and Approximate Solutions

Arxiv

0+阅读 · 2月6日

Differential Privacy Analysis of Decentralized Gossip Averaging under Varying Threat Models

Arxiv

0+阅读 · 2月5日

Unifying Re-Identification, Attribute Inference, and Data Reconstruction Risks in Differential Privacy

Arxiv

0+阅读 · 2月4日

Differentially Private Sampling via Reveal-or-Obscure

Arxiv

0+阅读 · 2月4日

Your Privacy Depends on Others: Collusion Vulnerabilities in Individual Differential Privacy

Arxiv

0+阅读 · 1月19日

An Improved Privacy and Utility Analysis of Differentially Private SGD with Bounded Domain and Smooth Losses

Arxiv

0+阅读 · 1月15日

Differentially Private Bilevel Optimization

Arxiv

0+阅读 · 1月14日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

1+阅读 · 今天14:45

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

1+阅读 · 今天14:43

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

3+阅读 · 今天14:31

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 今天14:20

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

2+阅读 · 今天14:11

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

3+阅读 · 今天14:07

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 今天14:03

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 今天13:59

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

差分隐私全指南：从理论基础到用户期望

差分隐私全指南：从理论基础到用户期望

专知会员服务

13+阅读 · 2025年9月8日

【新书】差分隐私，246页pdf

【新书】差分隐私，246页pdf

专知会员服务

27+阅读 · 2025年4月5日

【普林斯顿博士论文】在差分隐私机器学习中有效地从数据中学习并生成数据，189页pdf

【普林斯顿博士论文】在差分隐私机器学习中有效地从数据中学习并生成数据，189页pdf

专知会员服务

20+阅读 · 2024年10月18日

【普林斯顿博士论文】在差分隐私机器学习中有效地从数据中学习和生成数据

【普林斯顿博士论文】在差分隐私机器学习中有效地从数据中学习和生成数据

专知会员服务

16+阅读 · 2024年10月7日

【斯坦福博士论文】隐私数据实用分析，200页pdf

【斯坦福博士论文】隐私数据实用分析，200页pdf

专知会员服务

24+阅读 · 2024年7月14日

【斯坦福博士论文】有效的差分隐私深度学习，153页pdf

【斯坦福博士论文】有效的差分隐私深度学习，153页pdf

专知会员服务

19+阅读 · 2024年7月10日

【新书】差分隐私实战：使用OpenDP进行理论与实践介绍，389页pdf

【新书】差分隐私实战：使用OpenDP进行理论与实践介绍，389页pdf

专知会员服务

29+阅读 · 2024年5月29日

「机器学习中差分隐私」最新2022进展综述

「机器学习中差分隐私」最新2022进展综述

专知会员服务

53+阅读 · 2022年9月9日

面向推荐应用的差分隐私方案综述

专知会员服务

14+阅读 · 2021年9月14日

最新《分布式差分隐私》报告，65页ppt

专知会员服务

41+阅读 · 2020年12月1日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

「联邦学习隐私保护」最新2022研究综述

「联邦学习隐私保护」最新2022研究综述

专知

16+阅读 · 2022年4月1日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

用深度学习揭示数据的因果关系

用深度学习揭示数据的因果关系

专知

28+阅读 · 2019年5月18日

【专题】美国隐私立法进展的总体分析

【专题】美国隐私立法进展的总体分析

蚂蚁金服评论

11+阅读 · 2019年4月25日

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

论文浅尝 | 基于深度强化学习的远程监督数据集的降噪

开放知识图谱

29+阅读 · 2019年1月17日

差分隐私保护：从入门到脱坑

差分隐私保护：从入门到脱坑

FreeBuf

17+阅读 · 2018年9月10日

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

隐私和机器学习：两个意想不到的盟友？一文了解差分隐私

专知

21+阅读 · 2018年5月14日

见微知著：语义分割中的弱监督学习

见微知著：语义分割中的弱监督学习

深度学习大讲堂

11+阅读 · 2017年12月6日

关于处理样本不平衡问题的Trick整理

关于处理样本不平衡问题的Trick整理

机器学习算法与Python学习

14+阅读 · 2017年12月3日

综述——隐私保护集合交集计算技术研究

综述——隐私保护集合交集计算技术研究

计算机研究与发展

22+阅读 · 2017年10月24日

相关论文

Efficient privacy loss accounting for subsampling and random allocation

Efficient privacy loss accounting for subsampling and random allocation

Arxiv

0+阅读 · 2月19日

Reveal-or-Obscure: A Differentially Private Sampling Algorithm for Discrete Distributions

Arxiv

0+阅读 · 2月17日

Differentially Private Two-Stage Empirical Risk Minimization and Applications to Individualized Treatment Rule

Arxiv

0+阅读 · 2月13日

$f$-Differential Privacy Filters: Validity and Approximate Solutions

Arxiv

0+阅读 · 2月6日

Differential Privacy Analysis of Decentralized Gossip Averaging under Varying Threat Models

Arxiv

0+阅读 · 2月5日

Unifying Re-Identification, Attribute Inference, and Data Reconstruction Risks in Differential Privacy

Arxiv

0+阅读 · 2月4日

Differentially Private Sampling via Reveal-or-Obscure

Arxiv

0+阅读 · 2月4日

Your Privacy Depends on Others: Collusion Vulnerabilities in Individual Differential Privacy

Arxiv

0+阅读 · 1月19日

An Improved Privacy and Utility Analysis of Differentially Private SGD with Bounded Domain and Smooth Losses

Arxiv

0+阅读 · 1月15日

Differentially Private Bilevel Optimization

Arxiv

0+阅读 · 1月14日

相关基金

面向网络系统的一致性安全隐私分析与防护机制设计

国家自然科学基金

2+阅读 · 2017年12月31日

面向隐私保护的地理社交网络个性化推荐方法研究

国家自然科学基金

2+阅读 · 2017年12月31日

基于微型批量采样的分布式多智能个体网络协同优化算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

处理效应差异中位数的有效估计

国家自然科学基金

0+阅读 · 2015年12月31日

基于负调查的云数据隐私保护关键问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

满足差分隐私的频繁模式挖掘研究

国家自然科学基金

2+阅读 · 2015年12月31日

数据流发布中的隐私保护理论和方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

面向隐私保护的云数据访问模型与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员