On Reliability of Efficient Membership Inference Vulnerability Evaluation - 专知论文

会员服务 ·

0

推断 · MoDELS · 得分 · 有偏 · 训练数据 ·

On Reliability of Efficient Membership Inference Vulnerability Evaluation

翻译：关于高效成员推断脆弱性评估的可靠性研究

Joonas Jälkö,Gauri Pradhan,Ossi Räisä,Antti Honkela

from arxiv, 14 pages, 10 figures

Membership inference attacks (MIAs) are popular methods for empirically assessing the leakage of sensitive information in the training data through models or statistics learned from the data. The MIA vulnerability is often evaluated through false positive rate (FPR) and true positive rate (TPR) of a binary classifier that tries to predict whether a particular sample was in the training data. However, in order to reliably estimate the TPR especially for low FPR values, a lot of observations are needed, which in case of MIA translates to many target models, leading to large computational cost. To avoid excessive compute requirements, the MIA scores are often averaged over multiple individuals and multiple targeted models. We demonstrate two key weaknesses in this efficient MIA evaluation pipeline. First, we show that evaluating the TPR based on MIA scores concatenated across multiple individuals, commonly used to study vulnerabilities in the very low FPR regime, is not calibrated across the per-sample FPRs. This makes it unreliable as a tool for auditing differential privacy. To solve this, we propose a post-processing method to effectively calibrate the FPR across different samples. Second, we identify a finite population bias in the commonly used efficient likelihood-ratio attack (LiRA) implementation proposed by Carlini et al. 2022, leading to a positive bias in the per-sample vulnerability.

翻译：成员推断攻击（MIA）是通过模型或从数据中习得的统计量，对训练数据中敏感信息泄露进行实证评估的常用方法。MIA脆弱性通常通过二分类器的假阳性率（FPR）和真阳性率（TPR）进行衡量，该分类器旨在预测特定样本是否属于训练数据。然而，为可靠估计TPR（尤其是低FPR值下的TPR），需要大量观测值——在MIA场景中即需大量目标模型，从而导致高昂的计算成本。为避免过高计算需求，MIA评分常需跨多个个体和多个目标模型取平均值。本研究揭示了这一高效MIA评估流程的两个关键缺陷。首先，我们证明基于跨多个个体拼接的MIA评分（常用于研究极低FPR区间脆弱性）来评估TPR时，并未实现跨样本FPR校准，这使得其作为差分隐私审计工具不可靠。为解决此问题，我们提出一种后处理方法以有效校准不同样本间的FPR。其次，我们识别出Carlini等人（2022年）提出的高效似然比攻击（LiRA）实现中存在的有限总体偏差，该偏差会导致样本级脆弱性评估产生正向偏倚。

0

相关内容

《关键任务型人工智能的可靠性》

《关键任务型人工智能的可靠性》

专知会员服务

20+阅读 · 4月9日

联邦学习中的成员推断攻击与防御：综述

联邦学习中的成员推断攻击与防御：综述

专知会员服务

17+阅读 · 2024年12月15日

深度学习如何可信？港理工等最新《2D和3D深度学习模型对抗性攻击的鲁棒性和安全性》综述，涵盖170篇论文

深度学习如何可信？港理工等最新《2D和3D深度学习模型对抗性攻击的鲁棒性和安全性》综述，涵盖170篇论文

专知会员服务

29+阅读 · 2023年10月3日

《高级联合效能模型（AJEM）的不确定性量化和敏感性分析方法》美陆军30页报告：高级联合效应模型（AJEM）用于与威胁/目标交互的脆弱性和致命性（V/L）预测

《高级联合效能模型（AJEM）的不确定性量化和敏感性分析方法》美陆军30页报告：高级联合效应模型（AJEM）用于与威胁/目标交互的脆弱性和致命性（V/L）预测

专知会员服务

27+阅读 · 2023年7月5日

《网络防御中深度学习方法的鲁棒性和脆弱性测量》72页论文

《网络防御中深度学习方法的鲁棒性和脆弱性测量》72页论文

专知会员服务

42+阅读 · 2023年4月20日

强化学习如何可信可靠？CMU最新《可信赖强化学习》综述，36页pdf阐述可信强化学习的鲁棒性、安全性和泛化性

强化学习如何可信可靠？CMU最新《可信赖强化学习》综述，36页pdf阐述可信强化学习的鲁棒性、安全性和泛化性

专知会员服务

93+阅读 · 2022年9月25日

《模拟空战团队态势感知精度测量技术——感知与绩效的曲线关系》芬兰国防大学

《模拟空战团队态势感知精度测量技术——感知与绩效的曲线关系》芬兰国防大学

专知会员服务

37+阅读 · 2022年6月20日

黑盒机器学习模型的成员推断攻击研究

专知会员服务

24+阅读 · 2021年8月22日

【AAAI2021】知识迁移的机器学习成员隐私保护，57页ppt

【AAAI2021】知识迁移的机器学习成员隐私保护，57页ppt

专知会员服务

28+阅读 · 2021年2月9日

ISWC2020最佳论文《可解释假信息检测的链接可信度评价》

ISWC2020最佳论文《可解释假信息检测的链接可信度评价》

专知会员服务

20+阅读 · 2020年11月7日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

52+阅读 · 2022年11月16日

推荐！《对抗性在线学习》【译文】美国海军研究实验室项目总结报告

推荐！《对抗性在线学习》【译文】美国海军研究实验室项目总结报告

专知

12+阅读 · 2022年9月29日

推荐！【中文版】《指挥、控制、通信和情报（C3I）系统安全性综述：漏洞、攻击和对策》35页最新论文

推荐！【中文版】《指挥、控制、通信和情报（C3I）系统安全性综述：漏洞、攻击和对策》35页最新论文

专知

44+阅读 · 2022年7月27日

美国陆军研究实验室《支持C2互操作性和传感器融合的全球信息网络架构评估》2022年技术总结报告

美国陆军研究实验室《支持C2互操作性和传感器融合的全球信息网络架构评估》2022年技术总结报告

专知

64+阅读 · 2022年7月15日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

专知

24+阅读 · 2018年9月6日

论强化学习和概率推断的等价性：一种全新概率模型

论强化学习和概率推断的等价性：一种全新概率模型

机器之心

26+阅读 · 2018年5月5日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

群体偏好的敏感性度量方法研究和群决策方法的可实施性评价

国家自然科学基金

0+阅读 · 2017年12月31日

面向时空特性的社交网络推演攻击与隐私保护关键技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

可证明安全的确定性公钥加密体制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于广义强度分布理论的小子样可靠性分析方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

非确定型Web服务流程重组的可靠性验证技术

国家自然科学基金

1+阅读 · 2015年12月31日

考虑不确定性的结构动力学响应模型可信度确认方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于扩展的概率转移矩阵模型的高精度快速广义门电路可靠性评估方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

具有可靠性增长的系统可靠性试验鉴定方法研究

国家自然科学基金

10+阅读 · 2013年12月31日

CheckMIABench: Firm Foundations For Membership Inference Attacks on Language Models

Arxiv

0+阅读 · 6月16日

Membership Inference Attacks against Large Audio Language Models

Arxiv

0+阅读 · 6月16日

Causal Evaluation of Membership Inference Attacks

Arxiv

0+阅读 · 6月15日

Beyond Point Estimates: Reliable Evaluation of Prediction Performance Metrics under Clustered Data

Arxiv

0+阅读 · 6月3日

Causal Evaluation of Membership Inference Attacks

Arxiv

0+阅读 · 5月29日

Enhancing Membership Inference Attacks on Diffusion Models from a Frequency-Domain Perspective

Arxiv

0+阅读 · 5月28日

Assessing Per-Sample Membership Inference Vulnerability without Retraining

Arxiv

0+阅读 · 5月26日

Reliability analysis for non-deterministic limit-states using stochastic emulators

Arxiv

0+阅读 · 5月17日

Measuring the stability and plasticity of recommender systems

Arxiv

0+阅读 · 5月14日

FERMI: Exploiting Relations for Membership Inference Against Tabular Diffusion Models

Arxiv

0+阅读 · 5月12日

VIP会员

文章信息

相关主题

最新内容

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

0+阅读 · 今天2:42

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

1+阅读 · 今天2:37

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

2+阅读 · 今天2:23

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

4+阅读 · 今天2:21

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

2+阅读 · 今天1:46

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

5+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

4+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

3+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

7+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

7+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

7+阅读 · 7月31日

相关VIP内容

《关键任务型人工智能的可靠性》

《关键任务型人工智能的可靠性》

专知会员服务

20+阅读 · 4月9日

联邦学习中的成员推断攻击与防御：综述

联邦学习中的成员推断攻击与防御：综述

专知会员服务

17+阅读 · 2024年12月15日

深度学习如何可信？港理工等最新《2D和3D深度学习模型对抗性攻击的鲁棒性和安全性》综述，涵盖170篇论文

深度学习如何可信？港理工等最新《2D和3D深度学习模型对抗性攻击的鲁棒性和安全性》综述，涵盖170篇论文

专知会员服务

29+阅读 · 2023年10月3日

《高级联合效能模型（AJEM）的不确定性量化和敏感性分析方法》美陆军30页报告：高级联合效应模型（AJEM）用于与威胁/目标交互的脆弱性和致命性（V/L）预测

《高级联合效能模型（AJEM）的不确定性量化和敏感性分析方法》美陆军30页报告：高级联合效应模型（AJEM）用于与威胁/目标交互的脆弱性和致命性（V/L）预测

专知会员服务

27+阅读 · 2023年7月5日

《网络防御中深度学习方法的鲁棒性和脆弱性测量》72页论文

《网络防御中深度学习方法的鲁棒性和脆弱性测量》72页论文

专知会员服务

42+阅读 · 2023年4月20日

强化学习如何可信可靠？CMU最新《可信赖强化学习》综述，36页pdf阐述可信强化学习的鲁棒性、安全性和泛化性

强化学习如何可信可靠？CMU最新《可信赖强化学习》综述，36页pdf阐述可信强化学习的鲁棒性、安全性和泛化性

专知会员服务

93+阅读 · 2022年9月25日

《模拟空战团队态势感知精度测量技术——感知与绩效的曲线关系》芬兰国防大学

《模拟空战团队态势感知精度测量技术——感知与绩效的曲线关系》芬兰国防大学

专知会员服务

37+阅读 · 2022年6月20日

黑盒机器学习模型的成员推断攻击研究

专知会员服务

24+阅读 · 2021年8月22日

【AAAI2021】知识迁移的机器学习成员隐私保护，57页ppt

【AAAI2021】知识迁移的机器学习成员隐私保护，57页ppt

专知会员服务

28+阅读 · 2021年2月9日

ISWC2020最佳论文《可解释假信息检测的链接可信度评价》

ISWC2020最佳论文《可解释假信息检测的链接可信度评价》

专知会员服务

20+阅读 · 2020年11月7日

热门VIP内容

开通专知VIP会员享更多权益服务

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

从采集到决策：美军视角下的战术情报范式重构

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

相关资讯

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

52+阅读 · 2022年11月16日

推荐！《对抗性在线学习》【译文】美国海军研究实验室项目总结报告

推荐！《对抗性在线学习》【译文】美国海军研究实验室项目总结报告

专知

12+阅读 · 2022年9月29日

推荐！【中文版】《指挥、控制、通信和情报（C3I）系统安全性综述：漏洞、攻击和对策》35页最新论文

推荐！【中文版】《指挥、控制、通信和情报（C3I）系统安全性综述：漏洞、攻击和对策》35页最新论文

专知

44+阅读 · 2022年7月27日

美国陆军研究实验室《支持C2互操作性和传感器融合的全球信息网络架构评估》2022年技术总结报告

美国陆军研究实验室《支持C2互操作性和传感器融合的全球信息网络架构评估》2022年技术总结报告

专知

64+阅读 · 2022年7月15日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

专知

24+阅读 · 2018年9月6日

论强化学习和概率推断的等价性：一种全新概率模型

论强化学习和概率推断的等价性：一种全新概率模型

机器之心

26+阅读 · 2018年5月5日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

相关论文

CheckMIABench: Firm Foundations For Membership Inference Attacks on Language Models

Arxiv

0+阅读 · 6月16日

Membership Inference Attacks against Large Audio Language Models

Arxiv

0+阅读 · 6月16日

Causal Evaluation of Membership Inference Attacks

Arxiv

0+阅读 · 6月15日

Beyond Point Estimates: Reliable Evaluation of Prediction Performance Metrics under Clustered Data

Arxiv

0+阅读 · 6月3日

Causal Evaluation of Membership Inference Attacks

Arxiv

0+阅读 · 5月29日

Enhancing Membership Inference Attacks on Diffusion Models from a Frequency-Domain Perspective

Arxiv

0+阅读 · 5月28日

Assessing Per-Sample Membership Inference Vulnerability without Retraining

Arxiv

0+阅读 · 5月26日

Reliability analysis for non-deterministic limit-states using stochastic emulators

Arxiv

0+阅读 · 5月17日

Measuring the stability and plasticity of recommender systems

Arxiv

0+阅读 · 5月14日

FERMI: Exploiting Relations for Membership Inference Against Tabular Diffusion Models

Arxiv

0+阅读 · 5月12日

相关基金

群体偏好的敏感性度量方法研究和群决策方法的可实施性评价

国家自然科学基金

0+阅读 · 2017年12月31日

面向时空特性的社交网络推演攻击与隐私保护关键技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

可证明安全的确定性公钥加密体制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于广义强度分布理论的小子样可靠性分析方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

非确定型Web服务流程重组的可靠性验证技术

国家自然科学基金

1+阅读 · 2015年12月31日

考虑不确定性的结构动力学响应模型可信度确认方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于扩展的概率转移矩阵模型的高精度快速广义门电路可靠性评估方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

具有可靠性增长的系统可靠性试验鉴定方法研究

国家自然科学基金

10+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员