Perturbation Effects on Accuracy and Fairness among Similar Individuals - 专知论文

会员服务 ·

0

扰动 · 鲁棒 · 公平性 · 对准 · 对抗 ·

Perturbation Effects on Accuracy and Fairness among Similar Individuals

翻译：针对语义相似个体的扰动效应对准确性与公平性的影响

Xuran Li,Hao Xue,Peng Wu,Xingjun Ma,Zhen Zhang,Huaming Chen,Flora D. Salim

Deep neural networks are vulnerable to adversarial perturbations that can simultaneously degrade prediction robustness and individual fairness across diverse application settings. However, existing evaluation protocols typically assess these dimensions in isolation, thereby obscuring critical failure modes. To bridge this gap, we formalize Robust Individual Fairness (RIF): under semantic-preserving (truth-condition-preserving) perturbations, predictions should remain both correct with respect to the ground truth and invariant across semantically equivalent individuals. To surface RIF violations in practice, we introduce RIFair, a black-box adversarial framework that leverages a decoupled perturbation strategy to construct semantically preserved yet unrobust and/or unfair instance pairs. Experiments across multiple model architectures and real-world textual datasets show that robustness-only or fairness-only metrics often miss Robust Biased and Unrobust Fair behaviors. RIFair}reliably exposes these hidden vulnerabilities, supporting RIF as a necessary criterion for trustworthy model assessment. The experimental code is publicly available at https://github.com/Xuran-LI/RIFair.

翻译：深度神经网络容易受到对抗性扰动的影响，这种扰动在各种应用场景中会同时降低预测鲁棒性和个体公平性。然而，现有的评估协议通常孤立地评估这些维度，从而掩盖了关键的失效模式。为弥补这一差距，我们形式化定义了鲁棒个体公平性（RIF）：在保持语义（保持真实条件）的扰动下，预测结果应既相对于真实标签保持正确，又在语义等价的个体间保持不变。为了在实践中暴露RIF的违反情况，我们提出了RIFair——一个黑盒对抗框架，它利用解耦扰动策略构建语义保持但缺乏鲁棒性和/或公平性的实例对。在多种模型架构和真实世界文本数据集上的实验表明，仅关注鲁棒性或仅关注公平性的度量标准往往容易遗漏鲁棒性偏差行为和欠鲁棒公平行为。RIFair能够可靠地揭示这些隐藏的脆弱性，从而支持将RIF作为可信模型评估的必要标准。实验代码已开源在https://github.com/Xuran-LI/RIFair。

0

相关内容

论学习、公平性与复杂度

论学习、公平性与复杂度

专知会员服务

12+阅读 · 2月28日

大型语言模型中隐性与显性偏见的综合研究

大型语言模型中隐性与显性偏见的综合研究

专知会员服务

17+阅读 · 2025年11月25日

大模型如何用因果性？最新《大型语言模型与因果推断在协作中的应用》全面综述

大模型如何用因果性？最新《大型语言模型与因果推断在协作中的应用》全面综述

专知会员服务

50+阅读 · 2024年3月17日

大型语言模型公平性

大型语言模型公平性

专知会员服务

41+阅读 · 2023年8月31日

【剑桥大学博士论文】模型鲁棒性的因果视角:健康和传感器数据案例研究，125页pdf

【剑桥大学博士论文】模型鲁棒性的因果视角:健康和传感器数据案例研究，125页pdf

专知会员服务

29+阅读 · 2023年2月10日

NLP中如何处理因果性？EMNLP2022最新《自然语言处理因果关系导论》教程，180页ppt全面讲解因果发现和因果效应估计

NLP中如何处理因果性？EMNLP2022最新《自然语言处理因果关系导论》教程，180页ppt全面讲解因果发现和因果效应估计

专知会员服务

67+阅读 · 2022年12月16日

【AAAI2021】属性引导对抗训练的自然扰动鲁棒性

专知会员服务

26+阅读 · 2021年1月21日

最新《深度学习噪声标签学习》综述论文，14页pdf

专知会员服务

101+阅读 · 2020年7月20日

【ICML2020】噪声在随机梯度下降中的泛化效益，On the Generalization Benefit of Noise in Stochastic Gradient Descent

【ICML2020】噪声在随机梯度下降中的泛化效益，On the Generalization Benefit of Noise in Stochastic Gradient Descent

专知会员服务

19+阅读 · 2020年6月29日

深度神经网络模型的个体差异，Individual differences among deep neural network models

深度神经网络模型的个体差异，Individual differences among deep neural network models

专知会员服务

10+阅读 · 2020年1月11日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

52+阅读 · 2022年11月16日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

「PPT」深度学习中的不确定性估计

「PPT」深度学习中的不确定性估计

专知

27+阅读 · 2019年7月20日

用深度学习揭示数据的因果关系

用深度学习揭示数据的因果关系

专知

28+阅读 · 2019年5月18日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

清华张敏教授: 个性化推荐的可解释性、鲁棒性和公平性( 附报告下载)

清华张敏教授: 个性化推荐的可解释性、鲁棒性和公平性( 附报告下载)

专知

13+阅读 · 2019年2月24日

相关性≠因果：概率图模型和do-calculus

相关性≠因果：概率图模型和do-calculus

论智

31+阅读 · 2018年10月29日

用模型不确定性理解模型

用模型不确定性理解模型

论智

11+阅读 · 2018年9月5日

FCS 论坛 | 孟德宇：误差建模原理

FCS 论坛 | 孟德宇：误差建模原理

FCS

15+阅读 · 2017年8月17日

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

机器人圈

35+阅读 · 2017年7月18日

群体偏好的敏感性度量方法研究和群决策方法的可实施性评价

国家自然科学基金

0+阅读 · 2017年12月31日

随机振动响应预测中的模型形式不确定性量化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂决策环境下面向共识的群体评价模型与方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

受扰多智能体系统的分布式主动抗干扰协调控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

网络本体质量及适应性的评估研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于不确定性计算的鲁棒风险评估关键技术研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于近似对称的扰动方程的若干研究

国家自然科学基金

0+阅读 · 2014年12月31日

企业多层次信息技术匹配及其对敏捷性的影响机理

国家自然科学基金

0+阅读 · 2014年12月31日

随机扰动的非线性系统全局和局部动力学行为研究

国家自然科学基金

1+阅读 · 2014年12月31日

Maximin Relative Improvement: Fair Learning as a Bargaining Problem

Arxiv

0+阅读 · 6月16日

Adversarial Attacks Leverage Interference Between Features in Superposition

Arxiv

0+阅读 · 6月15日

Evaluating LLM Personalization via Semantic Constraint Verification

Arxiv

0+阅读 · 6月15日

ALCL: An Adaptive Log-Correntropy Loss for Robust Learning under Non-Gaussian Noise

Arxiv

0+阅读 · 6月14日

When Recommendation Denoising Meets Popularity Bias: Understanding and Mitigating Their Interaction

Arxiv

0+阅读 · 6月12日

Mitigating Disparate Impact of Differentially Private Learning through Bounded Adaptive Clipping

Arxiv

0+阅读 · 6月10日

Improving Adversarial Transferability on Vision-Language Pre-training Models via Surrogate-Specific Bias Correction

Arxiv

0+阅读 · 6月9日

Effects of Personality- and Opinion-Alignment in Human-AI Interaction

Arxiv

0+阅读 · 6月5日

Theory of Minimal Weight Perturbations in Deep Networks and its Applications for Low-Rank Activated Backdoor Attacks

Arxiv

0+阅读 · 5月18日

Benchmarking Fairness in Spiking Neural Networks: Data Bias, Spurious Features, and Hardware Effects

Arxiv

0+阅读 · 5月8日

VIP会员

文章信息

相关主题

最新内容

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

4+阅读 · 今天2:42

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

1+阅读 · 今天2:37

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

5+阅读 · 今天2:23

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

6+阅读 · 今天2:21

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

2+阅读 · 今天1:46

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

6+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

4+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

4+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

8+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

8+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

8+阅读 · 7月31日

相关VIP内容

论学习、公平性与复杂度

论学习、公平性与复杂度

专知会员服务

12+阅读 · 2月28日

大型语言模型中隐性与显性偏见的综合研究

大型语言模型中隐性与显性偏见的综合研究

专知会员服务

17+阅读 · 2025年11月25日

大模型如何用因果性？最新《大型语言模型与因果推断在协作中的应用》全面综述

大模型如何用因果性？最新《大型语言模型与因果推断在协作中的应用》全面综述

专知会员服务

50+阅读 · 2024年3月17日

大型语言模型公平性

大型语言模型公平性

专知会员服务

41+阅读 · 2023年8月31日

【剑桥大学博士论文】模型鲁棒性的因果视角:健康和传感器数据案例研究，125页pdf

【剑桥大学博士论文】模型鲁棒性的因果视角:健康和传感器数据案例研究，125页pdf

专知会员服务

29+阅读 · 2023年2月10日

NLP中如何处理因果性？EMNLP2022最新《自然语言处理因果关系导论》教程，180页ppt全面讲解因果发现和因果效应估计

NLP中如何处理因果性？EMNLP2022最新《自然语言处理因果关系导论》教程，180页ppt全面讲解因果发现和因果效应估计

专知会员服务

67+阅读 · 2022年12月16日

【AAAI2021】属性引导对抗训练的自然扰动鲁棒性

专知会员服务

26+阅读 · 2021年1月21日

最新《深度学习噪声标签学习》综述论文，14页pdf

专知会员服务

101+阅读 · 2020年7月20日

【ICML2020】噪声在随机梯度下降中的泛化效益，On the Generalization Benefit of Noise in Stochastic Gradient Descent

【ICML2020】噪声在随机梯度下降中的泛化效益，On the Generalization Benefit of Noise in Stochastic Gradient Descent

专知会员服务

19+阅读 · 2020年6月29日

深度神经网络模型的个体差异，Individual differences among deep neural network models

深度神经网络模型的个体差异，Individual differences among deep neural network models

专知会员服务

10+阅读 · 2020年1月11日

热门VIP内容

开通专知VIP会员享更多权益服务

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

从采集到决策：美军视角下的战术情报范式重构

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

相关资讯

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

52+阅读 · 2022年11月16日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

「PPT」深度学习中的不确定性估计

「PPT」深度学习中的不确定性估计

专知

27+阅读 · 2019年7月20日

用深度学习揭示数据的因果关系

用深度学习揭示数据的因果关系

专知

28+阅读 · 2019年5月18日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

清华张敏教授: 个性化推荐的可解释性、鲁棒性和公平性( 附报告下载)

清华张敏教授: 个性化推荐的可解释性、鲁棒性和公平性( 附报告下载)

专知

13+阅读 · 2019年2月24日

相关性≠因果：概率图模型和do-calculus

相关性≠因果：概率图模型和do-calculus

论智

31+阅读 · 2018年10月29日

用模型不确定性理解模型

用模型不确定性理解模型

论智

11+阅读 · 2018年9月5日

FCS 论坛 | 孟德宇：误差建模原理

FCS 论坛 | 孟德宇：误差建模原理

FCS

15+阅读 · 2017年8月17日

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

机器人圈

35+阅读 · 2017年7月18日

相关论文

Maximin Relative Improvement: Fair Learning as a Bargaining Problem

Arxiv

0+阅读 · 6月16日

Adversarial Attacks Leverage Interference Between Features in Superposition

Arxiv

0+阅读 · 6月15日

Evaluating LLM Personalization via Semantic Constraint Verification

Arxiv

0+阅读 · 6月15日

ALCL: An Adaptive Log-Correntropy Loss for Robust Learning under Non-Gaussian Noise

Arxiv

0+阅读 · 6月14日

When Recommendation Denoising Meets Popularity Bias: Understanding and Mitigating Their Interaction

Arxiv

0+阅读 · 6月12日

Mitigating Disparate Impact of Differentially Private Learning through Bounded Adaptive Clipping

Arxiv

0+阅读 · 6月10日

Improving Adversarial Transferability on Vision-Language Pre-training Models via Surrogate-Specific Bias Correction

Arxiv

0+阅读 · 6月9日

Effects of Personality- and Opinion-Alignment in Human-AI Interaction

Arxiv

0+阅读 · 6月5日

Theory of Minimal Weight Perturbations in Deep Networks and its Applications for Low-Rank Activated Backdoor Attacks

Arxiv

0+阅读 · 5月18日

Benchmarking Fairness in Spiking Neural Networks: Data Bias, Spurious Features, and Hardware Effects

Arxiv

0+阅读 · 5月8日

相关基金

群体偏好的敏感性度量方法研究和群决策方法的可实施性评价

国家自然科学基金

0+阅读 · 2017年12月31日

随机振动响应预测中的模型形式不确定性量化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂决策环境下面向共识的群体评价模型与方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

受扰多智能体系统的分布式主动抗干扰协调控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

网络本体质量及适应性的评估研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于不确定性计算的鲁棒风险评估关键技术研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于近似对称的扰动方程的若干研究

国家自然科学基金

0+阅读 · 2014年12月31日

企业多层次信息技术匹配及其对敏捷性的影响机理

国家自然科学基金

0+阅读 · 2014年12月31日

随机扰动的非线性系统全局和局部动力学行为研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员