Fair Feature Importance Scores via Feature Occlusion and Permutation - 专知论文

会员服务 ·

0

度量 · 公平性 · 置换 · 包含 · 学习模型 ·

Fair Feature Importance Scores via Feature Occlusion and Permutation

翻译：基于特征遮蔽与置换的公平特征重要性评分

Camille Little,Madeline Navarro,Santiago Segarra,Genevera Allen

As machine learning models increasingly impact society, their opaque nature poses challenges to trust and accountability, particularly in fairness contexts. Understanding how individual features influence model outcomes is crucial for building interpretable and equitable models. While feature importance metrics for accuracy are well-established, methods for assessing feature contributions to fairness remain underexplored. We propose two model-agnostic approaches to measure fair feature importance. First, we propose to compare model fairness before and after permuting feature values. This simple intervention-based approach decouples a feature and model predictions to measure its contribution to training. Second, we evaluate the fairness of models trained with and without a given feature. This occlusion-based score enjoys dramatic computational simplification via minipatch learning. Our empirical results reflect the simplicity and effectiveness of our proposed metrics for multiple predictive tasks. Both methods offer simple, scalable, and interpretable solutions to quantify the influence of features on fairness, providing new tools for responsible machine learning development.

翻译：随着机器学习模型对社会的影响日益加深，其不透明的特性对信任与问责制提出了挑战，尤其在公平性语境下。理解个体特征如何影响模型输出对于构建可解释且公平的模型至关重要。尽管针对准确率的特征重要性度量方法已较为成熟，但评估特征对公平性贡献的方法仍待深入探索。本文提出两种模型无关的方法来度量公平特征重要性。首先，我们提出通过比较特征值置换前后模型的公平性来评估特征影响。这种基于简单干预的方法将特征与模型预测解耦，以度量其对训练过程的贡献。其次，我们评估包含与不包含给定特征时训练所得模型的公平性。这种基于遮蔽的评分方法借助微块学习实现了显著的计算简化。实证结果体现了我们提出的度量方法在多种预测任务中的简洁性与有效性。两种方法均提供了简单、可扩展且可解释的解决方案，用于量化特征对公平性的影响，为负责任的机器学习开发提供了新工具。

0

相关内容

【ETHZ博士论文】算法补救的进展：确保因果一致性、公平性和鲁棒性，233页pdf

【ETHZ博士论文】算法补救的进展：确保因果一致性、公平性和鲁棒性，233页pdf

专知会员服务

29+阅读 · 2023年11月26日

MIT最新论文《对可解释特征的需求：动机和分类》：在机器学习模型的组成元素中建立可解释性

MIT最新论文《对可解释特征的需求：动机和分类》：在机器学习模型的组成元素中建立可解释性

专知会员服务

25+阅读 · 2022年6月30日

【AAAI 2022】机器学习模型的解释方法效果如何？MIT、微软学者为你解读，Do Feature Attribution Methods Correctly Attribute Features?

【AAAI 2022】机器学习模型的解释方法效果如何？MIT、微软学者为你解读，Do Feature Attribution Methods Correctly Attribute Features?

专知会员服务

31+阅读 · 2022年3月12日

【KDD 2021】算法公平性解释框架FACTS

专知会员服务

24+阅读 · 2021年8月27日

【斯坦福博士论文】机器学习的模型解释和数据评估，206页pdf

专知会员服务

128+阅读 · 2021年8月3日

可信机器学习的公平性综述

可信机器学习的公平性综述

专知会员服务

69+阅读 · 2021年2月23日

【SIGIR2020】基于知识图谱的公平感知可解释推荐，Fairness-Aware Explainable Recommendation over Knowledge Graphs

【SIGIR2020】基于知识图谱的公平感知可解释推荐，Fairness-Aware Explainable Recommendation over Knowledge Graphs

专知会员服务

47+阅读 · 2020年6月3日

【卡内基梅隆大学-CMU】机器学习中的公平性，Learning Fair Representations

【卡内基梅隆大学-CMU】机器学习中的公平性，Learning Fair Representations

专知会员服务

38+阅读 · 2020年2月29日

可视化特征属性基线的影响，Visualizing the Impact of Feature Attribution Baselines

可视化特征属性基线的影响，Visualizing the Impact of Feature Attribution Baselines

专知会员服务

10+阅读 · 2020年1月16日

【2020密歇根大学论文】基于学习的序列决策算法的公平性综述论文，Fairness in Learning-Based Sequential Decision Algorithms: A Survey

【2020密歇根大学论文】基于学习的序列决策算法的公平性综述论文，Fairness in Learning-Based Sequential Decision Algorithms: A Survey

专知会员服务

22+阅读 · 2020年1月15日

【NIPS2019】Infidelity and Sensitivity：模型可解释性方法的定量评估

【NIPS2019】Infidelity and Sensitivity：模型可解释性方法的定量评估

AINLP

19+阅读 · 2020年6月14日

【经典书】精通机器学习特征工程，中文版，178页pdf

【经典书】精通机器学习特征工程，中文版，178页pdf

专知

135+阅读 · 2020年2月15日

《机器学习与公平性》新书发布，附127页PDF下载

《机器学习与公平性》新书发布，附127页PDF下载

专知

25+阅读 · 2019年9月13日

今日面试题分享：请写出你了解的机器学习特征工程操作，以及它的意义

今日面试题分享：请写出你了解的机器学习特征工程操作，以及它的意义

七月在线实验室

39+阅读 · 2019年3月20日

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

AI100

11+阅读 · 2018年9月4日

【干货】理解特征工程Part 2——类别数据（附代码）

【干货】理解特征工程Part 2——类别数据（附代码）

专知

16+阅读 · 2018年6月8日

一文看懂常用特征工程方法

一文看懂常用特征工程方法

AI研习社

17+阅读 · 2018年5月2日

【学界】机器学习模型的“可解释性”到底有多重要？

【学界】机器学习模型的“可解释性”到底有多重要？

GAN生成式对抗网络

12+阅读 · 2018年3月3日

推荐｜机器学习中的模型评价、模型选择和算法选择！

推荐｜机器学习中的模型评价、模型选择和算法选择！

全球人工智能

10+阅读 · 2018年2月5日

特征工程的特征理解（一）

特征工程的特征理解（一）

机器学习研究会

10+阅读 · 2017年10月23日

基于分类能力结构度量与类相关性关系保留的特征选取方法研究

国家自然科学基金

1+阅读 · 2017年12月31日

评估出生缺陷风险的父源性表观遗传学标志物--相关印记基因筛选

国家自然科学基金

0+阅读 · 2016年12月31日

基于复杂语义的个性化图像集摘要研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于生态演替的文本大数据特征学习研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于记忆的不变图像特征学习方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于领域知识和链路预测的个性化推荐研究

国家自然科学基金

4+阅读 · 2014年12月31日

在线服务信誉可比较性及其保障机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

广义线性模型的组变量选择及其在信用评分中的应用

国家自然科学基金

2+阅读 · 2014年12月31日

战略环境评价有效性评估指标体系与评估方法研究

国家自然科学基金

10+阅读 · 2013年12月31日

Disentangled Feature Importance

Arxiv

0+阅读 · 3月16日

Causality Is Key to Understand and Balance Multiple Goals in Trustworthy ML and Foundation Models

Causality Is Key to Understand and Balance Multiple Goals in Trustworthy ML and Foundation Models

Arxiv

0+阅读 · 3月13日

No evaluation without fair representation : Impact of label and selection bias on the evaluation, performance and mitigation of classification models

Arxiv

0+阅读 · 3月10日

An Experimental Study on Fairness-aware Machine Learning for Credit Scoring Problems

Arxiv

0+阅读 · 3月5日

cc-Shapley: Measuring Multivariate Feature Importance Needs Causal Context

Arxiv

0+阅读 · 3月5日

Aggregate Models, Not Explanations: Improving Feature Importance Estimation

Arxiv

0+阅读 · 2月12日

Empirical Likelihood-Based Fairness Auditing: Distribution-Free Certification and Flagging

Arxiv

0+阅读 · 2月12日

Double Fairness Policy Learning: Integrating Action Fairness and Outcome Fairness in Decision-making

Arxiv

0+阅读 · 2月9日

Understanding Fairness and Prediction Error through Subspace Decomposition and Influence Analysis

Arxiv

0+阅读 · 2月7日

Fix Representation (Optimally) Before Fairness: Finite-Sample Shrinkage Population Correction and the True Price of Fairness Under Subpopulation Shift

Arxiv

0+阅读 · 2月5日

VIP会员

文章信息

相关主题

最新内容

《Palantir的科技生态系统》

《Palantir的科技生态系统》

专知会员服务

1+阅读 · 今天15:23

《脑机接口：拓展神经前沿及其战略意涵》最新报告

《脑机接口：拓展神经前沿及其战略意涵》最新报告

专知会员服务

2+阅读 · 今天15:18

《美军联合跨部门特遣部队401：反无人机系统表征通用标准（C4）》最新报告（中文版）

《美军联合跨部门特遣部队401：反无人机系统表征通用标准（C4）》最新报告（中文版）

专知会员服务

4+阅读 · 今天15:00

《反无人机系统传感器融合》90页报告

《反无人机系统传感器融合》90页报告

专知会员服务

4+阅读 · 今天14:57

运用人工智能与卫星通信驱散“战争迷雾”

运用人工智能与卫星通信驱散“战争迷雾”

专知会员服务

2+阅读 · 今天14:45

ACL 2026 | LLMSurgeon：从生成文本诊断大模型训练数据

ACL 2026 | LLMSurgeon：从生成文本诊断大模型训练数据

专知会员服务

0+阅读 · 今天14:18

【综述】世界模型：架构、方法、推理与应用全景

【综述】世界模型：架构、方法、推理与应用全景

专知会员服务

0+阅读 · 今天14:16

ICML 2026 | Sheaf-ADMM：用可微优化学习多智能体协调

ICML 2026 | Sheaf-ADMM：用可微优化学习多智能体协调

专知会员服务

4+阅读 · 6月1日

综述 | OPSD：大语言模型的在线策略自蒸馏

综述 | OPSD：大语言模型的在线策略自蒸馏

专知会员服务

3+阅读 · 6月1日

算法化战争：人工智能时代的新范式（万字长文）

算法化战争：人工智能时代的新范式（万字长文）

专知会员服务

11+阅读 · 6月1日

帕兰蒂尔Maven：军事人工智能的新纪元

帕兰蒂尔Maven：军事人工智能的新纪元

专知会员服务

8+阅读 · 6月1日

《军事网络取证系统中的人工智能驱动情报融合：帕兰蒂尔公司“Maven智能系统”案例研究》

《军事网络取证系统中的人工智能驱动情报融合：帕兰蒂尔公司“Maven智能系统”案例研究》

专知会员服务

10+阅读 · 6月1日

《扩展主权人工智能操作系统：将Symphony作为帕兰蒂尔Foundry与英伟达的计算本体》

《扩展主权人工智能操作系统：将Symphony作为帕兰蒂尔Foundry与英伟达的计算本体》

专知会员服务

10+阅读 · 6月1日

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

专知会员服务

14+阅读 · 5月31日

比利时发布用于实时战场军事装备识别的离线人工智能系统

比利时发布用于实时战场军事装备识别的离线人工智能系统

专知会员服务

6+阅读 · 5月31日

相关VIP内容

【ETHZ博士论文】算法补救的进展：确保因果一致性、公平性和鲁棒性，233页pdf

【ETHZ博士论文】算法补救的进展：确保因果一致性、公平性和鲁棒性，233页pdf

专知会员服务

29+阅读 · 2023年11月26日

MIT最新论文《对可解释特征的需求：动机和分类》：在机器学习模型的组成元素中建立可解释性

MIT最新论文《对可解释特征的需求：动机和分类》：在机器学习模型的组成元素中建立可解释性

专知会员服务

25+阅读 · 2022年6月30日

【AAAI 2022】机器学习模型的解释方法效果如何？MIT、微软学者为你解读，Do Feature Attribution Methods Correctly Attribute Features?

【AAAI 2022】机器学习模型的解释方法效果如何？MIT、微软学者为你解读，Do Feature Attribution Methods Correctly Attribute Features?

专知会员服务

31+阅读 · 2022年3月12日

【KDD 2021】算法公平性解释框架FACTS

专知会员服务

24+阅读 · 2021年8月27日

【斯坦福博士论文】机器学习的模型解释和数据评估，206页pdf

专知会员服务

128+阅读 · 2021年8月3日

可信机器学习的公平性综述

可信机器学习的公平性综述

专知会员服务

69+阅读 · 2021年2月23日

【SIGIR2020】基于知识图谱的公平感知可解释推荐，Fairness-Aware Explainable Recommendation over Knowledge Graphs

【SIGIR2020】基于知识图谱的公平感知可解释推荐，Fairness-Aware Explainable Recommendation over Knowledge Graphs

专知会员服务

47+阅读 · 2020年6月3日

【卡内基梅隆大学-CMU】机器学习中的公平性，Learning Fair Representations

【卡内基梅隆大学-CMU】机器学习中的公平性，Learning Fair Representations

专知会员服务

38+阅读 · 2020年2月29日

可视化特征属性基线的影响，Visualizing the Impact of Feature Attribution Baselines

可视化特征属性基线的影响，Visualizing the Impact of Feature Attribution Baselines

专知会员服务

10+阅读 · 2020年1月16日

【2020密歇根大学论文】基于学习的序列决策算法的公平性综述论文，Fairness in Learning-Based Sequential Decision Algorithms: A Survey

【2020密歇根大学论文】基于学习的序列决策算法的公平性综述论文，Fairness in Learning-Based Sequential Decision Algorithms: A Survey

专知会员服务

22+阅读 · 2020年1月15日

热门VIP内容

开通专知VIP会员享更多权益服务

《脑机接口：拓展神经前沿及其战略意涵》最新报告

《反无人机系统传感器融合》90页报告

《Palantir的科技生态系统》

《美军联合跨部门特遣部队401：反无人机系统表征通用标准（C4）》最新报告（中文版）

相关资讯

【NIPS2019】Infidelity and Sensitivity：模型可解释性方法的定量评估

【NIPS2019】Infidelity and Sensitivity：模型可解释性方法的定量评估

AINLP

19+阅读 · 2020年6月14日

【经典书】精通机器学习特征工程，中文版，178页pdf

【经典书】精通机器学习特征工程，中文版，178页pdf

专知

135+阅读 · 2020年2月15日

《机器学习与公平性》新书发布，附127页PDF下载

《机器学习与公平性》新书发布，附127页PDF下载

专知

25+阅读 · 2019年9月13日

今日面试题分享：请写出你了解的机器学习特征工程操作，以及它的意义

今日面试题分享：请写出你了解的机器学习特征工程操作，以及它的意义

七月在线实验室

39+阅读 · 2019年3月20日

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

AI100

11+阅读 · 2018年9月4日

【干货】理解特征工程Part 2——类别数据（附代码）

【干货】理解特征工程Part 2——类别数据（附代码）

专知

16+阅读 · 2018年6月8日

一文看懂常用特征工程方法

一文看懂常用特征工程方法

AI研习社

17+阅读 · 2018年5月2日

【学界】机器学习模型的“可解释性”到底有多重要？

【学界】机器学习模型的“可解释性”到底有多重要？

GAN生成式对抗网络

12+阅读 · 2018年3月3日

推荐｜机器学习中的模型评价、模型选择和算法选择！

推荐｜机器学习中的模型评价、模型选择和算法选择！

全球人工智能

10+阅读 · 2018年2月5日

特征工程的特征理解（一）

特征工程的特征理解（一）

机器学习研究会

10+阅读 · 2017年10月23日

相关论文

Disentangled Feature Importance

Arxiv

0+阅读 · 3月16日

Causality Is Key to Understand and Balance Multiple Goals in Trustworthy ML and Foundation Models

Causality Is Key to Understand and Balance Multiple Goals in Trustworthy ML and Foundation Models

Arxiv

0+阅读 · 3月13日

No evaluation without fair representation : Impact of label and selection bias on the evaluation, performance and mitigation of classification models

Arxiv

0+阅读 · 3月10日

An Experimental Study on Fairness-aware Machine Learning for Credit Scoring Problems

Arxiv

0+阅读 · 3月5日

cc-Shapley: Measuring Multivariate Feature Importance Needs Causal Context

Arxiv

0+阅读 · 3月5日

Aggregate Models, Not Explanations: Improving Feature Importance Estimation

Arxiv

0+阅读 · 2月12日

Empirical Likelihood-Based Fairness Auditing: Distribution-Free Certification and Flagging

Arxiv

0+阅读 · 2月12日

Double Fairness Policy Learning: Integrating Action Fairness and Outcome Fairness in Decision-making

Arxiv

0+阅读 · 2月9日

Understanding Fairness and Prediction Error through Subspace Decomposition and Influence Analysis

Arxiv

0+阅读 · 2月7日

Fix Representation (Optimally) Before Fairness: Finite-Sample Shrinkage Population Correction and the True Price of Fairness Under Subpopulation Shift

Arxiv

0+阅读 · 2月5日

相关基金

基于分类能力结构度量与类相关性关系保留的特征选取方法研究

国家自然科学基金

1+阅读 · 2017年12月31日

评估出生缺陷风险的父源性表观遗传学标志物--相关印记基因筛选

国家自然科学基金

0+阅读 · 2016年12月31日

基于复杂语义的个性化图像集摘要研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于生态演替的文本大数据特征学习研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于记忆的不变图像特征学习方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于领域知识和链路预测的个性化推荐研究

国家自然科学基金

4+阅读 · 2014年12月31日

在线服务信誉可比较性及其保障机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

广义线性模型的组变量选择及其在信用评分中的应用

国家自然科学基金

2+阅读 · 2014年12月31日

战略环境评价有效性评估指标体系与评估方法研究

国家自然科学基金

10+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员