Disentangled Feature Importance - 专知论文

会员服务 ·

0

潜在 · 传输 · 泛函 · 操作 · 特征选择 ·

Disentangled Feature Importance

翻译：解缠特征重要性

Jin-Hong Du,Kathryn Roeder,Larry Wasserman

from arxiv, 29 main and 44 supplementary pages

When predictors are statistically dependent, the appropriate definition of feature importance depends on the operational goal. Conditional-incremental measures are well-suited for feature selection, acquisition, and compression, where shared predictive information is treated as redundancy. For post-hoc interpretation, however, the goal is often to attribute predictive signals across correlated measurement channels. We introduce Disentangled Feature Importance (DFI), a population-level attribution framework for this setting. DFI maps covariates to an independent latent representation under a specified entropic optimal transport geometry, computes latent importance, and attributes it back to the original covariates through barycentric sensitivities. We show that broad conditional-incremental FI functionals target conditional incremental predictive value under squared-error loss, and therefore answer a different question from attribution of shared predictive signal under dependence. Under fixed transport cost, reference law, and regularization level, DFI defines a well-specified family of estimands. Latent scores admit a functional ANOVA interpretation, and in the Gaussian linear case, the attributed DFI recovers the classical $R^2$ decomposition for correlated regressors. We derive influence-function-based inference under nuisance-rate and smoothness conditions, and show in simulations and an HIV-1 neutralization-resistance analysis that DFI yields stable, interpretable, uncertainty-quantified attributions of shared predictive signal.

翻译：当预测变量存在统计依赖时，特征重要性的恰当定义取决于操作目标。条件增量测度适用于特征选择、获取和压缩，其中共享预测信息被视为冗余。然而，对于事后解释，目标通常是在相关测量通道间归因预测信号。我们针对此场景提出一种总体层面归因框架——解缠特征重要性（DFI）。DFI在指定熵最优传输几何下将协变量映射至独立潜在表示，计算潜在重要性，并通过重心灵敏度将其归因回原始协变量。我们证明，在平方误差损失下，广义条件增量FI泛函刻画的正是条件增量预测值，因此其回答的问题与依赖条件下共享预测信号归因不同。在固定传输成本、参考定律和正则化水平下，DFI定义了一个良定义的估计量族。潜在得分可进行泛函ANOVA解释；在高斯线性情形下，归因所得DFI恢复相关回归变量的经典$R^2$分解。我们在干扰率和平滑性条件下推导出基于影响函数的推断，并通过模拟实验和HIV-1中和耐药性分析表明，DFI能对共享预测信号提供稳定、可解释且带不确定性量化的归因结果。

0

相关内容

清华最新《解耦表征学习》综述

清华最新《解耦表征学习》综述

专知会员服务

71+阅读 · 2023年2月23日

《循环平稳特征的多重共线性诊断》美海军水面作战中心2022最新论文

《循环平稳特征的多重共线性诊断》美海军水面作战中心2022最新论文

专知会员服务

16+阅读 · 2022年12月14日

MIT最新论文《对可解释特征的需求：动机和分类》：在机器学习模型的组成元素中建立可解释性

MIT最新论文《对可解释特征的需求：动机和分类》：在机器学习模型的组成元素中建立可解释性

专知会员服务

25+阅读 · 2022年6月30日

【NeurIPS2021】基于预测信息识别输入特征的细粒度神经网络解释

专知会员服务

12+阅读 · 2021年10月6日

【ICML2021】从相关数据中学习的解纠缠表示

专知会员服务

19+阅读 · 2021年9月19日

【NeurIPS2020-FB】学习具有可解码信息瓶颈的最优表示

【NeurIPS2020-FB】学习具有可解码信息瓶颈的最优表示

专知会员服务

23+阅读 · 2020年10月13日

【推荐】用于解缠学习的半监督StyleGAN，Semi-Supervised StyleGAN for Disentanglement Learning

【推荐】用于解缠学习的半监督StyleGAN，Semi-Supervised StyleGAN for Disentanglement Learning

专知会员服务

36+阅读 · 2020年3月13日

【CVPR2020】强化特征点，Reinforced Feature Points: Optimizing Feature Detection and Description for a High-Level Task

【CVPR2020】强化特征点，Reinforced Feature Points: Optimizing Feature Detection and Description for a High-Level Task

专知会员服务

49+阅读 · 2020年2月25日

【经典书】精通机器学习特征工程，中文版，178页pdf

【经典书】精通机器学习特征工程，中文版，178页pdf

专知会员服务

360+阅读 · 2020年2月15日

可视化特征属性基线的影响，Visualizing the Impact of Feature Attribution Baselines

可视化特征属性基线的影响，Visualizing the Impact of Feature Attribution Baselines

专知会员服务

10+阅读 · 2020年1月16日

【经典书】精通机器学习特征工程，中文版，178页pdf

【经典书】精通机器学习特征工程，中文版，178页pdf

专知

135+阅读 · 2020年2月15日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

今日面试题分享：请写出你了解的机器学习特征工程操作，以及它的意义

今日面试题分享：请写出你了解的机器学习特征工程操作，以及它的意义

七月在线实验室

39+阅读 · 2019年3月20日

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

AI100

11+阅读 · 2018年9月4日

【干货合集】一文读懂特征工程

【干货合集】一文读懂特征工程

七月在线实验室

13+阅读 · 2018年8月2日

【干货】理解特征工程Part 2——类别数据（附代码）

【干货】理解特征工程Part 2——类别数据（附代码）

专知

16+阅读 · 2018年6月8日

一文看懂常用特征工程方法

一文看懂常用特征工程方法

AI研习社

17+阅读 · 2018年5月2日

【学界】机器学习模型的“可解释性”到底有多重要？

【学界】机器学习模型的“可解释性”到底有多重要？

GAN生成式对抗网络

12+阅读 · 2018年3月3日

特征工程的特征理解（一）

特征工程的特征理解（一）

机器学习研究会

10+阅读 · 2017年10月23日

特定目标情感分析——神经网络这是要逆天么

特定目标情感分析——神经网络这是要逆天么

计算机研究与发展

14+阅读 · 2017年9月5日

基于分类能力结构度量与类相关性关系保留的特征选取方法研究

国家自然科学基金

1+阅读 · 2017年12月31日

面向特征提取的低秩与稀疏图嵌入理论与算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

小特征有限域离散对数问题研究及其在密码学中的意义

国家自然科学基金

0+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于生态演替的文本大数据特征学习研究

国家自然科学基金

1+阅读 · 2015年12月31日

几类含∞-Laplace算子的特征值问题的研究

国家自然科学基金

1+阅读 · 2015年12月31日

协同特征CAD中支持多用户意图融合的关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向生物特征识别的鲁棒判别结构化特征表示方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

矩阵分解问题的优化算法与理论

国家自然科学基金

8+阅读 · 2014年12月31日

Conditional Local Importance by Quantile Expectations

Arxiv

0+阅读 · 6月15日

DifFRACT: Diffusion Feature Reconstruction and Attribution for Circuit Tracing

Arxiv

0+阅读 · 6月14日

Cluster LOCO: Feature Importance For Interpreting Clusters

Arxiv

0+阅读 · 6月12日

From Isolation to Entanglement: When Do Interpretability Methods Identify and Disentangle Known Concepts?

Arxiv

0+阅读 · 6月10日

Provable Recovery of Locally Important Signed Features and Interactions from Random Forest

Arxiv

0+阅读 · 6月10日

Beyond Explaining Predictions: Logic-Based Explanations for Confidence in Machine Learning Models

Arxiv

0+阅读 · 6月9日

On Stability and Decomposition of Sample Quantiles under Heavy-Tailed Distributions

Arxiv

0+阅读 · 5月22日

On the Fragility of Data Attribution When Learning Is Distributed

Arxiv

0+阅读 · 5月15日

Cross-Model Consistency of Feature Importance in Electrospinning: Separating Robust from Model-Dependent Features

Arxiv

0+阅读 · 5月12日

Cross-Model Consistency of Feature Importance in Electrospinning: Separating Robust from Model-Dependent Features

Arxiv

0+阅读 · 5月6日

VIP会员

文章信息

相关主题

最新内容

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

5+阅读 · 今天2:06

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

4+阅读 · 今天1:37

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

3+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

5+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

4+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

6+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

6+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

3+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

5+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

5+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

4+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

3+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

多模态代码智能综述：从视觉输入到可执行代码系统

多模态代码智能综述：从视觉输入到可执行代码系统

专知会员服务

8+阅读 · 6月16日

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

专知会员服务

6+阅读 · 6月16日

相关VIP内容

清华最新《解耦表征学习》综述

清华最新《解耦表征学习》综述

专知会员服务

71+阅读 · 2023年2月23日

《循环平稳特征的多重共线性诊断》美海军水面作战中心2022最新论文

《循环平稳特征的多重共线性诊断》美海军水面作战中心2022最新论文

专知会员服务

16+阅读 · 2022年12月14日

MIT最新论文《对可解释特征的需求：动机和分类》：在机器学习模型的组成元素中建立可解释性

MIT最新论文《对可解释特征的需求：动机和分类》：在机器学习模型的组成元素中建立可解释性

专知会员服务

25+阅读 · 2022年6月30日

【NeurIPS2021】基于预测信息识别输入特征的细粒度神经网络解释

专知会员服务

12+阅读 · 2021年10月6日

【ICML2021】从相关数据中学习的解纠缠表示

专知会员服务

19+阅读 · 2021年9月19日

【NeurIPS2020-FB】学习具有可解码信息瓶颈的最优表示

【NeurIPS2020-FB】学习具有可解码信息瓶颈的最优表示

专知会员服务

23+阅读 · 2020年10月13日

【推荐】用于解缠学习的半监督StyleGAN，Semi-Supervised StyleGAN for Disentanglement Learning

【推荐】用于解缠学习的半监督StyleGAN，Semi-Supervised StyleGAN for Disentanglement Learning

专知会员服务

36+阅读 · 2020年3月13日

【CVPR2020】强化特征点，Reinforced Feature Points: Optimizing Feature Detection and Description for a High-Level Task

【CVPR2020】强化特征点，Reinforced Feature Points: Optimizing Feature Detection and Description for a High-Level Task

专知会员服务

49+阅读 · 2020年2月25日

【经典书】精通机器学习特征工程，中文版，178页pdf

【经典书】精通机器学习特征工程，中文版，178页pdf

专知会员服务

360+阅读 · 2020年2月15日

可视化特征属性基线的影响，Visualizing the Impact of Feature Attribution Baselines

可视化特征属性基线的影响，Visualizing the Impact of Feature Attribution Baselines

专知会员服务

10+阅读 · 2020年1月16日

热门VIP内容

开通专知VIP会员享更多权益服务

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

相关资讯

【经典书】精通机器学习特征工程，中文版，178页pdf

【经典书】精通机器学习特征工程，中文版，178页pdf

专知

135+阅读 · 2020年2月15日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

今日面试题分享：请写出你了解的机器学习特征工程操作，以及它的意义

今日面试题分享：请写出你了解的机器学习特征工程操作，以及它的意义

七月在线实验室

39+阅读 · 2019年3月20日

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

手动特征工程已经OUT了！自动特征工程才是改进机器学习的方式

AI100

11+阅读 · 2018年9月4日

【干货合集】一文读懂特征工程

【干货合集】一文读懂特征工程

七月在线实验室

13+阅读 · 2018年8月2日

【干货】理解特征工程Part 2——类别数据（附代码）

【干货】理解特征工程Part 2——类别数据（附代码）

专知

16+阅读 · 2018年6月8日

一文看懂常用特征工程方法

一文看懂常用特征工程方法

AI研习社

17+阅读 · 2018年5月2日

【学界】机器学习模型的“可解释性”到底有多重要？

【学界】机器学习模型的“可解释性”到底有多重要？

GAN生成式对抗网络

12+阅读 · 2018年3月3日

特征工程的特征理解（一）

特征工程的特征理解（一）

机器学习研究会

10+阅读 · 2017年10月23日

特定目标情感分析——神经网络这是要逆天么

特定目标情感分析——神经网络这是要逆天么

计算机研究与发展

14+阅读 · 2017年9月5日

相关论文

Conditional Local Importance by Quantile Expectations

Arxiv

0+阅读 · 6月15日

DifFRACT: Diffusion Feature Reconstruction and Attribution for Circuit Tracing

Arxiv

0+阅读 · 6月14日

Cluster LOCO: Feature Importance For Interpreting Clusters

Arxiv

0+阅读 · 6月12日

From Isolation to Entanglement: When Do Interpretability Methods Identify and Disentangle Known Concepts?

Arxiv

0+阅读 · 6月10日

Provable Recovery of Locally Important Signed Features and Interactions from Random Forest

Arxiv

0+阅读 · 6月10日

Beyond Explaining Predictions: Logic-Based Explanations for Confidence in Machine Learning Models

Arxiv

0+阅读 · 6月9日

On Stability and Decomposition of Sample Quantiles under Heavy-Tailed Distributions

Arxiv

0+阅读 · 5月22日

On the Fragility of Data Attribution When Learning Is Distributed

Arxiv

0+阅读 · 5月15日

Cross-Model Consistency of Feature Importance in Electrospinning: Separating Robust from Model-Dependent Features

Arxiv

0+阅读 · 5月12日

Cross-Model Consistency of Feature Importance in Electrospinning: Separating Robust from Model-Dependent Features

Arxiv

0+阅读 · 5月6日

相关基金

基于分类能力结构度量与类相关性关系保留的特征选取方法研究

国家自然科学基金

1+阅读 · 2017年12月31日

面向特征提取的低秩与稀疏图嵌入理论与算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

小特征有限域离散对数问题研究及其在密码学中的意义

国家自然科学基金

0+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于生态演替的文本大数据特征学习研究

国家自然科学基金

1+阅读 · 2015年12月31日

几类含∞-Laplace算子的特征值问题的研究

国家自然科学基金

1+阅读 · 2015年12月31日

协同特征CAD中支持多用户意图融合的关键技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向生物特征识别的鲁棒判别结构化特征表示方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

矩阵分解问题的优化算法与理论

国家自然科学基金

8+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员