$φ$-test: Global Feature Selection and Inference for Shapley Additive Explanations - 专知论文

会员服务 ·

0

推断 · 全局特征 · 特征选择 · 黑盒 · 显著性 ·

$φ$-test: Global Feature Selection and Inference for Shapley Additive Explanations

翻译：φ-检验：面向Shapley加性解释的全局特征选择与推断方法

Dongseok Kim,Hyoungsun Choi,Mohamed Jismy Aashik Rasool,Gisung Oh

from arxiv, Revised for clarity and correctness; improved exposition and fixed minor issues

We propose $φ$-test, a global feature-selection and significance procedure for black-box predictors that combines Shapley attributions with selective inference. Given a trained model and an evaluation dataset, $φ$-test performs SHAP-guided screening and fits a linear surrogate on the screened features via a selection rule with a tractable selective-inference form. For each retained feature, it outputs a Shapley-based global score, a surrogate coefficient, and post-selection $p$-values and confidence intervals in a global feature-importance table. Experiments on real tabular regression tasks with tree-based and neural backbones suggest that $φ$-test can retain much of the predictive ability of the original model while using only a few features and producing feature sets that remain fairly stable across resamples and backbone classes. In these settings, $φ$-test acts as a practical global explanation layer linking Shapley-based importance summaries with classical statistical inference.

翻译：本文提出φ-检验——一种结合Shapley归因与选择性推断的黑盒预测器全局特征选择及显著性检验方法。给定训练完成的模型与评估数据集，φ-检验通过SHAP引导的筛选机制执行特征初选，并基于具有可处理选择性推断形式的选取规则，在筛选后的特征上拟合线性替代模型。对于每个保留的特征，该方法在全局特征重要性表中输出基于Shapley的全局评分、替代模型系数，以及选择后p值与置信区间。在基于树模型与神经网络架构的真实表格数据回归任务上的实验表明，φ-检验在仅使用少量特征的情况下，仍能保持原始模型的大部分预测能力，且生成的特征集在重抽样与不同骨干模型类别间保持较高稳定性。在此类场景中，φ-检验可作为实用的全局解释层，将基于Shapley的重要性度量与经典统计推断相连接。

0

相关内容

弹药异常检测《使用机器学习进行缺陷表征》最佳论文，MODSIM World 2023

弹药异常检测《使用机器学习进行缺陷表征》最佳论文，MODSIM World 2023

专知会员服务

36+阅读 · 2023年7月22日

【AAAI2023】DPText-DETR: 基于动态点query的场景文本检测，更高更快更鲁棒

【AAAI2023】DPText-DETR: 基于动态点query的场景文本检测，更高更快更鲁棒

专知会员服务

17+阅读 · 2023年1月23日

【MIT博士论文】非参数因果推理的算法方法，424页pdf

【MIT博士论文】非参数因果推理的算法方法，424页pdf

专知会员服务

84+阅读 · 2022年9月20日

因果如何用于推荐？清华等最新《推荐系统中的因果推理》综述论文，29页pdf阐述因果推荐方法体系

因果如何用于推荐？清华等最新《推荐系统中的因果推理》综述论文，29页pdf阐述因果推荐方法体系

专知会员服务

48+阅读 · 2022年8月31日

牛津大学等《多智能体系统的博弈论验证》最新论文，Rational verification: game-theoretic verification of multi-agent systems

牛津大学等《多智能体系统的博弈论验证》最新论文，Rational verification: game-theoretic verification of multi-agent systems

专知会员服务

43+阅读 · 2022年4月4日

南开大学范登平的博士论文《认知规律启发的显著性物体检测方法与评测》

南开大学范登平的博士论文《认知规律启发的显著性物体检测方法与评测》

专知会员服务

23+阅读 · 2021年11月25日

基于深度学习的显著性目标检测方法综述

专知会员服务

38+阅读 · 2021年8月27日

最新「深度学习人脸检测」综述论文，17页pdf概述50种人脸检测SOTA方法

最新「深度学习人脸检测」综述论文，17页pdf概述50种人脸检测SOTA方法

专知会员服务

39+阅读 · 2021年4月3日

【KDD2019|讲座推荐】假设检验与统计声音模式挖掘：Hypothesis Testing and Statistically-sound Pattern Mining

【KDD2019|讲座推荐】假设检验与统计声音模式挖掘：Hypothesis Testing and Statistically-sound Pattern Mining

专知会员服务

22+阅读 · 2019年12月6日

【显著性目标检测| 2019最新综述】深度学习时代的显著目标检测（Salient Object Detection in the Deep Learning Era: An In-Depth Survey），附PDF

【显著性目标检测| 2019最新综述】深度学习时代的显著目标检测（Salient Object Detection in the Deep Learning Era: An In-Depth Survey），附PDF

专知会员服务

42+阅读 · 2019年11月23日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

【WWW2020-华为诺亚方舟论文】元学习推荐系统MetaSelector

【WWW2020-华为诺亚方舟论文】元学习推荐系统MetaSelector

专知

11+阅读 · 2020年2月10日

局部学习的特征选择：Local-Learning-Based Feature Selection

局部学习的特征选择：Local-Learning-Based Feature Selection

我爱读PAMI

14+阅读 · 2019年9月20日

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

全球人工智能

13+阅读 · 2019年4月30日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

深度学习时代的目标检测算法

深度学习时代的目标检测算法

炼数成金订阅号

40+阅读 · 2018年3月19日

综述：深度学习时代的目标检测算法

综述：深度学习时代的目标检测算法

极市平台

27+阅读 · 2018年3月17日

微信OCR(1)——公众号图文识别中的文本检测

微信OCR(1)——公众号图文识别中的文本检测

微信AI

17+阅读 · 2017年11月22日

深度学习目标检测模型全面综述：Faster R-CNN、R-FCN和SSD

深度学习目标检测模型全面综述：Faster R-CNN、R-FCN和SSD

深度学习世界

10+阅读 · 2017年9月18日

推荐｜北大：一种基于新闻特征抽取和循环神经网络的股票预测方法

推荐｜北大：一种基于新闻特征抽取和循环神经网络的股票预测方法

全球人工智能

14+阅读 · 2017年7月26日

基于分类能力结构度量与类相关性关系保留的特征选取方法研究

国家自然科学基金

1+阅读 · 2017年12月31日

基于视觉特性的目标检测算法研究

国家自然科学基金

4+阅读 · 2015年12月31日

组合测试用例优先排序算法及选择策略研究

国家自然科学基金

9+阅读 · 2015年12月31日

面向生物特征识别的鲁棒判别结构化特征表示方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

试验设计中的模型选择

国家自然科学基金

6+阅读 · 2014年12月31日

多重比较中控制FDR的有效检验方法

国家自然科学基金

0+阅读 · 2014年12月31日

非线性约束全局优化的新方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

多元数据与函数型数据的序贯检验方法与控制图研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于似然函数的统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

高维稀疏统计模型中的变量选择与检验

国家自然科学基金

1+阅读 · 2014年12月31日

AnyUp: Universal Feature Upsampling

Arxiv

0+阅读 · 2月16日

GRASP: group-Shapley feature selection for patients

Arxiv

0+阅读 · 2月11日

Statistical Inference and Learning for Shapley Additive Explanations (SHAP)

Arxiv

0+阅读 · 2月11日

Online Selective Conformal Prediction with Asymmetric Rules: A Permutation Test Approach

Arxiv

0+阅读 · 2月10日

LLM-FS: Zero-Shot Feature Selection for Effective and Interpretable Malware Detection

Arxiv

0+阅读 · 2月10日

An Odd Estimator for Shapley Values

Arxiv

0+阅读 · 2月1日

Retrieval-Infused Reasoning Sandbox: A Benchmark for Decoupling Retrieval and Reasoning Capabilities

Arxiv

0+阅读 · 1月29日

Fully Functional Weighted Testing for Abrupt and Gradual Location Changes in Functional Time Series

Arxiv

0+阅读 · 1月22日

An Evaluation of Explanation Methods for Black-Box Detectors of Machine-Generated Text

Arxiv

0+阅读 · 1月20日

Selecting and Testing Asset Pricing Models: A Stepwise Approach

Arxiv

0+阅读 · 1月15日

VIP会员

文章信息

相关主题

最新内容

非对称优势：美海军开发低成本反无人机技术

非对称优势：美海军开发低成本反无人机技术

专知会员服务

4+阅读 · 今天4:39

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

专知会员服务

12+阅读 · 今天2:52

《美战争部小企业创新研究（SBIR）计划》

《美战争部小企业创新研究（SBIR）计划》

专知会员服务

5+阅读 · 今天2:48

《军事模拟：将军事条令与目标融入AI智能体》

《军事模拟：将军事条令与目标融入AI智能体》

专知会员服务

8+阅读 · 今天2:43

【NTU博士论文】3D人体动作生成

【NTU博士论文】3D人体动作生成

专知会员服务

6+阅读 · 4月24日

DeepSeek-V4：百万 Token 上下文背后，大模型正在进入“长程智能”时代（附中英文pdf版）

DeepSeek-V4：百万 Token 上下文背后，大模型正在进入“长程智能”时代（附中英文pdf版）

专知会员服务

7+阅读 · 4月24日

以色列军事技术对美国军力发展的持续性赋能

以色列军事技术对美国军力发展的持续性赋能

专知会员服务

8+阅读 · 4月24日

战场之外的较量：美伊冲突中的认知战与心理博弈

战场之外的较量：美伊冲突中的认知战与心理博弈

专知会员服务

6+阅读 · 4月24日

俄乌战争中乌克兰防空能力演变与见解（中文版）

俄乌战争中乌克兰防空能力演变与见解（中文版）

专知会员服务

6+阅读 · 4月24日

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

专知会员服务

9+阅读 · 4月24日

《深度强化学习在兵棋推演中的应用》40页报告

《深度强化学习在兵棋推演中的应用》40页报告

专知会员服务

13+阅读 · 4月24日

《多域作战面临复杂现实》

《多域作战面临复杂现实》

专知会员服务

9+阅读 · 4月24日

《印度的多域作战：条令与能力发展》报告

《印度的多域作战：条令与能力发展》报告

专知会员服务

4+阅读 · 4月24日

《是“修复情报”还是修复部队？阿富汗反叛乱行动中的美军情报调整》400页

《是“修复情报”还是修复部队？阿富汗反叛乱行动中的美军情报调整》400页

专知会员服务

4+阅读 · 4月24日

美军的算法化军备库：无人机优势计划（DDP）、复制者倡议（Replicator）与联合全域指挥控制（JADC2）如何重写战争规则

美军的算法化军备库：无人机优势计划（DDP）、复制者倡议（Replicator）与联合全域指挥控制（JADC2）如何重写战争规则

专知会员服务

5+阅读 · 4月24日

相关VIP内容

弹药异常检测《使用机器学习进行缺陷表征》最佳论文，MODSIM World 2023

弹药异常检测《使用机器学习进行缺陷表征》最佳论文，MODSIM World 2023

专知会员服务

36+阅读 · 2023年7月22日

【AAAI2023】DPText-DETR: 基于动态点query的场景文本检测，更高更快更鲁棒

【AAAI2023】DPText-DETR: 基于动态点query的场景文本检测，更高更快更鲁棒

专知会员服务

17+阅读 · 2023年1月23日

【MIT博士论文】非参数因果推理的算法方法，424页pdf

【MIT博士论文】非参数因果推理的算法方法，424页pdf

专知会员服务

84+阅读 · 2022年9月20日

因果如何用于推荐？清华等最新《推荐系统中的因果推理》综述论文，29页pdf阐述因果推荐方法体系

因果如何用于推荐？清华等最新《推荐系统中的因果推理》综述论文，29页pdf阐述因果推荐方法体系

专知会员服务

48+阅读 · 2022年8月31日

牛津大学等《多智能体系统的博弈论验证》最新论文，Rational verification: game-theoretic verification of multi-agent systems

牛津大学等《多智能体系统的博弈论验证》最新论文，Rational verification: game-theoretic verification of multi-agent systems

专知会员服务

43+阅读 · 2022年4月4日

南开大学范登平的博士论文《认知规律启发的显著性物体检测方法与评测》

南开大学范登平的博士论文《认知规律启发的显著性物体检测方法与评测》

专知会员服务

23+阅读 · 2021年11月25日

基于深度学习的显著性目标检测方法综述

专知会员服务

38+阅读 · 2021年8月27日

最新「深度学习人脸检测」综述论文，17页pdf概述50种人脸检测SOTA方法

最新「深度学习人脸检测」综述论文，17页pdf概述50种人脸检测SOTA方法

专知会员服务

39+阅读 · 2021年4月3日

【KDD2019|讲座推荐】假设检验与统计声音模式挖掘：Hypothesis Testing and Statistically-sound Pattern Mining

【KDD2019|讲座推荐】假设检验与统计声音模式挖掘：Hypothesis Testing and Statistically-sound Pattern Mining

专知会员服务

22+阅读 · 2019年12月6日

【显著性目标检测| 2019最新综述】深度学习时代的显著目标检测（Salient Object Detection in the Deep Learning Era: An In-Depth Survey），附PDF

【显著性目标检测| 2019最新综述】深度学习时代的显著目标检测（Salient Object Detection in the Deep Learning Era: An In-Depth Survey），附PDF

专知会员服务

42+阅读 · 2019年11月23日

热门VIP内容

开通专知VIP会员享更多权益服务

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

《军事模拟：将军事条令与目标融入AI智能体》

非对称优势：美海军开发低成本反无人机技术

《美战争部小企业创新研究（SBIR）计划》

相关资讯

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

【WWW2020-华为诺亚方舟论文】元学习推荐系统MetaSelector

【WWW2020-华为诺亚方舟论文】元学习推荐系统MetaSelector

专知

11+阅读 · 2020年2月10日

局部学习的特征选择：Local-Learning-Based Feature Selection

局部学习的特征选择：Local-Learning-Based Feature Selection

我爱读PAMI

14+阅读 · 2019年9月20日

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

全球人工智能

13+阅读 · 2019年4月30日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

深度学习时代的目标检测算法

深度学习时代的目标检测算法

炼数成金订阅号

40+阅读 · 2018年3月19日

综述：深度学习时代的目标检测算法

综述：深度学习时代的目标检测算法

极市平台

27+阅读 · 2018年3月17日

微信OCR(1)——公众号图文识别中的文本检测

微信OCR(1)——公众号图文识别中的文本检测

微信AI

17+阅读 · 2017年11月22日

深度学习目标检测模型全面综述：Faster R-CNN、R-FCN和SSD

深度学习目标检测模型全面综述：Faster R-CNN、R-FCN和SSD

深度学习世界

10+阅读 · 2017年9月18日

推荐｜北大：一种基于新闻特征抽取和循环神经网络的股票预测方法

推荐｜北大：一种基于新闻特征抽取和循环神经网络的股票预测方法

全球人工智能

14+阅读 · 2017年7月26日

相关论文

AnyUp: Universal Feature Upsampling

Arxiv

0+阅读 · 2月16日

GRASP: group-Shapley feature selection for patients

Arxiv

0+阅读 · 2月11日

Statistical Inference and Learning for Shapley Additive Explanations (SHAP)

Arxiv

0+阅读 · 2月11日

Online Selective Conformal Prediction with Asymmetric Rules: A Permutation Test Approach

Arxiv

0+阅读 · 2月10日

LLM-FS: Zero-Shot Feature Selection for Effective and Interpretable Malware Detection

Arxiv

0+阅读 · 2月10日

An Odd Estimator for Shapley Values

Arxiv

0+阅读 · 2月1日

Retrieval-Infused Reasoning Sandbox: A Benchmark for Decoupling Retrieval and Reasoning Capabilities

Arxiv

0+阅读 · 1月29日

Fully Functional Weighted Testing for Abrupt and Gradual Location Changes in Functional Time Series

Arxiv

0+阅读 · 1月22日

An Evaluation of Explanation Methods for Black-Box Detectors of Machine-Generated Text

Arxiv

0+阅读 · 1月20日

Selecting and Testing Asset Pricing Models: A Stepwise Approach

Arxiv

0+阅读 · 1月15日

相关基金

基于分类能力结构度量与类相关性关系保留的特征选取方法研究

国家自然科学基金

1+阅读 · 2017年12月31日

基于视觉特性的目标检测算法研究

国家自然科学基金

4+阅读 · 2015年12月31日

组合测试用例优先排序算法及选择策略研究

国家自然科学基金

9+阅读 · 2015年12月31日

面向生物特征识别的鲁棒判别结构化特征表示方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

试验设计中的模型选择

国家自然科学基金

6+阅读 · 2014年12月31日

多重比较中控制FDR的有效检验方法

国家自然科学基金

0+阅读 · 2014年12月31日

非线性约束全局优化的新方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

多元数据与函数型数据的序贯检验方法与控制图研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于似然函数的统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

高维稀疏统计模型中的变量选择与检验

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员