shapr：在R和Python中使用条件Shapley值解释机器学习模型 (shapr: Explaining Machine Learning Models with Conditional Shapley Values in R and Python) - 专知论文

会员服务 ·

0

软件 · Python · 学习模型 · 工具 · 机器学习模型 ·

shapr: Explaining Machine Learning Models with Conditional Shapley Values in R and Python

翻译：shapr：在R和Python中使用条件Shapley值解释机器学习模型

Martin Jullum,Lars Henry Berge Olsen,Jon Lachmann,Annabelle Redelmeier

This paper introduces the shapr R package, a versatile tool for generating Shapley value-based prediction explanations for machine learning and statistical regression models. Moreover, the shaprpy Python library brings the core capabilities of shapr to the Python ecosystem. Shapley values originate from cooperative game theory in the 1950s, but have over the past few years become a widely used method for quantifying how a model's features/covariates contribute to specific prediction outcomes. The shapr package emphasizes conditional Shapley value estimates, providing a comprehensive range of approaches for accurately capturing feature dependencies -- a crucial aspect for correct model explanation, typically lacking in similar software. In addition to regular tabular data, the shapr R package includes specialized functionality for explaining time series forecasts. The package offers a minimal set of user functions with sensible default values for most use cases while providing extensive flexibility for advanced users to fine-tune computations. Additional features include parallelized computations, iterative estimation with convergence detection, and rich visualization tools. shapr also extends its functionality to compute causal and asymmetric Shapley values when causal information is available. Overall, the shapr and shaprpy packages aim to enhance the interpretability of predictive models within a powerful and user-friendly framework.

翻译：本文介绍了shapr R软件包，这是一个用于为机器学习和统计回归模型生成基于Shapley值的预测解释的多功能工具。此外，shaprpy Python库将shapr的核心功能引入Python生态系统。Shapley值起源于20世纪50年代的合作博弈论，但在过去几年中已成为量化模型特征/协变量如何影响特定预测结果的广泛应用方法。shapr软件包强调条件Shapley值估计，提供了一系列全面方法以准确捕捉特征依赖性——这是实现正确模型解释的关键方面，而同类软件通常缺乏此功能。除了常规表格数据外，shapr R软件包还包含专门用于解释时间序列预测的功能。该软件包通过最精简的用户函数集为大多数用例提供合理的默认值，同时为高级用户提供广泛的计算微调灵活性。附加功能包括并行计算、带收敛检测的迭代估计以及丰富的可视化工具。当因果信息可用时，shapr还能扩展其功能以计算因果和非对称Shapley值。总体而言，shapr和shaprpy软件包旨在通过强大且用户友好的框架增强预测模型的可解释性。

0

相关内容

软件（中国大陆及香港用语，台湾作软体，英文：Software）是一系列按照特定顺序组织的计算机数据和指令的集合。一般来讲软件被划分为编程语言、系统软件、应用软件和介于这两者之间的中间件。软件就是程序加文档的集合体。

【新书】Python中的深度强化学习：用于聊天机器人和大型语言模型的RLHF，650页pdf

【新书】Python中的深度强化学习：用于聊天机器人和大型语言模型的RLHF，650页pdf

专知会员服务

68+阅读 · 2024年7月18日

可解释的机器学习模型和架构

可解释的机器学习模型和架构

专知会员服务

92+阅读 · 2023年9月17日

【2023新书】用SHAP解释机器学习模型:Python示例和Shapley值理论指南，216页pdf

【2023新书】用SHAP解释机器学习模型:Python示例和Shapley值理论指南，216页pdf

专知会员服务

83+阅读 · 2023年8月31日

【干货书】Python强化学习算法:学习、理解和开发智能算法以应对人工智能挑战，356页pdf，附代码

【干货书】Python强化学习算法:学习、理解和开发智能算法以应对人工智能挑战，356页pdf，附代码

专知会员服务

58+阅读 · 2022年12月10日

【干货书】建立基于python的机器学习和深度学习模型，Build Python-based Machine Learning and Deep Learning Models

【干货书】建立基于python的机器学习和深度学习模型，Build Python-based Machine Learning and Deep Learning Models

专知会员服务

50+阅读 · 2022年5月22日

机器学习的可解释性

机器学习的可解释性

专知会员服务

179+阅读 · 2020年8月27日

【实用书】使用R语言进行深度学习的介绍，240页pdf，一步一步的指导学习和实现使用R的深度学习模型

专知会员服务

42+阅读 · 2020年5月25日

【干货】机器学习经典书PRML 最新 Python 3 代码实现，附最全 PRML 笔记视频学习资料

【干货】机器学习经典书PRML 最新 Python 3 代码实现，附最全 PRML 笔记视频学习资料

专知会员服务

179+阅读 · 2020年3月3日

【《Python机器学习(第三版)》随书代码】（Python Machine Learning (3nd edition)），威斯康星大学麦迪逊分校助理教授Sebastian Raschka、密歇根州立大学博士Vahid Mirjalili

【《Python机器学习(第三版)》随书代码】（Python Machine Learning (3nd edition)），威斯康星大学麦迪逊分校助理教授Sebastian Raschka、密歇根州立大学博士Vahid Mirjalili

专知会员服务

46+阅读 · 2019年12月3日

经典书《机器学习：概率视角》（Machine Learning: a Probabilistic Perspective）第二版Python代码，附1098页pdf下载

经典书《机器学习：概率视角》（Machine Learning: a Probabilistic Perspective）第二版Python代码，附1098页pdf下载

专知会员服务

278+阅读 · 2019年10月25日

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

专知

10+阅读 · 2022年11月17日

【Manning2020新书】R/mlr机器学习，513页pdf，Machine Learning with R

【Manning2020新书】R/mlr机器学习，513页pdf，Machine Learning with R

专知

69+阅读 · 2020年3月7日

【新书】Python机器学习实战，545页pdf，Practical Machine Learning with Python

【新书】Python机器学习实战，545页pdf，Practical Machine Learning with Python

专知

22+阅读 · 2020年2月26日

干货 | 可解释的机器学习

干货 | 可解释的机器学习

AI科技评论

20+阅读 · 2019年7月3日

R语言机器学习：xgboost的使用及其模型解释

R语言机器学习：xgboost的使用及其模型解释

R语言中文社区

11+阅读 · 2019年5月6日

可解释的机器学习

可解释的机器学习

平均机器

25+阅读 · 2019年2月25日

机器学习可解释性工具箱XAI

机器学习可解释性工具箱XAI

专知

11+阅读 · 2019年2月8日

【干货】Python机器学习机器学习项目实战3——模型解释与结果分析（附代码）

【干货】Python机器学习机器学习项目实战3——模型解释与结果分析（附代码）

专知

16+阅读 · 2018年5月24日

深度学习在CTR预估中的应用 | CTR深度模型大盘点

深度学习在CTR预估中的应用 | CTR深度模型大盘点

PaperWeekly

15+阅读 · 2018年4月11日

【干货】机器学习经典 PRML 最新 Python 代码实现，附最全 PRML 笔记视频学习资料

【干货】机器学习经典 PRML 最新 Python 代码实现，附最全 PRML 笔记视频学习资料

专知

29+阅读 · 2017年11月26日

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

6+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于缺失数据分析和信息几何理论的SAR图像自动目标识别研究

国家自然科学基金

3+阅读 · 2015年12月31日

排序与半监督学习的误差分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于先验信息压缩感知SAR成像的信息理论限及实用算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

概率图模型学习及其在数据分析中的应用研究

国家自然科学基金

16+阅读 · 2013年12月31日

Enhancing Mortality Forecasting with Ensemble Learning: A Shapley-Based Approach

Arxiv

0+阅读 · 3月4日

Local Shapley: Model-Induced Locality and Optimal Reuse in Data Valuation

Arxiv

0+阅读 · 3月4日

Enhancing the Interpretability of SHAP Values Using Large Language Models

Arxiv

0+阅读 · 3月3日

StochTree: BART-based modeling in R and Python

Arxiv

0+阅读 · 2月20日

Statistical Inference and Learning for Shapley Additive Explanations (SHAP)

Arxiv

0+阅读 · 2月11日

Computing Conditional Shapley Values Using Tabular Foundation Models

Arxiv

0+阅读 · 2月10日

TritonRL: Training LLMs to Think and Code Triton Without Cheating

Arxiv

0+阅读 · 2月9日

RLAnything: Forge Environment, Policy, and Reward Model in Completely Dynamic RL System

Arxiv

0+阅读 · 2月2日

An Odd Estimator for Shapley Values

Arxiv

0+阅读 · 2月1日

CLE-SH: Comprehensive Literal Explanation package for SHapley values by statistical validity

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

机器学习模型

最新内容

（中文万字长文）美智库：针对伊朗的防空作战分析（报告）

（中文万字长文）美智库：针对伊朗的防空作战分析（报告）

专知会员服务

3+阅读 · 今天7:12

无人机与反无人机系统（书籍）

无人机与反无人机系统（书籍）

专知会员服务

1+阅读 · 今天6:45

（中文万字长文）2025-2026年乌克兰无人机拦截技术演进：反无人机技术、项目、效果、西方援助

（中文万字长文）2025-2026年乌克兰无人机拦截技术演进：反无人机技术、项目、效果、西方援助

专知会员服务

3+阅读 · 今天6:12

乌克兰2026年军用无人机：现代战争如何被改变

乌克兰2026年军用无人机：现代战争如何被改变

专知会员服务

1+阅读 · 今天5:53

美陆军2026条令：安全与机动支援

美陆军2026条令：安全与机动支援

专知会员服务

0+阅读 · 今天5:49

【牛津博士论文】以语言为接口的医学影像表示学习

【牛津博士论文】以语言为接口的医学影像表示学习

专知会员服务

7+阅读 · 4月13日

基于大语言模型的医疗推理研究：综述与 MR-Bench 基准测试

基于大语言模型的医疗推理研究：综述与 MR-Bench 基准测试

专知会员服务

6+阅读 · 4月13日

从原型到实战：扩展美陆军下一代指挥控制能力（试验进展）

从原型到实战：扩展美陆军下一代指挥控制能力（试验进展）

专知会员服务

12+阅读 · 4月13日

技术、多域威慑与海上战争（报告）

技术、多域威慑与海上战争（报告）

专知会员服务

7+阅读 · 4月13日

随机网络效用最大化在战略排队系统中的博弈论方法

随机网络效用最大化在战略排队系统中的博弈论方法

专知会员服务

4+阅读 · 4月13日

“在云端防御”：提升北约数据韧性（报告）

“在云端防御”：提升北约数据韧性（报告）

专知会员服务

4+阅读 · 4月13日

从炒作到现实：人工智能在军事应用中的实战经验与建议（综述）

从炒作到现实：人工智能在军事应用中的实战经验与建议（综述）

专知会员服务

9+阅读 · 4月13日

2026年伊朗战争对美国通胀的影响：情景分析（报告）

2026年伊朗战争对美国通胀的影响：情景分析（报告）

专知会员服务

2+阅读 · 4月13日

人工智能及其在海军行动中的整合（综述）

人工智能及其在海军行动中的整合（综述）

专知会员服务

4+阅读 · 4月13日

美以伊冲突：无人机主导的第三次海湾战争反防空作战

美以伊冲突：无人机主导的第三次海湾战争反防空作战

专知会员服务

4+阅读 · 4月13日

相关VIP内容

【新书】Python中的深度强化学习：用于聊天机器人和大型语言模型的RLHF，650页pdf

【新书】Python中的深度强化学习：用于聊天机器人和大型语言模型的RLHF，650页pdf

专知会员服务

68+阅读 · 2024年7月18日

可解释的机器学习模型和架构

可解释的机器学习模型和架构

专知会员服务

92+阅读 · 2023年9月17日

【2023新书】用SHAP解释机器学习模型:Python示例和Shapley值理论指南，216页pdf

【2023新书】用SHAP解释机器学习模型:Python示例和Shapley值理论指南，216页pdf

专知会员服务

83+阅读 · 2023年8月31日

【干货书】Python强化学习算法:学习、理解和开发智能算法以应对人工智能挑战，356页pdf，附代码

【干货书】Python强化学习算法:学习、理解和开发智能算法以应对人工智能挑战，356页pdf，附代码

专知会员服务

58+阅读 · 2022年12月10日

【干货书】建立基于python的机器学习和深度学习模型，Build Python-based Machine Learning and Deep Learning Models

【干货书】建立基于python的机器学习和深度学习模型，Build Python-based Machine Learning and Deep Learning Models

专知会员服务

50+阅读 · 2022年5月22日

机器学习的可解释性

机器学习的可解释性

专知会员服务

179+阅读 · 2020年8月27日

【实用书】使用R语言进行深度学习的介绍，240页pdf，一步一步的指导学习和实现使用R的深度学习模型

专知会员服务

42+阅读 · 2020年5月25日

【干货】机器学习经典书PRML 最新 Python 3 代码实现，附最全 PRML 笔记视频学习资料

【干货】机器学习经典书PRML 最新 Python 3 代码实现，附最全 PRML 笔记视频学习资料

专知会员服务

179+阅读 · 2020年3月3日

【《Python机器学习(第三版)》随书代码】（Python Machine Learning (3nd edition)），威斯康星大学麦迪逊分校助理教授Sebastian Raschka、密歇根州立大学博士Vahid Mirjalili

【《Python机器学习(第三版)》随书代码】（Python Machine Learning (3nd edition)），威斯康星大学麦迪逊分校助理教授Sebastian Raschka、密歇根州立大学博士Vahid Mirjalili

专知会员服务

46+阅读 · 2019年12月3日

经典书《机器学习：概率视角》（Machine Learning: a Probabilistic Perspective）第二版Python代码，附1098页pdf下载

经典书《机器学习：概率视角》（Machine Learning: a Probabilistic Perspective）第二版Python代码，附1098页pdf下载

专知会员服务

278+阅读 · 2019年10月25日

热门VIP内容

开通专知VIP会员享更多权益服务

无人机与反无人机系统（书籍）

乌克兰2026年军用无人机：现代战争如何被改变

（中文万字长文）美智库：针对伊朗的防空作战分析（报告）

（中文万字长文）2025-2026年乌克兰无人机拦截技术演进：反无人机技术、项目、效果、西方援助

相关资讯

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

专知

10+阅读 · 2022年11月17日

【Manning2020新书】R/mlr机器学习，513页pdf，Machine Learning with R

【Manning2020新书】R/mlr机器学习，513页pdf，Machine Learning with R

专知

69+阅读 · 2020年3月7日

【新书】Python机器学习实战，545页pdf，Practical Machine Learning with Python

【新书】Python机器学习实战，545页pdf，Practical Machine Learning with Python

专知

22+阅读 · 2020年2月26日

干货 | 可解释的机器学习

干货 | 可解释的机器学习

AI科技评论

20+阅读 · 2019年7月3日

R语言机器学习：xgboost的使用及其模型解释

R语言机器学习：xgboost的使用及其模型解释

R语言中文社区

11+阅读 · 2019年5月6日

可解释的机器学习

可解释的机器学习

平均机器

25+阅读 · 2019年2月25日

机器学习可解释性工具箱XAI

机器学习可解释性工具箱XAI

专知

11+阅读 · 2019年2月8日

【干货】Python机器学习机器学习项目实战3——模型解释与结果分析（附代码）

【干货】Python机器学习机器学习项目实战3——模型解释与结果分析（附代码）

专知

16+阅读 · 2018年5月24日

深度学习在CTR预估中的应用 | CTR深度模型大盘点

深度学习在CTR预估中的应用 | CTR深度模型大盘点

PaperWeekly

15+阅读 · 2018年4月11日

【干货】机器学习经典 PRML 最新 Python 代码实现，附最全 PRML 笔记视频学习资料

【干货】机器学习经典 PRML 最新 Python 代码实现，附最全 PRML 笔记视频学习资料

专知

29+阅读 · 2017年11月26日

相关论文

Enhancing Mortality Forecasting with Ensemble Learning: A Shapley-Based Approach

Arxiv

0+阅读 · 3月4日

Local Shapley: Model-Induced Locality and Optimal Reuse in Data Valuation

Arxiv

0+阅读 · 3月4日

Enhancing the Interpretability of SHAP Values Using Large Language Models

Arxiv

0+阅读 · 3月3日

StochTree: BART-based modeling in R and Python

Arxiv

0+阅读 · 2月20日

Statistical Inference and Learning for Shapley Additive Explanations (SHAP)

Arxiv

0+阅读 · 2月11日

Computing Conditional Shapley Values Using Tabular Foundation Models

Arxiv

0+阅读 · 2月10日

TritonRL: Training LLMs to Think and Code Triton Without Cheating

Arxiv

0+阅读 · 2月9日

RLAnything: Forge Environment, Policy, and Reward Model in Completely Dynamic RL System

Arxiv

0+阅读 · 2月2日

An Odd Estimator for Shapley Values

Arxiv

0+阅读 · 2月1日

CLE-SH: Comprehensive Literal Explanation package for SHapley values by statistical validity

Arxiv

0+阅读 · 1月30日

相关基金

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

6+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

分布式有监督学习的学习理论

国家自然科学基金

17+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于缺失数据分析和信息几何理论的SAR图像自动目标识别研究

国家自然科学基金

3+阅读 · 2015年12月31日

排序与半监督学习的误差分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于先验信息压缩感知SAR成像的信息理论限及实用算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

概率图模型学习及其在数据分析中的应用研究

国家自然科学基金

16+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员