ExplainReduce: Generating global explanations from many local explanations - 专知论文

会员服务 ·

0

约简 · 闭式 · 单模 · 近似 · 工具 ·

ExplainReduce: Generating global explanations from many local explanations

翻译：ExplainReduce：从众多局部解释中生成全局解释

Lauri Seppäläinen,Mudong Guo,Kai Puolamäki

from arxiv, 21 pages with a 36 page appendix, 8 + 39 figures, 1+1 tables. The datasets and source code used in the paper are available at https://github.com/edahelsinki/explainreduce

Most commonly used non-linear machine learning methods are closed-box models, uninterpretable to humans. The field of explainable artificial intelligence (XAI) aims to develop tools to examine the inner workings of these closed boxes. An often-used model-agnostic approach to XAI involves using simple models as local approximations to produce so-called local explanations; examples of this approach include LIME, SHAP, and SLISEMAP. This paper shows how a large set of local explanations can be reduced to a small "proxy set" of simple models, which can act as a generative global explanation. This reduction procedure, ExplainReduce, can be formulated as an optimisation problem and approximated efficiently using greedy heuristics. We show that, for many problems, as few as five explanations can faithfully emulate the closed-box model and that our reduction procedure is competitive with other model aggregation methods.

翻译：最常用的非线性机器学习方法通常属于封闭式模型，对人类而言难以解释。可解释人工智能领域致力于开发工具以探究这些“黑箱”的内部机制。一种常用的模型无关XAI方法涉及使用简单模型作为局部近似来生成所谓的局部解释；此类方法的实例包括LIME、SHAP和SLISEMAP。本文展示了如何将大量局部解释约简为简单模型的“代理集”，该集合可作为生成式全局解释。这种约简流程——ExplainReduce——可表述为优化问题，并能通过贪心启发式算法高效近似求解。我们证明对于许多问题，仅需五个解释即可忠实模拟封闭式模型，且我们的约简流程与其他模型聚合方法相比具有竞争力。

0

相关内容

可解释强化学习综述：目标、方法与需求

可解释强化学习综述：目标、方法与需求

专知会员服务

31+阅读 · 2025年7月19日

不可错过! 哈佛大学最新《可解释人工智能》课程，讲述从简单的预测到复杂的生成模型

不可错过! 哈佛大学最新《可解释人工智能》课程，讲述从简单的预测到复杂的生成模型

专知会员服务

60+阅读 · 2023年6月28日

可解释人工智能中的对抗攻击和防御

可解释人工智能中的对抗攻击和防御

专知会员服务

43+阅读 · 2023年6月20日

【柏林工业大学博士论文】可解释结构化机器学习:对相似性、图和Transformer模型的洞察，143页pdf

【柏林工业大学博士论文】可解释结构化机器学习:对相似性、图和Transformer模型的洞察，143页pdf

专知会员服务

46+阅读 · 2023年2月28日

可解释AI最新有什么进展？Wojciech最新《概念级可解释人工智能》报告，52页ppt

可解释AI最新有什么进展？Wojciech最新《概念级可解释人工智能》报告，52页ppt

专知会员服务

60+阅读 · 2023年2月22日

【2023新书】可解释的AI谱系，使用Python实现模型可解释性和可解释性的解决方案，272页pdf

【2023新书】可解释的AI谱系，使用Python实现模型可解释性和可解释性的解决方案，272页pdf

专知会员服务

114+阅读 · 2023年2月20日

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

专知会员服务

70+阅读 · 2022年9月14日

机器学习的可解释性

机器学习的可解释性

专知会员服务

69+阅读 · 2020年12月18日

【机器推理可解释性】Machine Reasoning Explainability

【机器推理可解释性】Machine Reasoning Explainability

专知会员服务

35+阅读 · 2020年9月3日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

132+阅读 · 2020年5月14日

【Manning新书】可解释人工智能: 构建可解释机器学习系统，330页pdf

【Manning新书】可解释人工智能: 构建可解释机器学习系统，330页pdf

专知

35+阅读 · 2022年6月2日

【Manning新书】可解释人工智能: 构建可解释机器学习系统，144页pdf

【Manning新书】可解释人工智能: 构建可解释机器学习系统，144页pdf

专知

12+阅读 · 2022年1月28日

最新《可解释人工智能》概述，50页ppt

最新《可解释人工智能》概述，50页ppt

专知

12+阅读 · 2021年3月17日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

78+阅读 · 2019年10月20日

【干货】XAI可解释人工智能最新进展，89页ppt

【干货】XAI可解释人工智能最新进展，89页ppt

专知

52+阅读 · 2019年6月19日

【资源推荐】AI可解释性资源汇总

【资源推荐】AI可解释性资源汇总

专知

47+阅读 · 2019年4月24日

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

专知

29+阅读 · 2019年3月1日

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

量子位

23+阅读 · 2019年2月23日

【UC伯克利】可解释性机器学习：定义、方法和应用

【UC伯克利】可解释性机器学习：定义、方法和应用

专知

70+阅读 · 2019年1月19日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

面向CELP语音压缩域的通用隐写分析方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

不同加工层次和不同时空尺度下无意识加工之间的相互作用

国家自然科学基金

0+阅读 · 2015年12月31日

非局部边值问题的特征值及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

非线性分析方法与奇异摄动理论在力学中的若干应用

国家自然科学基金

0+阅读 · 2015年12月31日

积分微分方程和反常扩散问题的高效谱方法

国家自然科学基金

0+阅读 · 2014年12月31日

非线性约束全局优化的新方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

Explanation User Interfaces: A Systematic Literature Review

Arxiv

0+阅读 · 3月17日

Agentic Explainable Artificial Intelligence (Agentic XAI) Approach To Explore Better Explanation

Arxiv

0+阅读 · 3月12日

Explainability of Text Processing and Retrieval Methods: A Survey

Arxiv

0+阅读 · 3月10日

X-SYS: A Reference Architecture for Interactive Explanation Systems

Arxiv

0+阅读 · 3月9日

PONTE: Personalized Orchestration for Natural Language Trustworthy Explanations

Arxiv

0+阅读 · 3月6日

Enhancing the Interpretability of SHAP Values Using Large Language Models

Arxiv

0+阅读 · 3月3日

ReasonX: Declarative Reasoning on Explanations

Arxiv

0+阅读 · 2月27日

Explanation User Interfaces: A Systematic Literature Review

Arxiv

0+阅读 · 2月19日

EXCODER: EXplainable Classification Of DiscretE time series Representations

Arxiv

0+阅读 · 2月13日

An Information-Theoretic Framework for Comparing Voice and Text Explainability

Arxiv

0+阅读 · 2月6日

VIP会员

文章信息

相关主题

最新内容

《美陆军条例：陆军指挥政策（2026版）》

《美陆军条例：陆军指挥政策（2026版）》

专知会员服务

7+阅读 · 今天8:10

《提升美军全域城市作战训练最佳实践的案例研究》366页

《提升美军全域城市作战训练最佳实践的案例研究》366页

专知会员服务

7+阅读 · 今天8:06

《军用自主人工智能系统的治理与安全》

《军用自主人工智能系统的治理与安全》

专知会员服务

5+阅读 · 今天8:02

美海军数字作战负责人：如何利用数据快速生成战斗力

美海军数字作战负责人：如何利用数据快速生成战斗力

专知会员服务

5+阅读 · 今天7:32

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

11+阅读 · 4月20日

《系统簇式多域作战规划范畴论框架》

《系统簇式多域作战规划范畴论框架》

专知会员服务

9+阅读 · 4月20日

《美国防部指令6130.03，第2卷服役医疗标准：保留》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

专知会员服务

6+阅读 · 4月20日

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

专知会员服务

4+阅读 · 4月20日

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

专知会员服务

8+阅读 · 4月20日

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

专知会员服务

4+阅读 · 4月20日

高效视频扩散模型：进展与挑战

高效视频扩散模型：进展与挑战

专知会员服务

4+阅读 · 4月20日

乌克兰前线的五项创新

乌克兰前线的五项创新

专知会员服务

8+阅读 · 4月20日

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

7+阅读 · 4月20日

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

12+阅读 · 4月20日

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

6+阅读 · 4月20日

相关VIP内容

可解释强化学习综述：目标、方法与需求

可解释强化学习综述：目标、方法与需求

专知会员服务

31+阅读 · 2025年7月19日

不可错过! 哈佛大学最新《可解释人工智能》课程，讲述从简单的预测到复杂的生成模型

不可错过! 哈佛大学最新《可解释人工智能》课程，讲述从简单的预测到复杂的生成模型

专知会员服务

60+阅读 · 2023年6月28日

可解释人工智能中的对抗攻击和防御

可解释人工智能中的对抗攻击和防御

专知会员服务

43+阅读 · 2023年6月20日

【柏林工业大学博士论文】可解释结构化机器学习:对相似性、图和Transformer模型的洞察，143页pdf

【柏林工业大学博士论文】可解释结构化机器学习:对相似性、图和Transformer模型的洞察，143页pdf

专知会员服务

46+阅读 · 2023年2月28日

可解释AI最新有什么进展？Wojciech最新《概念级可解释人工智能》报告，52页ppt

可解释AI最新有什么进展？Wojciech最新《概念级可解释人工智能》报告，52页ppt

专知会员服务

60+阅读 · 2023年2月22日

【2023新书】可解释的AI谱系，使用Python实现模型可解释性和可解释性的解决方案，272页pdf

【2023新书】可解释的AI谱系，使用Python实现模型可解释性和可解释性的解决方案，272页pdf

专知会员服务

114+阅读 · 2023年2月20日

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

专知会员服务

70+阅读 · 2022年9月14日

机器学习的可解释性

机器学习的可解释性

专知会员服务

69+阅读 · 2020年12月18日

【机器推理可解释性】Machine Reasoning Explainability

【机器推理可解释性】Machine Reasoning Explainability

专知会员服务

35+阅读 · 2020年9月3日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

132+阅读 · 2020年5月14日

热门VIP内容

开通专知VIP会员享更多权益服务

《提升美军全域城市作战训练最佳实践的案例研究》366页

美海军数字作战负责人：如何利用数据快速生成战斗力

《美陆军条例：陆军指挥政策（2026版）》

《军用自主人工智能系统的治理与安全》

相关资讯

【Manning新书】可解释人工智能: 构建可解释机器学习系统，330页pdf

【Manning新书】可解释人工智能: 构建可解释机器学习系统，330页pdf

专知

35+阅读 · 2022年6月2日

【Manning新书】可解释人工智能: 构建可解释机器学习系统，144页pdf

【Manning新书】可解释人工智能: 构建可解释机器学习系统，144页pdf

专知

12+阅读 · 2022年1月28日

最新《可解释人工智能》概述，50页ppt

最新《可解释人工智能》概述，50页ppt

专知

12+阅读 · 2021年3月17日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

78+阅读 · 2019年10月20日

【干货】XAI可解释人工智能最新进展，89页ppt

【干货】XAI可解释人工智能最新进展，89页ppt

专知

52+阅读 · 2019年6月19日

【资源推荐】AI可解释性资源汇总

【资源推荐】AI可解释性资源汇总

专知

47+阅读 · 2019年4月24日

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

专知

29+阅读 · 2019年3月1日

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

量子位

23+阅读 · 2019年2月23日

【UC伯克利】可解释性机器学习：定义、方法和应用

【UC伯克利】可解释性机器学习：定义、方法和应用

专知

70+阅读 · 2019年1月19日

相关论文

Explanation User Interfaces: A Systematic Literature Review

Arxiv

0+阅读 · 3月17日

Agentic Explainable Artificial Intelligence (Agentic XAI) Approach To Explore Better Explanation

Arxiv

0+阅读 · 3月12日

Explainability of Text Processing and Retrieval Methods: A Survey

Arxiv

0+阅读 · 3月10日

X-SYS: A Reference Architecture for Interactive Explanation Systems

Arxiv

0+阅读 · 3月9日

PONTE: Personalized Orchestration for Natural Language Trustworthy Explanations

Arxiv

0+阅读 · 3月6日

Enhancing the Interpretability of SHAP Values Using Large Language Models

Arxiv

0+阅读 · 3月3日

ReasonX: Declarative Reasoning on Explanations

Arxiv

0+阅读 · 2月27日

Explanation User Interfaces: A Systematic Literature Review

Arxiv

0+阅读 · 2月19日

EXCODER: EXplainable Classification Of DiscretE time series Representations

Arxiv

0+阅读 · 2月13日

An Information-Theoretic Framework for Comparing Voice and Text Explainability

Arxiv

0+阅读 · 2月6日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

面向CELP语音压缩域的通用隐写分析方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

不同加工层次和不同时空尺度下无意识加工之间的相互作用

国家自然科学基金

0+阅读 · 2015年12月31日

非局部边值问题的特征值及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

非线性分析方法与奇异摄动理论在力学中的若干应用

国家自然科学基金

0+阅读 · 2015年12月31日

积分微分方程和反常扩散问题的高效谱方法

国家自然科学基金

0+阅读 · 2014年12月31日

非线性约束全局优化的新方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员