Axiomatic Foundations of Counterfactual Explanations - 专知论文

会员服务 ·

0

反事实 · 反事实解释 · 系统 · 多聚焦 · 构建 ·

Axiomatic Foundations of Counterfactual Explanations

翻译：反事实解释的公理化基础

Leila Amgoud,Martin Cooper

Explaining autonomous and intelligent systems is critical in order to improve trust in their decisions. Counterfactuals have emerged as one of the most compelling forms of explanation. They address ``why not'' questions by revealing how decisions could be altered. Despite the growing literature, most existing explainers focus on a single type of counterfactual and are restricted to local explanations, focusing on individual instances. There has been no systematic study of alternative counterfactual types, nor of global counterfactuals that shed light on a system's overall reasoning process. This paper addresses the two gaps by introducing an axiomatic framework built on a set of desirable properties for counterfactual explainers. It proves impossibility theorems showing that no single explainer can satisfy certain axiom combinations simultaneously, and fully characterizes all compatible sets. Representation theorems then establish five one-to-one correspondences between specific subsets of axioms and the families of explainers that satisfy them. Each family gives rise to a distinct type of counterfactual explanation, uncovering five fundamentally different types of counterfactuals. Some of these correspond to local explanations, while others capture global explanations. Finally, the framework situates existing explainers within this taxonomy, formally characterizes their behavior, and analyzes the computational complexity of generating such explanations.

翻译：解释自主智能系统对于提升其决策可信度至关重要。反事实解释已成为最具说服力的解释形式之一，通过揭示决策如何能被改变来回应"为何不"的问题。尽管相关研究日益增多，现有解释器大多聚焦单一类型的反事实解释，且局限于针对个别实例的局部解释。目前既缺乏对替代性反事实类型的系统性研究，也缺少能揭示系统整体推理过程的全局反事实解释。本文通过构建基于反事实解释器理想属性集的公理框架，同时填补这两项空白。研究证明了不可能性定理，表明不存在能同时满足特定公理组合的单一解释器，并完整刻画了所有相容公理集。随后通过表征定理建立了五组特定公理子集与满足这些公理的解释器族之间的一一对应关系。每个解释器族对应着本质上截然不同的反事实解释类型，由此揭示了五种根本不同的反事实形式。其中部分对应局部解释，其他则涵盖全局解释。最后，该框架将现有解释器纳入此分类体系，形式化刻画其行为特征，并分析了生成此类解释的计算复杂度。

0

相关内容

反事实

可解释人工智能的基础

可解释人工智能的基础

专知会员服务

32+阅读 · 2025年10月26日

【NeurIPS2025】《LeapFactual：基于条件流匹配的可靠视觉反事实解释》

【NeurIPS2025】《LeapFactual：基于条件流匹配的可靠视觉反事实解释》

专知会员服务

10+阅读 · 2025年10月19日

【WWW2024】博弈论式反事实解释图神经网络

【WWW2024】博弈论式反事实解释图神经网络

专知会员服务

32+阅读 · 2024年2月17日

【NTU博士论文】异构数据上机器学习模型的反事实解释，172页pdf

【NTU博士论文】异构数据上机器学习模型的反事实解释，172页pdf

专知会员服务

30+阅读 · 2024年1月2日

【NeurIPS2022】扩散视觉反事实解释

【NeurIPS2022】扩散视觉反事实解释

专知会员服务

24+阅读 · 2022年10月24日

图上如何可解释？首篇《图反事实解释:定义、方法、评价》综述，46页pdf165篇文献全面概述图反事实解释进展

图上如何可解释？首篇《图反事实解释:定义、方法、评价》综述，46页pdf165篇文献全面概述图反事实解释进展

专知会员服务

41+阅读 · 2022年10月24日

【ICML2022】基于树的集合的鲁棒反事实解释

【ICML2022】基于树的集合的鲁棒反事实解释

专知会员服务

15+阅读 · 2022年7月7日

【ICML 2021】树集成中的最优反事实解释

专知会员服务

19+阅读 · 2021年9月21日

反事实如何理解？看这份华为KDD2021《反事实解释及在XAI中的应用》教程，附143页Slides

反事实如何理解？看这份华为KDD2021《反事实解释及在XAI中的应用》教程，附143页Slides

专知会员服务

105+阅读 · 2021年8月16日

【NeurIPS2020】最新《机器学习反事实解释》综述论文，22页pdf

【NeurIPS2020】最新《机器学习反事实解释》综述论文，22页pdf

专知会员服务

126+阅读 · 2020年12月16日

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

专知

55+阅读 · 2023年4月13日

「强化学习可解释性」最新2022综述

「强化学习可解释性」最新2022综述

专知

12+阅读 · 2022年1月16日

「因果推理」概述论文，13页pdf

「因果推理」概述论文，13页pdf

专知

16+阅读 · 2021年3月20日

最新《可解释人工智能》概述，50页ppt

最新《可解释人工智能》概述，50页ppt

专知

12+阅读 · 2021年3月17日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

专知

29+阅读 · 2019年3月1日

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

量子位

23+阅读 · 2019年2月23日

【UC伯克利】可解释性机器学习：定义、方法和应用

【UC伯克利】可解释性机器学习：定义、方法和应用

专知

70+阅读 · 2019年1月19日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

【学界】机器学习模型的“可解释性”到底有多重要？

【学界】机器学习模型的“可解释性”到底有多重要？

GAN生成式对抗网络

12+阅读 · 2018年3月3日

反问题的数学建模、计算及应用

国家自然科学基金

4+阅读 · 2015年12月31日

面向逆反射体检测的特征显著性研究

国家自然科学基金

0+阅读 · 2015年12月31日

融合事件关系推理和情感博弈的网络不实信息演化机理研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

分数阶扩散方程反向问题的正则化理论与算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

基于图模型冲突分析反问题理论的第三方调解策略研究

国家自然科学基金

3+阅读 · 2014年12月31日

含有隐变量的因果结构学习与统计因果推断

国家自然科学基金

21+阅读 · 2013年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

DISCOVER: A Solver for Distributional Counterfactual Explanations

Arxiv

0+阅读 · 3月17日

Do Metrics for Counterfactual Explanations Align with User Perception?

Arxiv

0+阅读 · 3月16日

Concisely Explaining the Doubt: Minimum-Size Abductive Explanations for Linear Models with a Reject Option

Arxiv

0+阅读 · 3月14日

Towards plausibility in time series counterfactual explanations

Arxiv

0+阅读 · 3月9日

Beyond Factual Correctness: Mitigating Preference-Inconsistent Explanations in Explainable Recommendation

Arxiv

0+阅读 · 3月3日

ReasonX: Declarative Reasoning on Explanations

Arxiv

0+阅读 · 2月27日

CounterFlowNet: From Minimal Changes to Meaningful Counterfactual Explanations

Arxiv

0+阅读 · 2月19日

LD-ViCE: Latent Diffusion Model for Video Counterfactual Explanations

Arxiv

0+阅读 · 2月10日

Explanations are a Means to an End: Decision Theoretic Explanation Evaluation

Arxiv

0+阅读 · 2月4日

Explanations Leak: Membership Inference with Differential Privacy and Active Learning Defense

Arxiv

0+阅读 · 2月3日

VIP会员

文章信息

相关主题

反事实解释

最新内容

人工智能赋能电子战解决方案：实现电磁优势的认知方法（万字长文）

人工智能赋能电子战解决方案：实现电磁优势的认知方法（万字长文）

专知会员服务

0+阅读 · 23分钟前

《基于模型的系统工程框架及其在电子战系统中的应用》

《基于模型的系统工程框架及其在电子战系统中的应用》

专知会员服务

0+阅读 · 57分钟前

人工智能即服务与未来战争（印度视角）

人工智能即服务与未来战争（印度视角）

专知会员服务

0+阅读 · 今天7:57

《将量子技术集成到移动军事系统与战术作战中心框架》

《将量子技术集成到移动军事系统与战术作战中心框架》

专知会员服务

0+阅读 · 今天7:53

《美国战争部2027财年军事人员预算》

《美国战争部2027财年军事人员预算》

专知会员服务

0+阅读 · 今天7:44

伊朗战争中的电子战

伊朗战争中的电子战

专知会员服务

3+阅读 · 今天7:04

大语言模型平台在国防情报应用中的对比

大语言模型平台在国防情报应用中的对比

专知会员服务

5+阅读 · 今天3:12

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

专知会员服务

5+阅读 · 今天3:00

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

专知会员服务

3+阅读 · 今天2:56

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

专知会员服务

4+阅读 · 今天2:44

《仿真互操作性标准：实时平台参考联邦对象模型指南、原理与互操作性模式标准》300页

《仿真互操作性标准：实时平台参考联邦对象模型指南、原理与互操作性模式标准》300页

专知会员服务

8+阅读 · 今天2:37

《自主远程巡飞弹药打击系统的嵌入式人工智能感知框架》

《自主远程巡飞弹药打击系统的嵌入式人工智能感知框架》

专知会员服务

5+阅读 · 今天2:22

美海军“超配项目”

美海军“超配项目”

专知会员服务

6+阅读 · 今天2:13

《美陆军条例：陆军指挥政策（2026版）》

《美陆军条例：陆军指挥政策（2026版）》

专知会员服务

11+阅读 · 4月21日

《提升美军全域城市作战训练最佳实践的案例研究》366页

《提升美军全域城市作战训练最佳实践的案例研究》366页

专知会员服务

13+阅读 · 4月21日

相关VIP内容

可解释人工智能的基础

可解释人工智能的基础

专知会员服务

32+阅读 · 2025年10月26日

【NeurIPS2025】《LeapFactual：基于条件流匹配的可靠视觉反事实解释》

【NeurIPS2025】《LeapFactual：基于条件流匹配的可靠视觉反事实解释》

专知会员服务

10+阅读 · 2025年10月19日

【WWW2024】博弈论式反事实解释图神经网络

【WWW2024】博弈论式反事实解释图神经网络

专知会员服务

32+阅读 · 2024年2月17日

【NTU博士论文】异构数据上机器学习模型的反事实解释，172页pdf

【NTU博士论文】异构数据上机器学习模型的反事实解释，172页pdf

专知会员服务

30+阅读 · 2024年1月2日

【NeurIPS2022】扩散视觉反事实解释

【NeurIPS2022】扩散视觉反事实解释

专知会员服务

24+阅读 · 2022年10月24日

图上如何可解释？首篇《图反事实解释:定义、方法、评价》综述，46页pdf165篇文献全面概述图反事实解释进展

图上如何可解释？首篇《图反事实解释:定义、方法、评价》综述，46页pdf165篇文献全面概述图反事实解释进展

专知会员服务

41+阅读 · 2022年10月24日

【ICML2022】基于树的集合的鲁棒反事实解释

【ICML2022】基于树的集合的鲁棒反事实解释

专知会员服务

15+阅读 · 2022年7月7日

【ICML 2021】树集成中的最优反事实解释

专知会员服务

19+阅读 · 2021年9月21日

反事实如何理解？看这份华为KDD2021《反事实解释及在XAI中的应用》教程，附143页Slides

反事实如何理解？看这份华为KDD2021《反事实解释及在XAI中的应用》教程，附143页Slides

专知会员服务

105+阅读 · 2021年8月16日

【NeurIPS2020】最新《机器学习反事实解释》综述论文，22页pdf

【NeurIPS2020】最新《机器学习反事实解释》综述论文，22页pdf

专知会员服务

126+阅读 · 2020年12月16日

热门VIP内容

开通专知VIP会员享更多权益服务

《基于模型的系统工程框架及其在电子战系统中的应用》

《将量子技术集成到移动军事系统与战术作战中心框架》

人工智能赋能电子战解决方案：实现电磁优势的认知方法（万字长文）

人工智能即服务与未来战争（印度视角）

相关资讯

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

专知

55+阅读 · 2023年4月13日

「强化学习可解释性」最新2022综述

「强化学习可解释性」最新2022综述

专知

12+阅读 · 2022年1月16日

「因果推理」概述论文，13页pdf

「因果推理」概述论文，13页pdf

专知

16+阅读 · 2021年3月20日

最新《可解释人工智能》概述，50页ppt

最新《可解释人工智能》概述，50页ppt

专知

12+阅读 · 2021年3月17日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

【Awesome】最全的机器学习可解释性资料（machine-learning-interpretability）

专知

29+阅读 · 2019年3月1日

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

高赞新书《可解释的机器学习》出版：理解黑盒必备，免费资源

量子位

23+阅读 · 2019年2月23日

【UC伯克利】可解释性机器学习：定义、方法和应用

【UC伯克利】可解释性机器学习：定义、方法和应用

专知

70+阅读 · 2019年1月19日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

【学界】机器学习模型的“可解释性”到底有多重要？

【学界】机器学习模型的“可解释性”到底有多重要？

GAN生成式对抗网络

12+阅读 · 2018年3月3日

相关论文

DISCOVER: A Solver for Distributional Counterfactual Explanations

Arxiv

0+阅读 · 3月17日

Do Metrics for Counterfactual Explanations Align with User Perception?

Arxiv

0+阅读 · 3月16日

Concisely Explaining the Doubt: Minimum-Size Abductive Explanations for Linear Models with a Reject Option

Arxiv

0+阅读 · 3月14日

Towards plausibility in time series counterfactual explanations

Arxiv

0+阅读 · 3月9日

Beyond Factual Correctness: Mitigating Preference-Inconsistent Explanations in Explainable Recommendation

Arxiv

0+阅读 · 3月3日

ReasonX: Declarative Reasoning on Explanations

Arxiv

0+阅读 · 2月27日

CounterFlowNet: From Minimal Changes to Meaningful Counterfactual Explanations

Arxiv

0+阅读 · 2月19日

LD-ViCE: Latent Diffusion Model for Video Counterfactual Explanations

Arxiv

0+阅读 · 2月10日

Explanations are a Means to an End: Decision Theoretic Explanation Evaluation

Arxiv

0+阅读 · 2月4日

Explanations Leak: Membership Inference with Differential Privacy and Active Learning Defense

Arxiv

0+阅读 · 2月3日

相关基金

反问题的数学建模、计算及应用

国家自然科学基金

4+阅读 · 2015年12月31日

面向逆反射体检测的特征显著性研究

国家自然科学基金

0+阅读 · 2015年12月31日

融合事件关系推理和情感博弈的网络不实信息演化机理研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

分数阶扩散方程反向问题的正则化理论与算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

基于图模型冲突分析反问题理论的第三方调解策略研究

国家自然科学基金

3+阅读 · 2014年12月31日

含有隐变量的因果结构学习与统计因果推断

国家自然科学基金

21+阅读 · 2013年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员