Does Explanation Correctness Matter? Linking Computational XAI Evaluation to Human Understanding - 专知论文

会员服务 ·

0

正确性 · XAI · 关联 · 用户研究 · 时间序列分类 ·

Does Explanation Correctness Matter? Linking Computational XAI Evaluation to Human Understanding

翻译：解释正确性重要吗？计算XAI评估与人类理解之间的关联

Gregor Baer,Chao Zhang,Isel Grau,Pieter Van Gorp

from arxiv, 24 pages, 9 figures, 2 tables

Explainable AI (XAI) methods are commonly evaluated with functional metrics such as correctness, which computationally estimate how accurately an explanation reflects the model's reasoning. Higher correctness is assumed to produce better human understanding, but this link has not been tested experimentally with controlled levels. We conducted a user study (N=200) that manipulated explanation correctness at four levels (100%, 85%, 70%, 55%) in a time series classification task where participants could not rely on domain knowledge or visual intuition and instead predicted the AI's decisions based on explanations (forward simulation). Correctness affected understanding, but not at every level: performance dropped at 70% and 55% correctness relative to fully correct explanations, while further degradation below 70% produced no additional loss. Rather than shifting performance uniformly, lower correctness decreased the proportion of participants who learned the decision pattern. At the same time, even fully correct explanations did not guarantee understanding, as only a subset of participants achieved high accuracy. Exploratory analyses showed that self-reported ratings correlated with demonstrated performance only when explanations were fully correct and participants had learned the pattern. These findings show that not all differences in functional correctness translate to differences in human understanding, underscoring the need to validate functional metrics against human outcomes.

翻译：可解释人工智能（XAI）方法通常通过功能性指标（如正确性）进行评估，这类指标以计算方式估计解释反映模型推理的准确程度。更高的正确性被假设能带来更好的人类理解，但这一关联尚未通过受控级别的实验检验。我们开展了一项用户研究（N=200），在时间序列分类任务中设置了四个级别的解释正确性（100%、85%、70%、55%），参与者无法依赖领域知识或视觉直觉，而是基于解释预测AI的决策（前向模拟）。正确性影响了理解，但并非在每个级别都如此：与完全正确的解释相比，在70%和55%的正确性下，表现有所下降；而正确性从70%进一步降低并未导致额外损失。较低的正确性并未均匀降低表现，而是减少了学习决策模式的参与者比例。同时，即使完全正确的解释也不能保证理解，仅有一部分参与者达到了高准确率。探索性分析显示，仅当解释完全正确且参与者已学习到模式时，自我报告评分才与已证实的表现相关。这些发现表明，并非所有功能性正确性上的差异都会转化为人类理解上的差异，这凸显了需要根据人类结果验证功能性指标的必要性。

0

相关内容

正确性

可解释人工智能（XAI）：从内在可解释性到大语言模型

可解释人工智能（XAI）：从内在可解释性到大语言模型

专知会员服务

34+阅读 · 2025年1月20日

金融时间序列预测中的可解释人工智能（XAI）综述

金融时间序列预测中的可解释人工智能（XAI）综述

专知会员服务

44+阅读 · 2024年7月25日

人工智能（XAI）可解释性的研究进展！

人工智能（XAI）可解释性的研究进展！

专知会员服务

33+阅读 · 2024年6月12日

《可解释人工智能的态势感知框架 (SAFE-AI) 和 XAI 系统的人为因素考虑》麻省理工学院17页论文

《可解释人工智能的态势感知框架 (SAFE-AI) 和 XAI 系统的人为因素考虑》麻省理工学院17页论文

专知会员服务

106+阅读 · 2023年2月19日

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

专知会员服务

70+阅读 · 2022年9月14日

推荐！DARPA XAI计划支持 200页报告《人类-人工智能系统中的解释：可解释人工智能的关键思想和出版物的文献元分析综述概要和目录》

推荐！DARPA XAI计划支持 200页报告《人类-人工智能系统中的解释：可解释人工智能的关键思想和出版物的文献元分析综述概要和目录》

专知会员服务

93+阅读 · 2022年7月21日

XAI+网络安全？布兰登大学等最新《可解释人工智能在网络安全应用》综述，33页pdf阐述其现状、挑战、开放问题和未来方向

XAI+网络安全？布兰登大学等最新《可解释人工智能在网络安全应用》综述，33页pdf阐述其现状、挑战、开放问题和未来方向

专知会员服务

65+阅读 · 2022年7月3日

XAI实用技术有哪些？普渡大学SIGMOD2022最新《可解释人工智能》教程，130+PPT阐述XAI的基础、应用、机会，附视频

XAI实用技术有哪些？普渡大学SIGMOD2022最新《可解释人工智能》教程，130+PPT阐述XAI的基础、应用、机会，附视频

专知会员服务

95+阅读 · 2022年6月30日

【AAAI2022-Tutorial】可解释的人工智能:从理论到动机、工业应用、XAI编码和工程实践

【AAAI2022-Tutorial】可解释的人工智能:从理论到动机、工业应用、XAI编码和工程实践

专知会员服务

44+阅读 · 2022年2月25日

【干货书】可解释人工智能(xAI)方法和深度元学习模型

【干货书】可解释人工智能(xAI)方法和深度元学习模型

专知会员服务

62+阅读 · 2020年9月13日

推荐！《可解释人工智能及其军事意义》【译文】印智库ORF2022最新报告

推荐！《可解释人工智能及其军事意义》【译文】印智库ORF2022最新报告

专知

40+阅读 · 2022年11月4日

推荐！【中文版】瑞典国防研究局《可解释人工智能：探索XAI技术在军事深度学习中的应用》56页技术报告

推荐！【中文版】瑞典国防研究局《可解释人工智能：探索XAI技术在军事深度学习中的应用》56页技术报告

专知

17+阅读 · 2022年7月8日

XAI是否靠谱？美国DARPA「可解释人工智能」（XAI计划）的4年回顾与经验总结，附中文版

XAI是否靠谱？美国DARPA「可解释人工智能」（XAI计划）的4年回顾与经验总结，附中文版

专知

29+阅读 · 2022年4月3日

「因果推理」概述论文，13页pdf

「因果推理」概述论文，13页pdf

专知

16+阅读 · 2021年3月20日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

专知

10+阅读 · 2019年12月21日

可解释人工智能XAI进展，看这份100页PPT为你讲解

可解释人工智能XAI进展，看这份100页PPT为你讲解

专知

49+阅读 · 2019年10月27日

【干货】XAI可解释人工智能最新进展，89页ppt

【干货】XAI可解释人工智能最新进展，89页ppt

专知

52+阅读 · 2019年6月19日

机器学习可解释性工具箱XAI

机器学习可解释性工具箱XAI

专知

11+阅读 · 2019年2月8日

【学界】机器学习模型的“可解释性”到底有多重要？

【学界】机器学习模型的“可解释性”到底有多重要？

GAN生成式对抗网络

12+阅读 · 2018年3月3日

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

考虑不确定性的结构动力学响应模型可信度确认方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

整数关系探测的误差可控算法与应用

国家自然科学基金

0+阅读 · 2015年12月31日

信息论学习中的正则化及相关高维数据分析方法的数学理论

国家自然科学基金

12+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于人眼关注度与情感分析的电子商务智能推荐计算

国家自然科学基金

0+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

Beyond Explainable AI (XAI): An Overdue Paradigm Shift and Post-XAI Research Directions

Arxiv

0+阅读 · 4月10日

Explainable AI needs formalization

Arxiv

0+阅读 · 4月8日

Position: Explainable AI is Causality in Disguise

Arxiv

0+阅读 · 3月30日

No Single Metric Tells the Whole Story: A Multi-Dimensional Evaluation Framework for Uncertainty Attributions

Arxiv

0+阅读 · 3月25日

An Agentic Approach to Generating XAI-Narratives

Arxiv

0+阅读 · 3月20日

Do Metrics for Counterfactual Explanations Align with User Perception?

Arxiv

0+阅读 · 3月16日

Agentic Explainable Artificial Intelligence (Agentic XAI) Approach To Explore Better Explanation

Arxiv

0+阅读 · 3月12日

Beyond Explainable AI (XAI): An Overdue Paradigm Shift and Post-XAI Research Directions

Arxiv

0+阅读 · 3月11日

Statistical Confidence in Functional Correctness: An Approach for AI Product Functional Correctness Evaluation

Arxiv

0+阅读 · 2月20日

Towards Explainable Artificial Intelligence (XAI): A Data Mining Perspective

Arxiv

14+阅读 · 2024年1月9日

VIP会员

文章信息

相关主题

时间序列分类

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

4+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

6+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

6+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

6+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

22+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

可解释人工智能（XAI）：从内在可解释性到大语言模型

可解释人工智能（XAI）：从内在可解释性到大语言模型

专知会员服务

34+阅读 · 2025年1月20日

金融时间序列预测中的可解释人工智能（XAI）综述

金融时间序列预测中的可解释人工智能（XAI）综述

专知会员服务

44+阅读 · 2024年7月25日

人工智能（XAI）可解释性的研究进展！

人工智能（XAI）可解释性的研究进展！

专知会员服务

33+阅读 · 2024年6月12日

《可解释人工智能的态势感知框架 (SAFE-AI) 和 XAI 系统的人为因素考虑》麻省理工学院17页论文

《可解释人工智能的态势感知框架 (SAFE-AI) 和 XAI 系统的人为因素考虑》麻省理工学院17页论文

专知会员服务

106+阅读 · 2023年2月19日

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

专知会员服务

70+阅读 · 2022年9月14日

推荐！DARPA XAI计划支持 200页报告《人类-人工智能系统中的解释：可解释人工智能的关键思想和出版物的文献元分析综述概要和目录》

推荐！DARPA XAI计划支持 200页报告《人类-人工智能系统中的解释：可解释人工智能的关键思想和出版物的文献元分析综述概要和目录》

专知会员服务

93+阅读 · 2022年7月21日

XAI+网络安全？布兰登大学等最新《可解释人工智能在网络安全应用》综述，33页pdf阐述其现状、挑战、开放问题和未来方向

XAI+网络安全？布兰登大学等最新《可解释人工智能在网络安全应用》综述，33页pdf阐述其现状、挑战、开放问题和未来方向

专知会员服务

65+阅读 · 2022年7月3日

XAI实用技术有哪些？普渡大学SIGMOD2022最新《可解释人工智能》教程，130+PPT阐述XAI的基础、应用、机会，附视频

XAI实用技术有哪些？普渡大学SIGMOD2022最新《可解释人工智能》教程，130+PPT阐述XAI的基础、应用、机会，附视频

专知会员服务

95+阅读 · 2022年6月30日

【AAAI2022-Tutorial】可解释的人工智能:从理论到动机、工业应用、XAI编码和工程实践

【AAAI2022-Tutorial】可解释的人工智能:从理论到动机、工业应用、XAI编码和工程实践

专知会员服务

44+阅读 · 2022年2月25日

【干货书】可解释人工智能(xAI)方法和深度元学习模型

【干货书】可解释人工智能(xAI)方法和深度元学习模型

专知会员服务

62+阅读 · 2020年9月13日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

推荐！《可解释人工智能及其军事意义》【译文】印智库ORF2022最新报告

推荐！《可解释人工智能及其军事意义》【译文】印智库ORF2022最新报告

专知

40+阅读 · 2022年11月4日

推荐！【中文版】瑞典国防研究局《可解释人工智能：探索XAI技术在军事深度学习中的应用》56页技术报告

推荐！【中文版】瑞典国防研究局《可解释人工智能：探索XAI技术在军事深度学习中的应用》56页技术报告

专知

17+阅读 · 2022年7月8日

XAI是否靠谱？美国DARPA「可解释人工智能」（XAI计划）的4年回顾与经验总结，附中文版

XAI是否靠谱？美国DARPA「可解释人工智能」（XAI计划）的4年回顾与经验总结，附中文版

专知

29+阅读 · 2022年4月3日

「因果推理」概述论文，13页pdf

「因果推理」概述论文，13页pdf

专知

16+阅读 · 2021年3月20日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

专知

10+阅读 · 2019年12月21日

可解释人工智能XAI进展，看这份100页PPT为你讲解

可解释人工智能XAI进展，看这份100页PPT为你讲解

专知

49+阅读 · 2019年10月27日

【干货】XAI可解释人工智能最新进展，89页ppt

【干货】XAI可解释人工智能最新进展，89页ppt

专知

52+阅读 · 2019年6月19日

机器学习可解释性工具箱XAI

机器学习可解释性工具箱XAI

专知

11+阅读 · 2019年2月8日

【学界】机器学习模型的“可解释性”到底有多重要？

【学界】机器学习模型的“可解释性”到底有多重要？

GAN生成式对抗网络

12+阅读 · 2018年3月3日

相关论文

Beyond Explainable AI (XAI): An Overdue Paradigm Shift and Post-XAI Research Directions

Arxiv

0+阅读 · 4月10日

Explainable AI needs formalization

Arxiv

0+阅读 · 4月8日

Position: Explainable AI is Causality in Disguise

Arxiv

0+阅读 · 3月30日

No Single Metric Tells the Whole Story: A Multi-Dimensional Evaluation Framework for Uncertainty Attributions

Arxiv

0+阅读 · 3月25日

An Agentic Approach to Generating XAI-Narratives

Arxiv

0+阅读 · 3月20日

Do Metrics for Counterfactual Explanations Align with User Perception?

Arxiv

0+阅读 · 3月16日

Agentic Explainable Artificial Intelligence (Agentic XAI) Approach To Explore Better Explanation

Arxiv

0+阅读 · 3月12日

Beyond Explainable AI (XAI): An Overdue Paradigm Shift and Post-XAI Research Directions

Arxiv

0+阅读 · 3月11日

Statistical Confidence in Functional Correctness: An Approach for AI Product Functional Correctness Evaluation

Arxiv

0+阅读 · 2月20日

Towards Explainable Artificial Intelligence (XAI): A Data Mining Perspective

Arxiv

14+阅读 · 2024年1月9日

相关基金

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

考虑不确定性的结构动力学响应模型可信度确认方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

整数关系探测的误差可控算法与应用

国家自然科学基金

0+阅读 · 2015年12月31日

信息论学习中的正则化及相关高维数据分析方法的数学理论

国家自然科学基金

12+阅读 · 2014年12月31日

线性时序关系下推理的概率计量化模型

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于人眼关注度与情感分析的电子商务智能推荐计算

国家自然科学基金

0+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员