A Survey on Human-Centered Evaluation of Explainable AI Methods in Clinical Decision Support Systems - 专知论文

会员服务 ·

0

XAI · 系统 · 临床决策支持 · 决策支持系统 · 决策支持 ·

A Survey on Human-Centered Evaluation of Explainable AI Methods in Clinical Decision Support Systems

翻译：临床决策支持系统中可解释人工智能方法的人本评估综述

Alessandro Gambetti,Qiwei Han,Hong Shen,Claudia Soares

from arxiv, 19 pages, 2 tables, 4 figures

Explainable Artificial Intelligence (XAI) is essential for the transparency and clinical adoption of Clinical Decision Support Systems (CDSS). However, the real-world effectiveness of existing XAI methods remains limited and is inconsistently evaluated. This study conducts a systematic PRISMA-guided survey of 31 human-centered evaluations (HCE) of XAI applied to CDSS, classifying them by XAI methodology, evaluation design, and adoption barrier. Our findings reveal that most existing studies employ post-hoc, model-agnostic approaches such as SHAP and Grad-CAM, typically assessed through small-scale clinician studies. The results show that over 80% of the studies adopt post-hoc, model-agnostic approaches such as SHAP and Grad-CAM, and that clinician sample sizes remain below 25 participants. The findings indicate that explanations generally improve clinician trust and diagnostic confidence, but frequently increase cognitive load and exhibit misalignment with domain reasoning processes. To bridge these gaps, we propose a stakeholder-centric evaluation framework that integrates socio-technical principles and human-computer interaction to guide the future development of clinically viable and trustworthy XAI-based CDSS.

翻译：可解释人工智能（XAI）对于临床决策支持系统（CDSS）的透明度和临床采用至关重要。然而，现有XAI方法在真实场景中的有效性仍然有限，且评估方式缺乏一致性。本研究通过PRISMA指南对31项应用于CDSS的XAI人本评估（HCE）进行了系统性综述，依据XAI方法学、评估设计和应用障碍进行分类。研究发现，现有研究大多采用SHAP和Grad-CAM等事后模型无关方法，通常通过小规模临床医师研究进行评估。结果显示超过80%的研究采用SHAP和Grad-CAM等事后模型无关方法，且临床医师样本量普遍低于25人。研究结果表明，解释机制总体上能提升临床医师的信任度和诊断信心，但常会增加认知负荷，并与领域推理过程存在偏差。为弥合这些差距，我们提出了一个以利益相关者为中心的评估框架，该框架整合了社会技术原则和人机交互理念，以指导未来开发具有临床可行性和可信度的基于XAI的CDSS。

0

相关内容

XAI

《人工智能辅助决策中的数据可视化：系统性综述》

《人工智能辅助决策中的数据可视化：系统性综述》

专知会员服务

27+阅读 · 2025年8月22日

可解释的人工智能在生物医学图像分析中的应用综述

可解释的人工智能在生物医学图像分析中的应用综述

专知会员服务

14+阅读 · 2025年7月11日

可解释人工智能（XAI）：从内在可解释性到大语言模型

可解释人工智能（XAI）：从内在可解释性到大语言模型

专知会员服务

34+阅读 · 2025年1月20日

《提高决策支持系统透明度的可解释人工智能》最新100页

《提高决策支持系统透明度的可解释人工智能》最新100页

专知会员服务

51+阅读 · 2024年11月28日

金融时间序列预测中的可解释人工智能（XAI）综述

金融时间序列预测中的可解释人工智能（XAI）综述

专知会员服务

44+阅读 · 2024年7月25日

推荐！《人与AI协作中的可解释人工智能》320页论文

推荐！《人与AI协作中的可解释人工智能》320页论文

专知会员服务

137+阅读 · 2023年7月31日

《可解释人工智能的态势感知框架 (SAFE-AI) 和 XAI 系统的人为因素考虑》麻省理工学院17页论文

《可解释人工智能的态势感知框架 (SAFE-AI) 和 XAI 系统的人为因素考虑》麻省理工学院17页论文

专知会员服务

106+阅读 · 2023年2月19日

推荐！DARPA XAI计划支持 200页报告《人类-人工智能系统中的解释：可解释人工智能的关键思想和出版物的文献元分析综述概要和目录》

推荐！DARPA XAI计划支持 200页报告《人类-人工智能系统中的解释：可解释人工智能的关键思想和出版物的文献元分析综述概要和目录》

专知会员服务

92+阅读 · 2022年7月21日

【AI+军事】附论文《用于战略混合行动的可解释人工智能》

【AI+军事】附论文《用于战略混合行动的可解释人工智能》

专知会员服务

78+阅读 · 2022年5月2日

【干货书】可解释人工智能(xAI)方法和深度元学习模型

【干货书】可解释人工智能(xAI)方法和深度元学习模型

专知会员服务

62+阅读 · 2020年9月13日

推荐！《可解释人工智能及其军事意义》【译文】印智库ORF2022最新报告

推荐！《可解释人工智能及其军事意义》【译文】印智库ORF2022最新报告

专知

40+阅读 · 2022年11月4日

推荐！【中文版】瑞典国防研究局《可解释人工智能：探索XAI技术在军事深度学习中的应用》56页技术报告

推荐！【中文版】瑞典国防研究局《可解释人工智能：探索XAI技术在军事深度学习中的应用》56页技术报告

专知

17+阅读 · 2022年7月8日

XAI是否靠谱？美国DARPA「可解释人工智能」（XAI计划）的4年回顾与经验总结，附中文版

XAI是否靠谱？美国DARPA「可解释人工智能」（XAI计划）的4年回顾与经验总结，附中文版

专知

29+阅读 · 2022年4月3日

【DSAA教程】可解释人工智能金融服务，325页ppt，Explainable AI in Financial Services

【DSAA教程】可解释人工智能金融服务，325页ppt，Explainable AI in Financial Services

专知

14+阅读 · 2021年10月21日

最新《可解释人工智能》概述，50页ppt

最新《可解释人工智能》概述，50页ppt

专知

12+阅读 · 2021年3月17日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

专知

10+阅读 · 2019年12月21日

【综述】医疗可解释人工智能综述论文

【综述】医疗可解释人工智能综述论文

专知

33+阅读 · 2019年7月18日

【干货】XAI可解释人工智能最新进展，89页ppt

【干货】XAI可解释人工智能最新进展，89页ppt

专知

52+阅读 · 2019年6月19日

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

专知

11+阅读 · 2019年2月8日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

大型复杂医学领域本体质量评估理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度表达和迁移学习的人体检测研究

国家自然科学基金

6+阅读 · 2015年12月31日

网络本体质量及适应性的评估研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多通道深度卷积神经网络的人体行为分析研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于计算智能的心系基础证量化诊断方法学研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向复杂情报的大数据分析方法与决策支持

国家自然科学基金

43+阅读 · 2014年12月31日

动态环境下决策单元效率评价方法与应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于agent与众包数据获取服务的企业决策支持关键方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

AI-Assisted Decision Making with Human Learning

AI-Assisted Decision Making with Human Learning

Arxiv

0+阅读 · 2月19日

Explanation User Interfaces: A Systematic Literature Review

Arxiv

0+阅读 · 2月19日

Human-Centered Artificial Intelligence (HCAI): Foundations and Approaches

Arxiv

0+阅读 · 2月18日

Leveraging Generative AI for Human Understanding: Meta-Requirements and Design Principles for Explanatory AI as a new Paradigm

Arxiv

0+阅读 · 2月12日

Exploring SAIG Methods for an Objective Evaluation of XAI

Arxiv

0+阅读 · 2月9日

Evaluating Prediction-based Interventions with Human Decision Makers In Mind

Arxiv

0+阅读 · 2月4日

Agentic Explainable Artificial Intelligence (Agentic XAI) Approach To Explore Better Explanation

Arxiv

0+阅读 · 2月4日

Evaluating Actionability in Explainable AI

Arxiv

0+阅读 · 1月27日

Evaluating Generative AI in the Lab: Methodological Challenges and Guidelines

Arxiv

0+阅读 · 1月23日

XChoice: Explainable Evaluation of AI-Human Alignment in LLM-based Constrained Choice Decision Making

Arxiv

0+阅读 · 1月16日

VIP会员

文章信息

相关主题

临床决策支持

决策支持系统

最新内容

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

2+阅读 · 5月30日

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

2+阅读 · 5月30日

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

4+阅读 · 5月30日

美以伊战争：首次人工智能战争——军事自主性困境

美以伊战争：首次人工智能战争——军事自主性困境

专知会员服务

4+阅读 · 5月30日

《Palantir任务保障性软件安全标准（MA-S2）》

《Palantir任务保障性软件安全标准（MA-S2）》

专知会员服务

9+阅读 · 5月30日

《美海军利用扩展现实增强知识流动研究》300页报告

《美海军利用扩展现实增强知识流动研究》300页报告

专知会员服务

5+阅读 · 5月30日

基于声学的无人机检测技术综述

基于声学的无人机检测技术综述

专知会员服务

6+阅读 · 5月30日

《当代混合战争分析框架：俄乌战争经验教训》

《当代混合战争分析框架：俄乌战争经验教训》

专知会员服务

6+阅读 · 5月30日

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

专知会员服务

11+阅读 · 5月29日

AutoScientists：自组织智能体团队驱动长期科学实验

AutoScientists：自组织智能体团队驱动长期科学实验

专知会员服务

6+阅读 · 5月29日

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

《阿利·伯克级驱逐舰的战损修理：桌面推演结果》报告

专知会员服务

6+阅读 · 5月29日

战略前沿人工智能的再思考（中文）

战略前沿人工智能的再思考（中文）

专知会员服务

8+阅读 · 5月29日

《量化地基防空系统间接效应的博弈论方法》

《量化地基防空系统间接效应的博弈论方法》

专知会员服务

6+阅读 · 5月29日

传感器网络：美国如何探测来自伊朗的导弹与无人机

传感器网络：美国如何探测来自伊朗的导弹与无人机

专知会员服务

6+阅读 · 5月29日

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

《无人机战争中的经济不对称：伊朗“沙赫德-136”对抗以色列“铁穹”防御系统的案例研究》

专知会员服务

9+阅读 · 5月29日

相关VIP内容

《人工智能辅助决策中的数据可视化：系统性综述》

《人工智能辅助决策中的数据可视化：系统性综述》

专知会员服务

27+阅读 · 2025年8月22日

可解释的人工智能在生物医学图像分析中的应用综述

可解释的人工智能在生物医学图像分析中的应用综述

专知会员服务

14+阅读 · 2025年7月11日

可解释人工智能（XAI）：从内在可解释性到大语言模型

可解释人工智能（XAI）：从内在可解释性到大语言模型

专知会员服务

34+阅读 · 2025年1月20日

《提高决策支持系统透明度的可解释人工智能》最新100页

《提高决策支持系统透明度的可解释人工智能》最新100页

专知会员服务

51+阅读 · 2024年11月28日

金融时间序列预测中的可解释人工智能（XAI）综述

金融时间序列预测中的可解释人工智能（XAI）综述

专知会员服务

44+阅读 · 2024年7月25日

推荐！《人与AI协作中的可解释人工智能》320页论文

推荐！《人与AI协作中的可解释人工智能》320页论文

专知会员服务

137+阅读 · 2023年7月31日

《可解释人工智能的态势感知框架 (SAFE-AI) 和 XAI 系统的人为因素考虑》麻省理工学院17页论文

《可解释人工智能的态势感知框架 (SAFE-AI) 和 XAI 系统的人为因素考虑》麻省理工学院17页论文

专知会员服务

106+阅读 · 2023年2月19日

推荐！DARPA XAI计划支持 200页报告《人类-人工智能系统中的解释：可解释人工智能的关键思想和出版物的文献元分析综述概要和目录》

推荐！DARPA XAI计划支持 200页报告《人类-人工智能系统中的解释：可解释人工智能的关键思想和出版物的文献元分析综述概要和目录》

专知会员服务

92+阅读 · 2022年7月21日

【AI+军事】附论文《用于战略混合行动的可解释人工智能》

【AI+军事】附论文《用于战略混合行动的可解释人工智能》

专知会员服务

78+阅读 · 2022年5月2日

【干货书】可解释人工智能(xAI)方法和深度元学习模型

【干货书】可解释人工智能(xAI)方法和深度元学习模型

专知会员服务

62+阅读 · 2020年9月13日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

美以伊战争：首次人工智能战争——军事自主性困境

BES：让语言模型通过双向进化搜索自我改进

以色列-美国-伊朗战争中的无人机：关键要点

相关资讯

推荐！《可解释人工智能及其军事意义》【译文】印智库ORF2022最新报告

推荐！《可解释人工智能及其军事意义》【译文】印智库ORF2022最新报告

专知

40+阅读 · 2022年11月4日

推荐！【中文版】瑞典国防研究局《可解释人工智能：探索XAI技术在军事深度学习中的应用》56页技术报告

推荐！【中文版】瑞典国防研究局《可解释人工智能：探索XAI技术在军事深度学习中的应用》56页技术报告

专知

17+阅读 · 2022年7月8日

XAI是否靠谱？美国DARPA「可解释人工智能」（XAI计划）的4年回顾与经验总结，附中文版

XAI是否靠谱？美国DARPA「可解释人工智能」（XAI计划）的4年回顾与经验总结，附中文版

专知

29+阅读 · 2022年4月3日

【DSAA教程】可解释人工智能金融服务，325页ppt，Explainable AI in Financial Services

【DSAA教程】可解释人工智能金融服务，325页ppt，Explainable AI in Financial Services

专知

14+阅读 · 2021年10月21日

最新《可解释人工智能》概述，50页ppt

最新《可解释人工智能》概述，50页ppt

专知

12+阅读 · 2021年3月17日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

专知

10+阅读 · 2019年12月21日

【综述】医疗可解释人工智能综述论文

【综述】医疗可解释人工智能综述论文

专知

33+阅读 · 2019年7月18日

【干货】XAI可解释人工智能最新进展，89页ppt

【干货】XAI可解释人工智能最新进展，89页ppt

专知

52+阅读 · 2019年6月19日

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

专知

11+阅读 · 2019年2月8日

相关论文

AI-Assisted Decision Making with Human Learning

AI-Assisted Decision Making with Human Learning

Arxiv

0+阅读 · 2月19日

Explanation User Interfaces: A Systematic Literature Review

Arxiv

0+阅读 · 2月19日

Human-Centered Artificial Intelligence (HCAI): Foundations and Approaches

Arxiv

0+阅读 · 2月18日

Leveraging Generative AI for Human Understanding: Meta-Requirements and Design Principles for Explanatory AI as a new Paradigm

Arxiv

0+阅读 · 2月12日

Exploring SAIG Methods for an Objective Evaluation of XAI

Arxiv

0+阅读 · 2月9日

Evaluating Prediction-based Interventions with Human Decision Makers In Mind

Arxiv

0+阅读 · 2月4日

Agentic Explainable Artificial Intelligence (Agentic XAI) Approach To Explore Better Explanation

Arxiv

0+阅读 · 2月4日

Evaluating Actionability in Explainable AI

Arxiv

0+阅读 · 1月27日

Evaluating Generative AI in the Lab: Methodological Challenges and Guidelines

Arxiv

0+阅读 · 1月23日

XChoice: Explainable Evaluation of AI-Human Alignment in LLM-based Constrained Choice Decision Making

Arxiv

0+阅读 · 1月16日

相关基金

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

大型复杂医学领域本体质量评估理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度表达和迁移学习的人体检测研究

国家自然科学基金

6+阅读 · 2015年12月31日

网络本体质量及适应性的评估研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多通道深度卷积神经网络的人体行为分析研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于计算智能的心系基础证量化诊断方法学研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向复杂情报的大数据分析方法与决策支持

国家自然科学基金

43+阅读 · 2014年12月31日

动态环境下决策单元效率评价方法与应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

基于agent与众包数据获取服务的企业决策支持关键方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员