When more precision is worse: Do people recognize inadequate scene representations in concept-based explainable AI? - 专知论文

会员服务 ·

0

识别 · 无关特征 · 相关特征 · 系统 · 概念图 ·

When more precision is worse: Do people recognize inadequate scene representations in concept-based explainable AI?

翻译：当更高的精确度反而更糟：人们能否识别基于概念的可解释人工智能中不充分的场景表征？

Romy Müller,Wiebke Klausing

Explainable artificial intelligence (XAI) aims to help uncover flaws in an AI model's internal representations. But do people draw the right conclusions from its explanations? Specifically, do they recognize an AI's inability to distinguish between relevant and irrelevant features? In the present study, a simulated AI classified images of railway trespassers as dangerous or not. To explain which features it has used, other images from the dataset were shown that activate the AI in a similar way. These concept images varied in three relevant features (i.e., a person's distance to the tracks, direction, and action) and in an irrelevant feature (i.e., scene background). When the AI uses a feature in its decision, this feature is retained in the concept images, otherwise the images randomize over it (e.g., same distance, varied backgrounds). Participants rated the AI more favorably when it retained relevant features. For the irrelevant feature, they did not mind in general, and sometimes even preferred it to be retained. This suggests that people may not recognize it when an AI model relies on irrelevant features to make its decisions.

翻译：可解释人工智能（XAI）旨在帮助揭示人工智能模型内部表征的缺陷。然而，人们是否能从其解释中得出正确的结论？具体而言，他们能否识别出人工智能无法区分相关特征与无关特征的能力缺陷？在本研究中，一个模拟人工智能系统对铁路侵入者的图像进行了危险与否的分类。为解释其所使用的特征，研究展示了数据集中能类似方式激活该系统的其他图像。这些概念图像在三个相关特征（即人物与轨道的距离、行进方向和动作）以及一个无关特征（即场景背景）上存在差异。当人工智能在决策中使用某一特征时，该特征会在概念图像中保留，否则图像将在该特征上随机呈现（例如相同距离下背景各异）。参与者对保留相关特征的人工智能评价更高。对于无关特征，他们总体上并不介意，有时甚至更倾向于保留该特征。这表明人们可能无法识别人工智能模型依赖无关特征进行决策的情况。

0

相关内容

可解释人工智能综合指南：从经典模型到大规模语言模型

可解释人工智能综合指南：从经典模型到大规模语言模型

专知会员服务

37+阅读 · 2024年12月28日

多模态可解释人工智能综述：过去、现在与未来

多模态可解释人工智能综述：过去、现在与未来

专知会员服务

45+阅读 · 2024年12月20日

不可错过! 哈佛大学最新《可解释人工智能》课程，讲述从简单的预测到复杂的生成模型

不可错过! 哈佛大学最新《可解释人工智能》课程，讲述从简单的预测到复杂的生成模型

专知会员服务

60+阅读 · 2023年6月28日

可解释人工智能中的对抗攻击和防御

可解释人工智能中的对抗攻击和防御

专知会员服务

43+阅读 · 2023年6月20日

可解释AI最新有什么进展？Wojciech最新《概念级可解释人工智能》报告，52页ppt

可解释AI最新有什么进展？Wojciech最新《概念级可解释人工智能》报告，52页ppt

专知会员服务

60+阅读 · 2023年2月22日

《可解释人工智能的态势感知框架 (SAFE-AI) 和 XAI 系统的人为因素考虑》麻省理工学院17页论文

《可解释人工智能的态势感知框架 (SAFE-AI) 和 XAI 系统的人为因素考虑》麻省理工学院17页论文

专知会员服务

106+阅读 · 2023年2月19日

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

专知会员服务

70+阅读 · 2022年9月14日

推荐！【中文版】瑞典国防研究局《可解释人工智能：探索XAI技术在军事深度学习中的应用》56页技术报告

推荐！【中文版】瑞典国防研究局《可解释人工智能：探索XAI技术在军事深度学习中的应用》56页技术报告

专知会员服务

150+阅读 · 2022年7月6日

XAI+网络安全？布兰登大学等最新《可解释人工智能在网络安全应用》综述，33页pdf阐述其现状、挑战、开放问题和未来方向

XAI+网络安全？布兰登大学等最新《可解释人工智能在网络安全应用》综述，33页pdf阐述其现状、挑战、开放问题和未来方向

专知会员服务

65+阅读 · 2022年7月3日

【干货书】可解释人工智能(xAI)方法和深度元学习模型

【干货书】可解释人工智能(xAI)方法和深度元学习模型

专知会员服务

62+阅读 · 2020年9月13日

推荐！《可解释人工智能及其军事意义》【译文】印智库ORF2022最新报告

推荐！《可解释人工智能及其军事意义》【译文】印智库ORF2022最新报告

专知

40+阅读 · 2022年11月4日

推荐！【中文版】瑞典国防研究局《可解释人工智能：探索XAI技术在军事深度学习中的应用》56页技术报告

推荐！【中文版】瑞典国防研究局《可解释人工智能：探索XAI技术在军事深度学习中的应用》56页技术报告

专知

17+阅读 · 2022年7月8日

XAI是否靠谱？美国DARPA「可解释人工智能」（XAI计划）的4年回顾与经验总结，附中文版

XAI是否靠谱？美国DARPA「可解释人工智能」（XAI计划）的4年回顾与经验总结，附中文版

专知

29+阅读 · 2022年4月3日

【DSAA教程】可解释人工智能金融服务，325页ppt，Explainable AI in Financial Services

【DSAA教程】可解释人工智能金融服务，325页ppt，Explainable AI in Financial Services

专知

14+阅读 · 2021年10月21日

最新《可解释人工智能》概述，50页ppt

最新《可解释人工智能》概述，50页ppt

专知

12+阅读 · 2021年3月17日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

专知

10+阅读 · 2019年12月21日

知识图谱在可解释人工智能中的作用，附81页ppt

知识图谱在可解释人工智能中的作用，附81页ppt

专知

89+阅读 · 2019年11月11日

可解释人工智能XAI进展，看这份100页PPT为你讲解

可解释人工智能XAI进展，看这份100页PPT为你讲解

专知

49+阅读 · 2019年10月27日

【干货】XAI可解释人工智能最新进展，89页ppt

【干货】XAI可解释人工智能最新进展，89页ppt

专知

52+阅读 · 2019年6月19日

无人驾驶中4D场景实时解析算法研究

国家自然科学基金

12+阅读 · 2017年12月31日

面向遮挡条件下的人脸识别方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

基于人脸表情、身体姿态和语音的多模态情感识别方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于矩阵分解的图像表示方法及其应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于高阶信息和深度表示的图像复原研究

国家自然科学基金

1+阅读 · 2015年12月31日

不同加工层次和不同时空尺度下无意识加工之间的相互作用

国家自然科学基金

0+阅读 · 2015年12月31日

基于稀疏表达理论和RGBD图像的人脸表情识别

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

Agentic Explainable Artificial Intelligence (Agentic XAI) Approach To Explore Better Explanation

Arxiv

0+阅读 · 3月12日

Beyond Explainable AI (XAI): An Overdue Paradigm Shift and Post-XAI Research Directions

Arxiv

0+阅读 · 3月11日

Feature salience -- not task-informativeness -- drives machine learning model explanations

Arxiv

0+阅读 · 2月18日

Transferable XAI: Relating Understanding Across Domains with Explanation Transfer

Arxiv

0+阅读 · 2月14日

Editable XAI: Toward Bidirectional Human-AI Alignment with Co-Editable Explanations of Interpretable Attributes

Arxiv

0+阅读 · 2月13日

Leveraging Generative AI for Human Understanding: Meta-Requirements and Design Principles for Explanatory AI as a new Paradigm

Arxiv

0+阅读 · 2月12日

Exploring SAIG Methods for an Objective Evaluation of XAI

Arxiv

0+阅读 · 2月9日

An Information-Theoretic Framework for Comparing Voice and Text Explainability

Arxiv

0+阅读 · 2月6日

Vivifying LIME: Visual Interactive Testbed for LIME Analysis

Vivifying LIME: Visual Interactive Testbed for LIME Analysis

Arxiv

0+阅读 · 2月4日

Trade-offs in Financial AI: Explainability in a Trilemma with Accuracy and Compliance

Arxiv

0+阅读 · 2月1日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | Sheaf-ADMM：用可微优化学习多智能体协调

ICML 2026 | Sheaf-ADMM：用可微优化学习多智能体协调

专知会员服务

1+阅读 · 24分钟前

综述 | OPSD：大语言模型的在线策略自蒸馏

综述 | OPSD：大语言模型的在线策略自蒸馏

专知会员服务

1+阅读 · 28分钟前

算法化战争：人工智能时代的新范式（万字长文）

算法化战争：人工智能时代的新范式（万字长文）

专知会员服务

2+阅读 · 今天14:39

帕兰蒂尔Maven：军事人工智能的新纪元

帕兰蒂尔Maven：军事人工智能的新纪元

专知会员服务

2+阅读 · 今天14:00

《军事网络取证系统中的人工智能驱动情报融合：帕兰蒂尔公司“Maven智能系统”案例研究》

《军事网络取证系统中的人工智能驱动情报融合：帕兰蒂尔公司“Maven智能系统”案例研究》

专知会员服务

4+阅读 · 今天13:20

《扩展主权人工智能操作系统：将Symphony作为帕兰蒂尔Foundry与英伟达的计算本体》

《扩展主权人工智能操作系统：将Symphony作为帕兰蒂尔Foundry与英伟达的计算本体》

专知会员服务

4+阅读 · 今天13:16

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

专知会员服务

11+阅读 · 5月31日

比利时发布用于实时战场军事装备识别的离线人工智能系统

比利时发布用于实时战场军事装备识别的离线人工智能系统

专知会员服务

6+阅读 · 5月31日

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

专知会员服务

5+阅读 · 5月31日

超越网格：作战环境对炮兵的影响

超越网格：作战环境对炮兵的影响

专知会员服务

3+阅读 · 5月31日

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

专知会员服务

8+阅读 · 5月31日

综述 | 推理时控制：可信大语言模型的运行时治理全景

综述 | 推理时控制：可信大语言模型的运行时治理全景

专知会员服务

4+阅读 · 5月31日

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

6+阅读 · 5月30日

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

7+阅读 · 5月30日

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

7+阅读 · 5月30日

相关VIP内容

可解释人工智能综合指南：从经典模型到大规模语言模型

可解释人工智能综合指南：从经典模型到大规模语言模型

专知会员服务

37+阅读 · 2024年12月28日

多模态可解释人工智能综述：过去、现在与未来

多模态可解释人工智能综述：过去、现在与未来

专知会员服务

45+阅读 · 2024年12月20日

不可错过! 哈佛大学最新《可解释人工智能》课程，讲述从简单的预测到复杂的生成模型

不可错过! 哈佛大学最新《可解释人工智能》课程，讲述从简单的预测到复杂的生成模型

专知会员服务

60+阅读 · 2023年6月28日

可解释人工智能中的对抗攻击和防御

可解释人工智能中的对抗攻击和防御

专知会员服务

43+阅读 · 2023年6月20日

可解释AI最新有什么进展？Wojciech最新《概念级可解释人工智能》报告，52页ppt

可解释AI最新有什么进展？Wojciech最新《概念级可解释人工智能》报告，52页ppt

专知会员服务

60+阅读 · 2023年2月22日

《可解释人工智能的态势感知框架 (SAFE-AI) 和 XAI 系统的人为因素考虑》麻省理工学院17页论文

《可解释人工智能的态势感知框架 (SAFE-AI) 和 XAI 系统的人为因素考虑》麻省理工学院17页论文

专知会员服务

106+阅读 · 2023年2月19日

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

专知会员服务

70+阅读 · 2022年9月14日

推荐！【中文版】瑞典国防研究局《可解释人工智能：探索XAI技术在军事深度学习中的应用》56页技术报告

推荐！【中文版】瑞典国防研究局《可解释人工智能：探索XAI技术在军事深度学习中的应用》56页技术报告

专知会员服务

150+阅读 · 2022年7月6日

XAI+网络安全？布兰登大学等最新《可解释人工智能在网络安全应用》综述，33页pdf阐述其现状、挑战、开放问题和未来方向

XAI+网络安全？布兰登大学等最新《可解释人工智能在网络安全应用》综述，33页pdf阐述其现状、挑战、开放问题和未来方向

专知会员服务

65+阅读 · 2022年7月3日

【干货书】可解释人工智能(xAI)方法和深度元学习模型

【干货书】可解释人工智能(xAI)方法和深度元学习模型

专知会员服务

62+阅读 · 2020年9月13日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | OPSD：大语言模型的在线策略自蒸馏

帕兰蒂尔Maven：军事人工智能的新纪元

ICML 2026 | Sheaf-ADMM：用可微优化学习多智能体协调

算法化战争：人工智能时代的新范式（万字长文）

相关资讯

推荐！《可解释人工智能及其军事意义》【译文】印智库ORF2022最新报告

推荐！《可解释人工智能及其军事意义》【译文】印智库ORF2022最新报告

专知

40+阅读 · 2022年11月4日

推荐！【中文版】瑞典国防研究局《可解释人工智能：探索XAI技术在军事深度学习中的应用》56页技术报告

推荐！【中文版】瑞典国防研究局《可解释人工智能：探索XAI技术在军事深度学习中的应用》56页技术报告

专知

17+阅读 · 2022年7月8日

XAI是否靠谱？美国DARPA「可解释人工智能」（XAI计划）的4年回顾与经验总结，附中文版

XAI是否靠谱？美国DARPA「可解释人工智能」（XAI计划）的4年回顾与经验总结，附中文版

专知

29+阅读 · 2022年4月3日

【DSAA教程】可解释人工智能金融服务，325页ppt，Explainable AI in Financial Services

【DSAA教程】可解释人工智能金融服务，325页ppt，Explainable AI in Financial Services

专知

14+阅读 · 2021年10月21日

最新《可解释人工智能》概述，50页ppt

最新《可解释人工智能》概述，50页ppt

专知

12+阅读 · 2021年3月17日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

专知

10+阅读 · 2019年12月21日

知识图谱在可解释人工智能中的作用，附81页ppt

知识图谱在可解释人工智能中的作用，附81页ppt

专知

89+阅读 · 2019年11月11日

可解释人工智能XAI进展，看这份100页PPT为你讲解

可解释人工智能XAI进展，看这份100页PPT为你讲解

专知

49+阅读 · 2019年10月27日

【干货】XAI可解释人工智能最新进展，89页ppt

【干货】XAI可解释人工智能最新进展，89页ppt

专知

52+阅读 · 2019年6月19日

相关论文

Agentic Explainable Artificial Intelligence (Agentic XAI) Approach To Explore Better Explanation

Arxiv

0+阅读 · 3月12日

Beyond Explainable AI (XAI): An Overdue Paradigm Shift and Post-XAI Research Directions

Arxiv

0+阅读 · 3月11日

Feature salience -- not task-informativeness -- drives machine learning model explanations

Arxiv

0+阅读 · 2月18日

Transferable XAI: Relating Understanding Across Domains with Explanation Transfer

Arxiv

0+阅读 · 2月14日

Editable XAI: Toward Bidirectional Human-AI Alignment with Co-Editable Explanations of Interpretable Attributes

Arxiv

0+阅读 · 2月13日

Leveraging Generative AI for Human Understanding: Meta-Requirements and Design Principles for Explanatory AI as a new Paradigm

Arxiv

0+阅读 · 2月12日

Exploring SAIG Methods for an Objective Evaluation of XAI

Arxiv

0+阅读 · 2月9日

An Information-Theoretic Framework for Comparing Voice and Text Explainability

Arxiv

0+阅读 · 2月6日

Vivifying LIME: Visual Interactive Testbed for LIME Analysis

Vivifying LIME: Visual Interactive Testbed for LIME Analysis

Arxiv

0+阅读 · 2月4日

Trade-offs in Financial AI: Explainability in a Trilemma with Accuracy and Compliance

Arxiv

0+阅读 · 2月1日

相关基金

无人驾驶中4D场景实时解析算法研究

国家自然科学基金

12+阅读 · 2017年12月31日

面向遮挡条件下的人脸识别方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

基于人脸表情、身体姿态和语音的多模态情感识别方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于矩阵分解的图像表示方法及其应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于高阶信息和深度表示的图像复原研究

国家自然科学基金

1+阅读 · 2015年12月31日

不同加工层次和不同时空尺度下无意识加工之间的相互作用

国家自然科学基金

0+阅读 · 2015年12月31日

基于稀疏表达理论和RGBD图像的人脸表情识别

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员