本论文由两部分组成。第一部分展示了多项旨在扩展可解释人工智能(Explainable AI, XAI)数学基础的研究工作。具体而言,本文深入探讨了归因方法、反事实说明以及基于概念的模型。

归因方法旨在识别对特定模型决策最重要的输入特征,但“重要性”的定义往往存在歧义。在第二章中,我们提出了一种新的诠释方式,将归因分数解析为一种“方向”。该方向告知用户应如何调整其特征以实现特定目标。然而,研究表明此类方法在输入层面缺乏鲁棒性:属性高度相似的用户可能会得到截然不同的解释。

在随后的第三章和第四章中,我们重点研究了反事实说明。我们论证了遵循此类说明进行操作会导致底层数据分布发生偏移。研究进一步表明,这种偏移可能导致模型准确率下降,甚至随时间推移使解释本身失效。

在第五章中,我们提出了一种新的方法与框架,用于开发样本高效的基于概念的模型。通过有效利用因果表示学习(Causal Representation Learning)中的技术,我们实现了更高的决策数据效率。

最后,在第二部分及最后一章中,我们探讨了 Bandit 凸优化问题。我们提出了一种能够解决该问题的新算法;与现有算法相比,该算法在确保易于高效实现的同时,显著提升了遗憾界(Regret bounds)。

成为VIP会员查看完整内容
3

相关内容

一个可以解释的AI(Explainable AI, 简称XAI)或透明的AI(Transparent AI),其行为可以被人类容易理解。它与机器学习中“ 黑匣子 ” 的概念形成鲜明对比,这意味着复杂算法运作的“可解释性”,即使他们的设计者也无法解释人工智能为什么会做出具体决定。 XAI可用于实现社会解释的权利。有些人声称透明度很少是免费提供的,并且在人工智能的“智能”和透明度之间经常存在权衡; 随着AI系统内部复杂性的增加,这些权衡预计会变得更大。解释AI决策的技术挑战有时被称为可解释性问题。另一个考虑因素是信息(信息过载),因此,完全透明可能并不总是可行或甚至不需要。提供的信息量应根据利益相关者与智能系统的交互情况而有所不同。 https://www.darpa.mil/program/explainable-artificial-intelligence
【CMU博士论文】迈向可解释机器学习的理论基础
专知会员服务
13+阅读 · 4月16日
可解释人工智能的基础
专知会员服务
32+阅读 · 2025年10月26日
可解释的人工智能在生物医学图像分析中的应用综述
专知会员服务
14+阅读 · 2025年7月11日
人工智能(XAI)可解释性的研究进展!
专知会员服务
9+阅读 · 2024年6月12日
【干货书】可解释人工智能(xAI)方法和深度元学习模型
专知会员服务
62+阅读 · 2020年9月13日
【Science最新论文】XAI—可解释人工智能简述,机遇与挑战
专知会员服务
166+阅读 · 2019年12月21日
最新《可解释人工智能》概述,50页ppt
专知
12+阅读 · 2021年3月17日
深度学习可解释性研究进展
专知
19+阅读 · 2020年6月26日
【综述】医疗可解释人工智能综述论文
专知
33+阅读 · 2019年7月18日
国家自然科学基金
9+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
Arxiv
0+阅读 · 4月8日
Arxiv
1+阅读 · 3月7日
Arxiv
12+阅读 · 2023年9月21日
VIP会员
最新内容
认知战与交战性质的改变:神经战略视角
专知会员服务
5+阅读 · 5月8日
相关基金
国家自然科学基金
9+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员