【博士论文】可解释人工智能的数学基础与 Bandit 优化的研究进展 - 专知VIP

会员服务 ·

3

可解释人工智能 · Bandit 优化 · 反事实学习 ·

【博士论文】可解释人工智能的数学基础与 Bandit 优化的研究进展

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

本论文由两部分组成。第一部分展示了多项旨在扩展可解释人工智能（Explainable AI, XAI）数学基础的研究工作。具体而言，本文深入探讨了归因方法、反事实说明以及基于概念的模型。

归因方法旨在识别对特定模型决策最重要的输入特征，但“重要性”的定义往往存在歧义。在第二章中，我们提出了一种新的诠释方式，将归因分数解析为一种“方向”。该方向告知用户应如何调整其特征以实现特定目标。然而，研究表明此类方法在输入层面缺乏鲁棒性：属性高度相似的用户可能会得到截然不同的解释。

在随后的第三章和第四章中，我们重点研究了反事实说明。我们论证了遵循此类说明进行操作会导致底层数据分布发生偏移。研究进一步表明，这种偏移可能导致模型准确率下降，甚至随时间推移使解释本身失效。

在第五章中，我们提出了一种新的方法与框架，用于开发样本高效的基于概念的模型。通过有效利用因果表示学习（Causal Representation Learning）中的技术，我们实现了更高的决策数据效率。

最后，在第二部分及最后一章中，我们探讨了 Bandit 凸优化问题。我们提出了一种能够解决该问题的新算法；与现有算法相比，该算法在确保易于高效实现的同时，显著提升了遗憾界（Regret bounds）。

成为VIP会员查看完整内容

3

相关内容

可解释人工智能

可解释人工智能

一个可以解释的AI（Explainable AI, 简称XAI）或透明的AI（Transparent AI），其行为可以被人类容易理解。它与机器学习中“ 黑匣子 ” 的概念形成鲜明对比，这意味着复杂算法运作的“可解释性”，即使他们的设计者也无法解释人工智能为什么会做出具体决定。 XAI可用于实现社会解释的权利。有些人声称透明度很少是免费提供的，并且在人工智能的“智能”和透明度之间经常存在权衡; 随着AI系统内部复杂性的增加，这些权衡预计会变得更大。解释AI决策的技术挑战有时被称为可解释性问题。另一个考虑因素是信息（信息过载），因此，完全透明可能并不总是可行或甚至不需要。提供的信息量应根据利益相关者与智能系统的交互情况而有所不同。 https://www.darpa.mil/program/explainable-artificial-intelligence

【CMU博士论文】迈向可解释机器学习的理论基础

【CMU博士论文】迈向可解释机器学习的理论基础

专知会员服务

13+阅读 · 4月16日

可解释人工智能的基础

可解释人工智能的基础

专知会员服务

32+阅读 · 2025年10月26日

可解释的人工智能在生物医学图像分析中的应用综述

可解释的人工智能在生物医学图像分析中的应用综述

专知会员服务

14+阅读 · 2025年7月11日

人工智能（XAI）可解释性的研究进展！

人工智能（XAI）可解释性的研究进展！

专知会员服务

9+阅读 · 2024年6月12日

不可错过! 哈佛大学最新《可解释人工智能》课程，讲述从简单的预测到复杂的生成模型

不可错过! 哈佛大学最新《可解释人工智能》课程，讲述从简单的预测到复杂的生成模型

专知会员服务

60+阅读 · 2023年6月28日

《可解释人工智能的态势感知框架 (SAFE-AI) 和 XAI 系统的人为因素考虑》麻省理工学院17页论文

《可解释人工智能的态势感知框架 (SAFE-AI) 和 XAI 系统的人为因素考虑》麻省理工学院17页论文

专知会员服务

105+阅读 · 2023年2月19日

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

专知会员服务

70+阅读 · 2022年9月14日

【AI+军事】附论文《用于战略混合行动的可解释人工智能》

【AI+军事】附论文《用于战略混合行动的可解释人工智能》

专知会员服务

78+阅读 · 2022年5月2日

【干货书】可解释人工智能(xAI)方法和深度元学习模型

【干货书】可解释人工智能(xAI)方法和深度元学习模型

专知会员服务

62+阅读 · 2020年9月13日

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

专知会员服务

166+阅读 · 2019年12月21日

【Manning新书】可解释人工智能: 构建可解释机器学习系统，330页pdf

【Manning新书】可解释人工智能: 构建可解释机器学习系统，330页pdf

专知

35+阅读 · 2022年6月2日

【Manning新书】可解释人工智能: 构建可解释机器学习系统，144页pdf

【Manning新书】可解释人工智能: 构建可解释机器学习系统，144页pdf

专知

12+阅读 · 2022年1月28日

最新《可解释人工智能》概述，50页ppt

最新《可解释人工智能》概述，50页ppt

专知

12+阅读 · 2021年3月17日

深度学习可解释性研究进展

深度学习可解释性研究进展

专知

19+阅读 · 2020年6月26日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

专知

10+阅读 · 2019年12月21日

可解释人工智能XAI进展，看这份100页PPT为你讲解

可解释人工智能XAI进展，看这份100页PPT为你讲解

专知

49+阅读 · 2019年10月27日

【综述】医疗可解释人工智能综述论文

【综述】医疗可解释人工智能综述论文

专知

33+阅读 · 2019年7月18日

【干货】XAI可解释人工智能最新进展，89页ppt

【干货】XAI可解释人工智能最新进展，89页ppt

专知

52+阅读 · 2019年6月19日

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

专知

11+阅读 · 2019年2月8日

天元数学交流项目图像处理中的数学理论及方法研讨会

国家自然科学基金

9+阅读 · 2017年12月31日

面向特征提取的低秩与稀疏图嵌入理论与算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

分布无关的概率图模型结构学习方法的研究

国家自然科学基金

4+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

基于矩阵分解的图像表示方法及其应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

数据分析算法的融合与人才培养

国家自然科学基金

7+阅读 · 2015年12月31日

矩阵分解问题的优化算法与理论

国家自然科学基金

8+阅读 · 2014年12月31日

Beyond Explainable AI (XAI): An Overdue Paradigm Shift and Post-XAI Research Directions

Arxiv

0+阅读 · 4月10日

Explainable AI needs formalization

Arxiv

0+阅读 · 4月8日

Artificial Intelligence and the Structure of Mathematics

Arxiv

0+阅读 · 4月7日

An Agentic Approach to Generating XAI-Narratives

Arxiv

0+阅读 · 3月20日

HorizonMath: Measuring AI Progress Toward Mathematical Discovery with Automatic Verification

Arxiv

0+阅读 · 3月16日

Agentic Explainable Artificial Intelligence (Agentic XAI) Approach To Explore Better Explanation

Arxiv

0+阅读 · 3月12日

Mathematicians in the age of AI

Arxiv

1+阅读 · 3月7日

Beyond Explainable AI (XAI): An Overdue Paradigm Shift and Post-XAI Research Directions

Arxiv

0+阅读 · 2月27日

Towards Explainable Artificial Intelligence (XAI): A Data Mining Perspective

Arxiv

14+阅读 · 2024年1月9日

A Comprehensive Review on Financial Explainable AI

Arxiv

12+阅读 · 2023年9月21日

VIP会员

相关主题

可解释人工智能

反事实学习

最新内容

北约《俄乌战争经验教训课程指南：25份课程计划》150页

北约《俄乌战争经验教训课程指南：25份课程计划》150页

专知会员服务

1+阅读 · 46分钟前

《不确定性环境下基于智能体框架中实时多机器人任务分配的贝叶斯网络》博士论文

《不确定性环境下基于智能体框架中实时多机器人任务分配的贝叶斯网络》博士论文

专知会员服务

1+阅读 · 50分钟前

首场人工智能战争——俄乌战争（中文版、原文下载）

首场人工智能战争——俄乌战争（中文版、原文下载）

专知会员服务

1+阅读 · 今天1:52

《提升战术级作战规划水平：城市进攻作战中的机动样式研究》

《提升战术级作战规划水平：城市进攻作战中的机动样式研究》

专知会员服务

2+阅读 · 今天1:36

《人员配置对陆军突击清障车与联合突击桥战备状态的影响研究》

《人员配置对陆军突击清障车与联合突击桥战备状态的影响研究》

专知会员服务

1+阅读 · 今天1:28

管理咨询报告：美国国防部量子技术开发与实施评估（译文）

管理咨询报告：美国国防部量子技术开发与实施评估（译文）

专知会员服务

1+阅读 · 今天1:16

【博士论文】可解释人工智能的数学基础与 Bandit 优化的研究进展

【博士论文】可解释人工智能的数学基础与 Bandit 优化的研究进展

专知会员服务

3+阅读 · 5月8日

生成-过滤-控制-重放：LLM强化学习中Rollout策略的全面综述

生成-过滤-控制-重放：LLM强化学习中Rollout策略的全面综述

专知会员服务

1+阅读 · 5月8日

认知战与交战性质的改变：神经战略视角

认知战与交战性质的改变：神经战略视角

专知会员服务

5+阅读 · 5月8日

美国《国防授权法案》指令要求界定“认知战”：区分相关概念

美国《国防授权法案》指令要求界定“认知战”：区分相关概念

专知会员服务

4+阅读 · 5月8日

人工智能对特定国防资源管理流程的影响（万字长文）

人工智能对特定国防资源管理流程的影响（万字长文）

专知会员服务

5+阅读 · 5月8日

《多域作战概念实证检验：美军“史诗怒火”行动中跨域协同的地理空间混合方法分析研究》245页报告

《多域作战概念实证检验：美军“史诗怒火”行动中跨域协同的地理空间混合方法分析研究》245页报告

专知会员服务

9+阅读 · 5月8日

《预设时间的单次协同估计、制导与控制框架：实现同时目标拦截》2026最新40页报告

《预设时间的单次协同估计、制导与控制框架：实现同时目标拦截》2026最新40页报告

专知会员服务

10+阅读 · 5月8日

《美空军条令出版物：网络空间作战（2026版）》

《美空军条令出版物：网络空间作战（2026版）》

专知会员服务

11+阅读 · 5月8日

《美空军条令出版物：空军作战中的信息（2026版）》

《美空军条令出版物：空军作战中的信息（2026版）》

专知会员服务

13+阅读 · 5月8日

相关VIP内容

【CMU博士论文】迈向可解释机器学习的理论基础

【CMU博士论文】迈向可解释机器学习的理论基础

专知会员服务

13+阅读 · 4月16日

可解释人工智能的基础

可解释人工智能的基础

专知会员服务

32+阅读 · 2025年10月26日

可解释的人工智能在生物医学图像分析中的应用综述

可解释的人工智能在生物医学图像分析中的应用综述

专知会员服务

14+阅读 · 2025年7月11日

人工智能（XAI）可解释性的研究进展！

人工智能（XAI）可解释性的研究进展！

专知会员服务

9+阅读 · 2024年6月12日

不可错过! 哈佛大学最新《可解释人工智能》课程，讲述从简单的预测到复杂的生成模型

不可错过! 哈佛大学最新《可解释人工智能》课程，讲述从简单的预测到复杂的生成模型

专知会员服务

60+阅读 · 2023年6月28日

《可解释人工智能的态势感知框架 (SAFE-AI) 和 XAI 系统的人为因素考虑》麻省理工学院17页论文

《可解释人工智能的态势感知框架 (SAFE-AI) 和 XAI 系统的人为因素考虑》麻省理工学院17页论文

专知会员服务

105+阅读 · 2023年2月19日

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

不可错过！华盛顿大学最新《可解释人工智能》课程，系统讲述XAI最新进展

专知会员服务

70+阅读 · 2022年9月14日

【AI+军事】附论文《用于战略混合行动的可解释人工智能》

【AI+军事】附论文《用于战略混合行动的可解释人工智能》

专知会员服务

78+阅读 · 2022年5月2日

【干货书】可解释人工智能(xAI)方法和深度元学习模型

【干货书】可解释人工智能(xAI)方法和深度元学习模型

专知会员服务

62+阅读 · 2020年9月13日

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

专知会员服务

166+阅读 · 2019年12月21日

热门VIP内容

开通专知VIP会员享更多权益服务

《不确定性环境下基于智能体框架中实时多机器人任务分配的贝叶斯网络》博士论文

《提升战术级作战规划水平：城市进攻作战中的机动样式研究》

北约《俄乌战争经验教训课程指南：25份课程计划》150页

首场人工智能战争——俄乌战争（中文版、原文下载）

相关资讯

【Manning新书】可解释人工智能: 构建可解释机器学习系统，330页pdf

【Manning新书】可解释人工智能: 构建可解释机器学习系统，330页pdf

专知

35+阅读 · 2022年6月2日

【Manning新书】可解释人工智能: 构建可解释机器学习系统，144页pdf

【Manning新书】可解释人工智能: 构建可解释机器学习系统，144页pdf

专知

12+阅读 · 2022年1月28日

最新《可解释人工智能》概述，50页ppt

最新《可解释人工智能》概述，50页ppt

专知

12+阅读 · 2021年3月17日

深度学习可解释性研究进展

深度学习可解释性研究进展

专知

19+阅读 · 2020年6月26日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

【Science最新论文】XAI—可解释人工智能简述，机遇与挑战

专知

10+阅读 · 2019年12月21日

可解释人工智能XAI进展，看这份100页PPT为你讲解

可解释人工智能XAI进展，看这份100页PPT为你讲解

专知

49+阅读 · 2019年10月27日

【综述】医疗可解释人工智能综述论文

【综述】医疗可解释人工智能综述论文

专知

33+阅读 · 2019年7月18日

【干货】XAI可解释人工智能最新进展，89页ppt

【干货】XAI可解释人工智能最新进展，89页ppt

专知

52+阅读 · 2019年6月19日

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

专知

11+阅读 · 2019年2月8日

相关基金

天元数学交流项目图像处理中的数学理论及方法研讨会

国家自然科学基金

9+阅读 · 2017年12月31日

面向特征提取的低秩与稀疏图嵌入理论与算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

分布无关的概率图模型结构学习方法的研究

国家自然科学基金

4+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

基于矩阵分解的图像表示方法及其应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

数据分析算法的融合与人才培养

国家自然科学基金

7+阅读 · 2015年12月31日

矩阵分解问题的优化算法与理论

国家自然科学基金

8+阅读 · 2014年12月31日

相关论文

Beyond Explainable AI (XAI): An Overdue Paradigm Shift and Post-XAI Research Directions

Arxiv

0+阅读 · 4月10日

Explainable AI needs formalization

Arxiv

0+阅读 · 4月8日

Artificial Intelligence and the Structure of Mathematics

Arxiv

0+阅读 · 4月7日

An Agentic Approach to Generating XAI-Narratives

Arxiv

0+阅读 · 3月20日

HorizonMath: Measuring AI Progress Toward Mathematical Discovery with Automatic Verification

Arxiv

0+阅读 · 3月16日

Agentic Explainable Artificial Intelligence (Agentic XAI) Approach To Explore Better Explanation

Arxiv

0+阅读 · 3月12日

Mathematicians in the age of AI

Arxiv

1+阅读 · 3月7日

Beyond Explainable AI (XAI): An Overdue Paradigm Shift and Post-XAI Research Directions

Arxiv

0+阅读 · 2月27日

Towards Explainable Artificial Intelligence (XAI): A Data Mining Perspective

Arxiv

14+阅读 · 2024年1月9日

A Comprehensive Review on Financial Explainable AI

Arxiv

12+阅读 · 2023年9月21日

微信扫码咨询专知VIP会员