【博士论文】面向可解释深度神经网络的鲁棒概念干预研究 - 专知VIP

会员服务 ·

7

可解释神经网络 · 博士论文 ·

【博士论文】面向可解释深度神经网络的鲁棒概念干预研究

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

人工智能（AI）系统最强大的力量并非源于取代人类，而在于与人类协同。然而，在医疗和法律等专家知识丰富的关键领域，基于深度神经网络（DNN）的强力 AI 系统通常运行在一种僵化的假设下：即一旦训练结束，模型便无法再接收任何反馈。这种短视的范式限制了模型在关键时刻寻求或受益于外部引导的能力。相比之下，人类在决策时会常规性地相互咨询、寻求帮助并即时整合新证据。本论文旨在探讨：我们应如何设计 DNN，使其能够利用部署阶段可获取的人类反馈？可解释人工智能（XAI）领域的研究已在设计支持“人机回环”反馈的 DNN 方面迈出了第一步。这主要通过所谓的“概念干预”实现，即专家通过直接操作模型的潜空间，向模型传递高层级概念的存在与否。这些干预手段为在高风险环境下部署保持透明且具交互性的模型提供了一种可行路径。然而，现有可干预模型的有效性依赖于四个不切实际的假设：(1) 训练阶段具备概念标注；(2) 这些概念能够完整描述下游目标任务；(3) 所有概念干预的价值均等；(4) 测试样本保持在训练分布之内。本论文证明，上述假设在现实场景中并不成立，且当这些假设被违背时，干预将失效。为解决这一问题，我们提出了一系列方法，旨在提升概念干预在现实部署环境下的鲁棒性。首先，通过发现能够解释特定表格任务的小型特征子集上的简单函数，我们展示了如何在缺乏训练概念标签的表格领域执行干预。其次，我们证明了当训练中缺失关键概念时，干预可能会产生反作用，并提出了“概念嵌入模型”（CEMs）作为解决方案。CEM 学习高维且具可解释性的概念表征，即使在概念集不完备的情况下也能保持模型的可干预性。第三，我们放宽了“所有概念价值均等”的假设，提出了一种干预感知（intervention-aware）的训练范式，教授 CEM 优先向专家请求特定概念，从而降低预算受限场景下的求助成本。最后，我们将该框架扩展至处理分布外（OOD）测试样本，提出将概念嵌入分解为样本特定和概念特定组件，以保持分布偏移下的干预鲁棒性。总体而言，本论文提出的方法论为设计准确、可解释且能在专家提供测试时反馈时显著提升准确率的 DNN 提供了一种规范化方案。

成为VIP会员查看完整内容

13

相关内容

可解释神经网络

可解释神经网络

【博士论文】融合上下文的鲁棒机器学习，311页pdf

【博士论文】融合上下文的鲁棒机器学习，311页pdf

专知会员服务

35+阅读 · 2024年2月6日

【斯坦福博士论文】鲁棒、数据高效和值得信赖的医疗人工智能，140页pdf

【斯坦福博士论文】鲁棒、数据高效和值得信赖的医疗人工智能，140页pdf

专知会员服务

46+阅读 · 2023年10月14日

【CMU博士论文】深度神经网络鲁棒训练与评估方法，101页pdf

【CMU博士论文】深度神经网络鲁棒训练与评估方法，101页pdf

专知会员服务

47+阅读 · 2023年6月18日

【普林斯顿博士论文】构建高效深度神经网络，195页pdf

【普林斯顿博士论文】构建高效深度神经网络，195页pdf

专知会员服务

70+阅读 · 2023年2月8日

【NUS博士论文】深度视觉算法的对抗鲁棒性研究

【NUS博士论文】深度视觉算法的对抗鲁棒性研究

专知会员服务

34+阅读 · 2022年11月25日

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

专知会员服务

48+阅读 · 2022年11月4日

【牛津大学博士论文】鲁棒神经网络:评估与构建

【牛津大学博士论文】鲁棒神经网络:评估与构建

专知会员服务

35+阅读 · 2022年10月23日

【多伦多大学博士论文】深度学习中的训练效率和鲁棒性

【多伦多大学博士论文】深度学习中的训练效率和鲁棒性

专知会员服务

59+阅读 · 2022年6月27日

深度学习模型鲁棒性研究综述

深度学习模型鲁棒性研究综述

专知会员服务

97+阅读 · 2022年1月23日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知会员服务

159+阅读 · 2020年5月2日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

深入浅出「图神经网络GNN」的原理、应用以及前景 (附赠GNN新书鼠年春节福利)

深入浅出「图神经网络GNN」的原理、应用以及前景 (附赠GNN新书鼠年春节福利)

专知

65+阅读 · 2020年1月17日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

专知

14+阅读 · 2019年10月31日

【论文综述】深度卷积神经网络架构最新进展综述（附60页全文下载）

【论文综述】深度卷积神经网络架构最新进展综述（附60页全文下载）

专知

29+阅读 · 2019年1月23日

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

专知

49+阅读 · 2018年12月23日

【优青论文】深度神经网络压缩与加速综述

【优青论文】深度神经网络压缩与加速综述

计算机研究与发展

17+阅读 · 2018年9月20日

专栏 | 浅析图卷积神经网络

专栏 | 浅析图卷积神经网络

机器之心

28+阅读 · 2018年7月4日

【一文看懂】深度神经网络加速和压缩新进展年度报告

【一文看懂】深度神经网络加速和压缩新进展年度报告

新智元

10+阅读 · 2018年5月18日

干货｜基于图卷积网络的图深度学习

干货｜基于图卷积网络的图深度学习

DataCanvas大数据云平台

10+阅读 · 2017年6月8日

基于深度学习技术的视神经系统研究

国家自然科学基金

7+阅读 · 2017年12月31日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

视觉识别中的实用鲁棒回归技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

脉冲神经网络敏感性及其应用研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于稀疏表示和低秩矩阵分解的鲁棒人脸识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

用于癫痫发作预测的脑电特征深度学习研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于神经网络的无约束0-1二次规划全局最优算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向多源大数据的鲁棒聚类模型与算法研究

国家自然科学基金

6+阅读 · 2015年12月31日

反馈神经网络统一模型临界动力学研究及其在类脑计算机研制中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

Arxiv

0+阅读 · 3月11日

COHORT: Hybrid RL for Collaborative Large DNN Inference on Multi-Robot Systems Under Real-Time Constraints

Arxiv

0+阅读 · 3月11日

Guiding Sparse Neural Networks with Neurobiological Principles to Elicit Biologically Plausible Representations

Arxiv

0+阅读 · 3月3日

Graph Neural Model Predictive Control for High-Dimensional Systems

Graph Neural Model Predictive Control for High-Dimensional Systems

Arxiv

0+阅读 · 2月19日

Benchmarking Stochastic Approximation Algorithms for Fairness-Constrained Training of Deep Neural Networks

Arxiv

0+阅读 · 2月18日

Explainability-Inspired Layer-Wise Pruning of Deep Neural Networks for Efficient Object Detection

Arxiv

0+阅读 · 2月15日

Adopting a human developmental visual diet yields robust, shape-based AI vision

Arxiv

0+阅读 · 2月13日

Differentiable Modal Logic for Multi-Agent Diagnosis, Orchestration and Communication

Arxiv

0+阅读 · 2月12日

Training deep physical neural networks with local physical information bottleneck

Arxiv

0+阅读 · 2月10日

Towards Explainable Artificial Intelligence (XAI): A Data Mining Perspective

Arxiv

14+阅读 · 2024年1月9日

VIP会员

相关主题

可解释神经网络

最新内容

《提升战术级作战规划水平：城市进攻作战中的机动样式研究》

《提升战术级作战规划水平：城市进攻作战中的机动样式研究》

专知会员服务

1+阅读 · 今天1:36

《人员配置对陆军突击清障车与联合突击桥战备状态的影响研究》

《人员配置对陆军突击清障车与联合突击桥战备状态的影响研究》

专知会员服务

1+阅读 · 今天1:28

管理咨询报告：美国国防部量子技术开发与实施评估（译文）

管理咨询报告：美国国防部量子技术开发与实施评估（译文）

专知会员服务

1+阅读 · 今天1:16

【博士论文】可解释人工智能的数学基础与 Bandit 优化的研究进展

【博士论文】可解释人工智能的数学基础与 Bandit 优化的研究进展

专知会员服务

1+阅读 · 5月8日

生成-过滤-控制-重放：LLM强化学习中Rollout策略的全面综述

生成-过滤-控制-重放：LLM强化学习中Rollout策略的全面综述

专知会员服务

0+阅读 · 5月8日

认知战与交战性质的改变：神经战略视角

认知战与交战性质的改变：神经战略视角

专知会员服务

5+阅读 · 5月8日

美国《国防授权法案》指令要求界定“认知战”：区分相关概念

美国《国防授权法案》指令要求界定“认知战”：区分相关概念

专知会员服务

4+阅读 · 5月8日

人工智能对特定国防资源管理流程的影响（万字长文）

人工智能对特定国防资源管理流程的影响（万字长文）

专知会员服务

5+阅读 · 5月8日

《多域作战概念实证检验：美军“史诗怒火”行动中跨域协同的地理空间混合方法分析研究》245页报告

《多域作战概念实证检验：美军“史诗怒火”行动中跨域协同的地理空间混合方法分析研究》245页报告

专知会员服务

7+阅读 · 5月8日

《预设时间的单次协同估计、制导与控制框架：实现同时目标拦截》2026最新40页报告

《预设时间的单次协同估计、制导与控制框架：实现同时目标拦截》2026最新40页报告

专知会员服务

10+阅读 · 5月8日

《美空军条令出版物：网络空间作战（2026版）》

《美空军条令出版物：网络空间作战（2026版）》

专知会员服务

11+阅读 · 5月8日

《美空军条令出版物：空军作战中的信息（2026版）》

《美空军条令出版物：空军作战中的信息（2026版）》

专知会员服务

13+阅读 · 5月8日

为指挥控制与防御构建智能网络结构：集成感知与通信以提升频谱利用率

为指挥控制与防御构建智能网络结构：集成感知与通信以提升频谱利用率

专知会员服务

9+阅读 · 5月8日

人工智能如何变革军事C5ISR作战

人工智能如何变革军事C5ISR作战

专知会员服务

12+阅读 · 5月8日

《自主空中加油：用于相对导航与自主对接的双向多目标检测系统》97页

《自主空中加油：用于相对导航与自主对接的双向多目标检测系统》97页

专知会员服务

8+阅读 · 5月8日

相关VIP内容

【博士论文】融合上下文的鲁棒机器学习，311页pdf

【博士论文】融合上下文的鲁棒机器学习，311页pdf

专知会员服务

35+阅读 · 2024年2月6日

【斯坦福博士论文】鲁棒、数据高效和值得信赖的医疗人工智能，140页pdf

【斯坦福博士论文】鲁棒、数据高效和值得信赖的医疗人工智能，140页pdf

专知会员服务

46+阅读 · 2023年10月14日

【CMU博士论文】深度神经网络鲁棒训练与评估方法，101页pdf

【CMU博士论文】深度神经网络鲁棒训练与评估方法，101页pdf

专知会员服务

47+阅读 · 2023年6月18日

【普林斯顿博士论文】构建高效深度神经网络，195页pdf

【普林斯顿博士论文】构建高效深度神经网络，195页pdf

专知会员服务

70+阅读 · 2023年2月8日

【NUS博士论文】深度视觉算法的对抗鲁棒性研究

【NUS博士论文】深度视觉算法的对抗鲁棒性研究

专知会员服务

34+阅读 · 2022年11月25日

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

专知会员服务

48+阅读 · 2022年11月4日

【牛津大学博士论文】鲁棒神经网络:评估与构建

【牛津大学博士论文】鲁棒神经网络:评估与构建

专知会员服务

35+阅读 · 2022年10月23日

【多伦多大学博士论文】深度学习中的训练效率和鲁棒性

【多伦多大学博士论文】深度学习中的训练效率和鲁棒性

专知会员服务

59+阅读 · 2022年6月27日

深度学习模型鲁棒性研究综述

深度学习模型鲁棒性研究综述

专知会员服务

97+阅读 · 2022年1月23日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知会员服务

159+阅读 · 2020年5月2日

热门VIP内容

开通专知VIP会员享更多权益服务

《人员配置对陆军突击清障车与联合突击桥战备状态的影响研究》

【博士论文】可解释人工智能的数学基础与 Bandit 优化的研究进展

《提升战术级作战规划水平：城市进攻作战中的机动样式研究》

管理咨询报告：美国国防部量子技术开发与实施评估（译文）

相关资讯

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

深入浅出「图神经网络GNN」的原理、应用以及前景 (附赠GNN新书鼠年春节福利)

深入浅出「图神经网络GNN」的原理、应用以及前景 (附赠GNN新书鼠年春节福利)

专知

65+阅读 · 2020年1月17日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

专知

14+阅读 · 2019年10月31日

【论文综述】深度卷积神经网络架构最新进展综述（附60页全文下载）

【论文综述】深度卷积神经网络架构最新进展综述（附60页全文下载）

专知

29+阅读 · 2019年1月23日

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

专知

49+阅读 · 2018年12月23日

【优青论文】深度神经网络压缩与加速综述

【优青论文】深度神经网络压缩与加速综述

计算机研究与发展

17+阅读 · 2018年9月20日

专栏 | 浅析图卷积神经网络

专栏 | 浅析图卷积神经网络

机器之心

28+阅读 · 2018年7月4日

【一文看懂】深度神经网络加速和压缩新进展年度报告

【一文看懂】深度神经网络加速和压缩新进展年度报告

新智元

10+阅读 · 2018年5月18日

干货｜基于图卷积网络的图深度学习

干货｜基于图卷积网络的图深度学习

DataCanvas大数据云平台

10+阅读 · 2017年6月8日

相关基金

基于深度学习技术的视神经系统研究

国家自然科学基金

7+阅读 · 2017年12月31日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

视觉识别中的实用鲁棒回归技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

脉冲神经网络敏感性及其应用研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于稀疏表示和低秩矩阵分解的鲁棒人脸识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

用于癫痫发作预测的脑电特征深度学习研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于神经网络的无约束0-1二次规划全局最优算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向多源大数据的鲁棒聚类模型与算法研究

国家自然科学基金

6+阅读 · 2015年12月31日

反馈神经网络统一模型临界动力学研究及其在类脑计算机研制中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

相关论文

Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

Arxiv

0+阅读 · 3月11日

COHORT: Hybrid RL for Collaborative Large DNN Inference on Multi-Robot Systems Under Real-Time Constraints

Arxiv

0+阅读 · 3月11日

Guiding Sparse Neural Networks with Neurobiological Principles to Elicit Biologically Plausible Representations

Arxiv

0+阅读 · 3月3日

Graph Neural Model Predictive Control for High-Dimensional Systems

Graph Neural Model Predictive Control for High-Dimensional Systems

Arxiv

0+阅读 · 2月19日

Benchmarking Stochastic Approximation Algorithms for Fairness-Constrained Training of Deep Neural Networks

Arxiv

0+阅读 · 2月18日

Explainability-Inspired Layer-Wise Pruning of Deep Neural Networks for Efficient Object Detection

Arxiv

0+阅读 · 2月15日

Adopting a human developmental visual diet yields robust, shape-based AI vision

Arxiv

0+阅读 · 2月13日

Differentiable Modal Logic for Multi-Agent Diagnosis, Orchestration and Communication

Arxiv

0+阅读 · 2月12日

Training deep physical neural networks with local physical information bottleneck

Arxiv

0+阅读 · 2月10日

Towards Explainable Artificial Intelligence (XAI): A Data Mining Perspective

Arxiv

14+阅读 · 2024年1月9日

微信扫码咨询专知VIP会员