Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks - 专知论文

会员服务 ·

0

准确率 · 不确定 · 不确定性 · 不确定性估计 · 卷积 ·

Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

翻译：超越准确率：卷积神经网络中的可靠性与不确定性估计

Sanne Ruijs,Alina Kosiakova,Farrukh Javed

from arxiv, 30 pages, 39 figures

Deep neural networks (DNNs) have become integral to a wide range of scientific and practical applications due to their flexibility and strong predictive performance. Despite their accuracy, however, DNNs frequently exhibit poor calibration, often assigning overly confident probabilities to incorrect predictions. This limitation underscores the growing need for integrated mechanisms that provide reliable uncertainty estimation. In this article, we compare two prominent approaches for uncertainty quantification: a Bayesian approximation via Monte Carlo Dropout and the nonparametric Conformal Prediction framework. Both methods are assessed using two convolutional neural network architectures; H-CNN VGG16 and GoogLeNet, trained on the Fashion-MNIST dataset. The empirical results show that although H-CNN VGG16 attains higher predictive accuracy, it tends to exhibit pronounced overconfidence, whereas GoogLeNet yields better-calibrated uncertainty estimates. Conformal Prediction additionally demonstrates consistent validity by producing statistically guaranteed prediction sets, highlighting its practical value in high-stakes decision-making contexts. Overall, the findings emphasize the importance of evaluating model performance beyond accuracy alone and contribute to the development of more reliable and trustworthy deep learning systems.

翻译：深度神经网络（DNNs）凭借其灵活性和强大的预测性能，已成为众多科学与实际应用中不可或缺的组成部分。然而，尽管其准确率很高，DNNs 常常表现出较差的校准性，经常为错误的预测分配过度自信的概率。这一局限性凸显了对能够提供可靠不确定性估计的集成机制日益增长的需求。本文比较了两种用于不确定性量化的主流方法：基于蒙特卡洛Dropout的贝叶斯近似方法，以及非参数的Conformal Prediction框架。两种方法均使用两种卷积神经网络架构进行评估：在Fashion-MNIST数据集上训练的H-CNN VGG16和GoogLeNet。实证结果表明，虽然H-CNN VGG16获得了更高的预测准确率，但它倾向于表现出明显的过度自信，而GoogLeNet则能产生校准更好的不确定性估计。此外，Conformal Prediction通过生成具有统计保证的预测集，证明了其具有一致的有效性，突显了其在高风险决策场景中的实用价值。总体而言，研究结果强调了超越单一准确率指标来评估模型性能的重要性，并为开发更可靠、更可信赖的深度学习系统做出了贡献。

0

相关内容

准确率

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

专知会员服务

27+阅读 · 2025年2月4日

《图神经网络不确定性》最新综述

《图神经网络不确定性》最新综述

专知会员服务

28+阅读 · 2024年3月13日

【KDD2023教程】不确定性量化在深度学习中的应用

【KDD2023教程】不确定性量化在深度学习中的应用

专知会员服务

43+阅读 · 2023年8月19日

《利用强化学习对深度神经网络形成对抗性样本攻击》2023最新83页论文

《利用强化学习对深度神经网络形成对抗性样本攻击》2023最新83页论文

专知会员服务

76+阅读 · 2023年5月11日

【深度神经网络加速器的硬件近似技术综述】Hardware Approximate Techniques for Deep Neural Network Accelerators: A Survey

【深度神经网络加速器的硬件近似技术综述】Hardware Approximate Techniques for Deep Neural Network Accelerators: A Survey

专知会员服务

16+阅读 · 2022年3月17日

深度神经网络不确定性研究综述论文

专知会员服务

92+阅读 · 2021年7月9日

【剑桥大学博士论文】深度学习中的不确定性估计及其在口语评价中的应用，234页pdf

【剑桥大学博士论文】深度学习中的不确定性估计及其在口语评价中的应用，234页pdf

专知会员服务

43+阅读 · 2021年1月2日

【Nature通讯】深度神经网络模型中的个体差异

【Nature通讯】深度神经网络模型中的个体差异

专知会员服务

14+阅读 · 2020年11月16日

借助几何先验知识促进深度神经网络：综述 | Boosting Deep Neural Networks with Geometrical Prior Knowledge: A Survey

借助几何先验知识促进深度神经网络：综述 | Boosting Deep Neural Networks with Geometrical Prior Knowledge: A Survey

专知会员服务

29+阅读 · 2020年7月10日

深度神经网络模型的个体差异，Individual differences among deep neural network models

深度神经网络模型的个体差异，Individual differences among deep neural network models

专知会员服务

10+阅读 · 2020年1月11日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

专知

14+阅读 · 2019年10月31日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

「PPT」深度学习中的不确定性估计

「PPT」深度学习中的不确定性估计

专知

27+阅读 · 2019年7月20日

7个实用的深度学习技巧

7个实用的深度学习技巧

机器学习算法与Python学习

16+阅读 · 2019年3月6日

直白介绍卷积神经网络（CNN）

直白介绍卷积神经网络（CNN）

算法与数学之美

13+阅读 · 2019年1月23日

【论文综述】深度卷积神经网络架构最新进展综述（附60页全文下载）

【论文综述】深度卷积神经网络架构最新进展综述（附60页全文下载）

专知

29+阅读 · 2019年1月23日

专栏 | 浅析图卷积神经网络

专栏 | 浅析图卷积神经网络

机器之心

28+阅读 · 2018年7月4日

【回顾】深度学习系列之二：卷积神经网络

【回顾】深度学习系列之二：卷积神经网络

AI研习社

20+阅读 · 2017年12月1日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

忆阻递归神经网络的多重稳定性理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

脉冲神经网络敏感性及其应用研究

国家自然科学基金

10+阅读 · 2015年12月31日

T-S模糊神经网络的容错同步性分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于不完全测量信息的随机忆阻神经网络的参数与状态估计问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

用于癫痫发作预测的脑电特征深度学习研究

国家自然科学基金

3+阅读 · 2015年12月31日

反馈神经网络统一模型临界动力学研究及其在类脑计算机研制中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

Inference for Deep Neural Network Estimators in Generalized Nonparametric Models

Arxiv

0+阅读 · 3月17日

Beyond Accuracy: What Matters in Designing Well-Behaved Image Classification Models?

Arxiv

0+阅读 · 3月4日

Guiding Sparse Neural Networks with Neurobiological Principles to Elicit Biologically Plausible Representations

Arxiv

0+阅读 · 3月3日

SigmaQuant: Hardware-Aware Heterogeneous Quantization Method for Edge DNN Inference

Arxiv

0+阅读 · 3月3日

Training Deep Normalization-Free Spiking Neural Networks with Lateral Inhibition

Arxiv

0+阅读 · 2月25日

Benchmarking Stochastic Approximation Algorithms for Fairness-Constrained Training of Deep Neural Networks

Arxiv

0+阅读 · 2月18日

Explainability-Inspired Layer-Wise Pruning of Deep Neural Networks for Efficient Object Detection

Arxiv

0+阅读 · 2月15日

Beyond Predictive Uncertainty: Reliable Representation Learning with Structural Constraints

Arxiv

0+阅读 · 2月3日

Uncertainty in Graph Neural Networks: A Survey

Arxiv

10+阅读 · 2024年3月11日

Survey on Trustworthy Graph Neural Networks: From A Causal Perspective

Arxiv

10+阅读 · 2023年12月19日

VIP会员

文章信息

相关主题

不确定性估计

最新内容

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

专知会员服务

1+阅读 · 4月30日

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

专知会员服务

1+阅读 · 4月29日

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

专知会员服务

6+阅读 · 4月29日

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

专知会员服务

5+阅读 · 4月29日

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

专知会员服务

5+阅读 · 4月29日

《化繁为简：军事模拟器配置的对话式方法》报告

《化繁为简：军事模拟器配置的对话式方法》报告

专知会员服务

6+阅读 · 4月29日

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

专知会员服务

9+阅读 · 4月29日

《新兴技术武器化及其对全球风险的影响》

《新兴技术武器化及其对全球风险的影响》

专知会员服务

7+阅读 · 4月29日

《帕兰泰尔平台介绍：信息分析平台》

《帕兰泰尔平台介绍：信息分析平台》

专知会员服务

17+阅读 · 4月29日

Maven智能系统（MSS）如何赋能第三方解决方案：北约视角

Maven智能系统（MSS）如何赋能第三方解决方案：北约视角

专知会员服务

10+阅读 · 4月29日

【伯克利博士论文】深度解析 AI 智能体的失配问题

【伯克利博士论文】深度解析 AI 智能体的失配问题

专知会员服务

8+阅读 · 4月28日

智能体化世界建模：基础、能力、规律及展望

智能体化世界建模：基础、能力、规律及展望

专知会员服务

11+阅读 · 4月28日

MIT人机协同水下作业关键技术研究——集成适配至美国海军现役AUV

MIT人机协同水下作业关键技术研究——集成适配至美国海军现役AUV

专知会员服务

8+阅读 · 4月28日

美海警海上态势感知无人系统

美海警海上态势感知无人系统

专知会员服务

6+阅读 · 4月28日

安杜里尔Lattice平台的发展演变：美军多域自主作战的核心软件架构

安杜里尔Lattice平台的发展演变：美军多域自主作战的核心软件架构

专知会员服务

10+阅读 · 4月28日

相关VIP内容

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

专知会员服务

27+阅读 · 2025年2月4日

《图神经网络不确定性》最新综述

《图神经网络不确定性》最新综述

专知会员服务

28+阅读 · 2024年3月13日

【KDD2023教程】不确定性量化在深度学习中的应用

【KDD2023教程】不确定性量化在深度学习中的应用

专知会员服务

43+阅读 · 2023年8月19日

《利用强化学习对深度神经网络形成对抗性样本攻击》2023最新83页论文

《利用强化学习对深度神经网络形成对抗性样本攻击》2023最新83页论文

专知会员服务

76+阅读 · 2023年5月11日

【深度神经网络加速器的硬件近似技术综述】Hardware Approximate Techniques for Deep Neural Network Accelerators: A Survey

【深度神经网络加速器的硬件近似技术综述】Hardware Approximate Techniques for Deep Neural Network Accelerators: A Survey

专知会员服务

16+阅读 · 2022年3月17日

深度神经网络不确定性研究综述论文

专知会员服务

92+阅读 · 2021年7月9日

【剑桥大学博士论文】深度学习中的不确定性估计及其在口语评价中的应用，234页pdf

【剑桥大学博士论文】深度学习中的不确定性估计及其在口语评价中的应用，234页pdf

专知会员服务

43+阅读 · 2021年1月2日

【Nature通讯】深度神经网络模型中的个体差异

【Nature通讯】深度神经网络模型中的个体差异

专知会员服务

14+阅读 · 2020年11月16日

借助几何先验知识促进深度神经网络：综述 | Boosting Deep Neural Networks with Geometrical Prior Knowledge: A Survey

借助几何先验知识促进深度神经网络：综述 | Boosting Deep Neural Networks with Geometrical Prior Knowledge: A Survey

专知会员服务

29+阅读 · 2020年7月10日

深度神经网络模型的个体差异，Individual differences among deep neural network models

深度神经网络模型的个体差异，Individual differences among deep neural network models

专知会员服务

10+阅读 · 2020年1月11日

热门VIP内容

开通专知VIP会员享更多权益服务

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

相关资讯

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

专知

14+阅读 · 2019年10月31日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

「PPT」深度学习中的不确定性估计

「PPT」深度学习中的不确定性估计

专知

27+阅读 · 2019年7月20日

7个实用的深度学习技巧

7个实用的深度学习技巧

机器学习算法与Python学习

16+阅读 · 2019年3月6日

直白介绍卷积神经网络（CNN）

直白介绍卷积神经网络（CNN）

算法与数学之美

13+阅读 · 2019年1月23日

【论文综述】深度卷积神经网络架构最新进展综述（附60页全文下载）

【论文综述】深度卷积神经网络架构最新进展综述（附60页全文下载）

专知

29+阅读 · 2019年1月23日

专栏 | 浅析图卷积神经网络

专栏 | 浅析图卷积神经网络

机器之心

28+阅读 · 2018年7月4日

【回顾】深度学习系列之二：卷积神经网络

【回顾】深度学习系列之二：卷积神经网络

AI研习社

20+阅读 · 2017年12月1日

相关论文

Inference for Deep Neural Network Estimators in Generalized Nonparametric Models

Arxiv

0+阅读 · 3月17日

Beyond Accuracy: What Matters in Designing Well-Behaved Image Classification Models?

Arxiv

0+阅读 · 3月4日

Guiding Sparse Neural Networks with Neurobiological Principles to Elicit Biologically Plausible Representations

Arxiv

0+阅读 · 3月3日

SigmaQuant: Hardware-Aware Heterogeneous Quantization Method for Edge DNN Inference

Arxiv

0+阅读 · 3月3日

Training Deep Normalization-Free Spiking Neural Networks with Lateral Inhibition

Arxiv

0+阅读 · 2月25日

Benchmarking Stochastic Approximation Algorithms for Fairness-Constrained Training of Deep Neural Networks

Arxiv

0+阅读 · 2月18日

Explainability-Inspired Layer-Wise Pruning of Deep Neural Networks for Efficient Object Detection

Arxiv

0+阅读 · 2月15日

Beyond Predictive Uncertainty: Reliable Representation Learning with Structural Constraints

Arxiv

0+阅读 · 2月3日

Uncertainty in Graph Neural Networks: A Survey

Arxiv

10+阅读 · 2024年3月11日

Survey on Trustworthy Graph Neural Networks: From A Causal Perspective

Arxiv

10+阅读 · 2023年12月19日

相关基金

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

忆阻递归神经网络的多重稳定性理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

脉冲神经网络敏感性及其应用研究

国家自然科学基金

10+阅读 · 2015年12月31日

T-S模糊神经网络的容错同步性分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于不完全测量信息的随机忆阻神经网络的参数与状态估计问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

用于癫痫发作预测的脑电特征深度学习研究

国家自然科学基金

3+阅读 · 2015年12月31日

反馈神经网络统一模型临界动力学研究及其在类脑计算机研制中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员