Real-world sensor-based learning systems require uncertainty estimation that is both reliable and computationally efficient. Evidential Deep Learning (EDL) provides single-pass uncertainty estimation by modeling the class probabilities via Dirichlet distributions, where the Dirichlet parameters are predicted by a learned neural network mapping. However, this approach can lead to computational challenges, as Dirichlet expected objectives are more complex than standard supervised learning losses, complicating their analysis and implementation. We address this issue by approximating the objective of the first-order empirical risk minimization problem induced by EDL with a plug-in loss evaluated at the Dirichlet mean and show that, under mild assumptions, the approximation error decays with growing evidence for a broad class of loss functions, including mean-squared error and cross-entropy loss. As a special case, our analysis provides justification for the use of softmax in the context of uncertainty estimation, since under a particular evidence-to-Dirichlet mapping, our framework includes the standard softmax classifier. We validate the proposed simplified objectives on the Google Speech Commands dataset and show that they achieve predictive accuracy and selective prediction performance comparable to classical EDL, while being simpler to implement using standard deep learning losses and training pipelines. To the best of our knowledge, this empirical analysis is the first to obtain coverage-accuracy trade-offs for speech recognition tasks through EDL.


翻译:基于传感器的现实学习系统需要既可靠又计算高效的不确定性估计方法。证据深度学习(EDL)通过狄利克雷分布对类概率建模,其中狄利克雷参数由学习到的神经网络映射预测,从而提供单次前向传播的不确定性估计。然而,该方法可能带来计算挑战,因为狄利克雷期望目标函数比标准监督学习损失更复杂,增加了分析和实现的难度。我们通过将EDL诱导的一阶经验风险最小化目标函数近似为在狄利克雷均值处评估的可插拔损失函数来解决该问题,并证明在温和假设下,对于包括均方误差和交叉熵损失在内的广泛损失函数类别,近似误差随证据量的增加而衰减。作为特例,我们的分析为在不确定性估计中使用softmax提供了理论依据,因为在特定的证据-狄利克雷映射下,我们的框架包含了标准softmax分类器。我们在谷歌语音指令数据集上验证了所提出的简化目标函数,结果表明其预测准确性和选择性预测性能与经典EDL相当,同时使用标准深度学习损失和训练流水线更易实现。据我们所知,这是首次通过EDL在语音识别任务中获取覆盖率-准确率权衡曲线的实证分析。

0
下载
关闭预览

相关内容

【斯坦福博士论文】概率机器学习中的不确定性原理
专知会员服务
27+阅读 · 2025年8月4日
深度强化学习中的可塑性损失:综述
专知会员服务
22+阅读 · 2024年11月8日
ICLR24 Spotlight | R-EDL:放宽证据深度学习中的非必要设置
专知会员服务
12+阅读 · 2024年5月31日
专知会员服务
26+阅读 · 2021年7月17日
「PPT」深度学习中的不确定性估计
专知
27+阅读 · 2019年7月20日
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
你的算法可靠吗? 神经网络不确定性度量
专知
40+阅读 · 2019年4月27日
干货 | 深度学习之损失函数与激活函数的选择
机器学习算法与Python学习
15+阅读 · 2017年9月18日
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
Arxiv
10+阅读 · 2024年3月11日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
5+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
4+阅读 · 6月17日
相关基金
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员