Activation-Space Uncertainty Quantification for Pretrained Networks - 专知论文

会员服务 ·

0

不确定 · 不确定性 · 预训练 · 高斯过程 · 不确定性量化 ·

Activation-Space Uncertainty Quantification for Pretrained Networks

翻译：预训练网络的激活空间不确定性量化

Richard Bergna,Stefan Depeweg,Sergio Calvo-Ordoñez,Jonathan Plenk,Alvaro Cartea,Jose Miguel Hernández-Lobato

Reliable uncertainty estimates are crucial for deploying pretrained models; yet, many strong methods for quantifying uncertainty require retraining, Monte Carlo sampling, or expensive second-order computations and may alter a frozen backbone's predictions. To address this, we introduce Gaussian Process Activations (GAPA), a post-hoc method that shifts Bayesian modeling from weights to activations. GAPA replaces standard nonlinearities with Gaussian-process activations whose posterior mean exactly matches the original activation, preserving the backbone's point predictions by construction while providing closed-form epistemic variances in activation space. To scale to modern architectures, we use a sparse variational inducing-point approximation over cached training activations, combined with local k-nearest-neighbor subset conditioning, enabling deterministic single-pass uncertainty propagation without sampling, backpropagation, or second-order information. Across regression, classification, image segmentation, and language modeling, GAPA matches or outperforms strong post-hoc baselines in calibration and out-of-distribution detection while remaining efficient at test time.

翻译：可靠的**不确定性估计**对于部署预训练模型至关重要；然而，许多量化不确定性的有效方法需要重新训练、蒙特卡洛采样或昂贵的二阶计算，并且可能改变冻结主干网络的预测。为解决此问题，我们引入了**高斯过程激活**（Gaussian Process Activations，GAPA），一种将贝叶斯建模从权重转移到激活的事后方法。GAPA用高斯过程激活替换标准非线性激活函数，其后验均值与原始激活完全匹配，从而在结构上保持主干网络的点预测，同时在激活空间中提供封闭形式的认知方差。为适应现代架构，我们基于缓存的训练激活使用稀疏变分诱导点近似，并结合局部k近邻子集条件化，实现了无需采样、反向传播或二阶信息的确定性单次前向不确定性传播。在回归、分类、图像分割和语言建模任务中，GAPA在校准和分布外检测方面达到或优于强事后基线方法，同时在测试时保持高效。

0

相关内容

不确定

[ICML 2026] 图神经网络中的无分位数不确定性量化：QpiGNN

[ICML 2026] 图神经网络中的无分位数不确定性量化：QpiGNN

专知会员服务

9+阅读 · 5月7日

《鲁棒优化中保形预测生成不确定性集的性能评价》最新95页

《鲁棒优化中保形预测生成不确定性集的性能评价》最新95页

专知会员服务

10+阅读 · 3月20日

【CMU博士论文】校准不确定性量化的方法及其效用解析

【CMU博士论文】校准不确定性量化的方法及其效用解析

专知会员服务

22+阅读 · 2025年9月1日

【博士论文】基于不确定性的可靠性：现代机器学习中的选择性预测与可信部署

【博士论文】基于不确定性的可靠性：现代机器学习中的选择性预测与可信部署

专知会员服务

24+阅读 · 2025年8月14日

【斯坦福博士论文】概率机器学习中的不确定性原理

【斯坦福博士论文】概率机器学习中的不确定性原理

专知会员服务

27+阅读 · 2025年8月4日

【EPFL博士论文】现代深度学习中的不确定性建模，169页pdf

【EPFL博士论文】现代深度学习中的不确定性建模，169页pdf

专知会员服务

26+阅读 · 2025年5月15日

【博士论文】《计算机视觉中潜在表示的不确定性》，66页pdf

【博士论文】《计算机视觉中潜在表示的不确定性》，66页pdf

专知会员服务

22+阅读 · 2024年8月28日

《图神经网络不确定性》最新综述

《图神经网络不确定性》最新综述

专知会员服务

28+阅读 · 2024年3月13日

【AAAI2023】基于Dirichlet元模型的事后不确定性学习

【AAAI2023】基于Dirichlet元模型的事后不确定性学习

专知会员服务

16+阅读 · 2022年12月16日

深度神经网络不确定性研究综述论文

专知会员服务

92+阅读 · 2021年7月9日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

52+阅读 · 2022年11月16日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知

17+阅读 · 2021年1月18日

ICML2020 图神经网络的预训练

ICML2020 图神经网络的预训练

图与推荐

12+阅读 · 2020年4月4日

深度学习模型不确定性方法对比

深度学习模型不确定性方法对比

PaperWeekly

20+阅读 · 2020年2月10日

「PPT」深度学习中的不确定性估计

「PPT」深度学习中的不确定性估计

专知

27+阅读 · 2019年7月20日

一行TensorFlow/Keras代码解决真实场景中数据不平衡(imbalanced)问题

一行TensorFlow/Keras代码解决真实场景中数据不平衡(imbalanced)问题

专知

78+阅读 · 2019年5月31日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

用模型不确定性理解模型

用模型不确定性理解模型

论智

11+阅读 · 2018年9月5日

资源 | GitHub新项目：轻松使用多种预训练卷积网络抽取图像特征

资源 | GitHub新项目：轻松使用多种预训练卷积网络抽取图像特征

机器之心

12+阅读 · 2018年4月16日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

知识不确定性度量的粒计算模型及其应用研究

国家自然科学基金

1+阅读 · 2017年12月31日

计及多重-复合不确定性的电力系统稳定约束优化调度研究

国家自然科学基金

1+阅读 · 2016年12月31日

随机振动响应预测中的模型形式不确定性量化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

通信网络在不确定业务流量需求下的路由鲁棒性优化研究

国家自然科学基金

1+阅读 · 2015年12月31日

复杂陆面过程模型的参数不确定性定量化研究

国家自然科学基金

1+阅读 · 2015年12月31日

电磁兼容仿真不确定性定量分析方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

不确定与动态信息环境下基于预规划-重规划集成建模的应急物流选址-调度鲁棒优化研究

国家自然科学基金

3+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

Uncertainty-Aware Offline Data-Driven Multi-Objective Optimization

Arxiv

0+阅读 · 4月29日

From Passive Metric to Active Signal: The Evolving Role of Uncertainty Quantification in Large Language Models

Arxiv

0+阅读 · 4月19日

Accurate and Reliable Uncertainty Estimates for Deterministic Predictions Extensions to Under and Overpredictions

Arxiv

0+阅读 · 4月9日

Risk-Constrained Belief-Space Optimization for Safe Control under Latent Uncertainty

Arxiv

0+阅读 · 4月4日

Safe learning-based control via function-based uncertainty quantification

Arxiv

0+阅读 · 4月1日

Uncertainty Quantification for Multimodal Large Language Models with Incoherence-adjusted Semantic Volume

Arxiv

0+阅读 · 2月27日

Conformalized Neural Networks for Federated Uncertainty Quantification under Dual Heterogeneity

Arxiv

0+阅读 · 2月26日

Active operator learning with predictive uncertainty quantification for partial differential equations

Arxiv

0+阅读 · 2月25日

Uncertainty Estimation by Flexible Evidential Deep Learning

Arxiv

0+阅读 · 2月20日

Uncertainty in Graph Neural Networks: A Survey

Arxiv

10+阅读 · 2024年3月11日

VIP会员

文章信息

相关主题

不确定性量化

最新内容

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

1+阅读 · 今天15:03

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

0+阅读 · 今天14:31

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

0+阅读 · 今天14:29

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

12+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

4+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

7+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

8+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

11+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

12+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

8+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

21+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

10+阅读 · 6月17日

相关VIP内容

[ICML 2026] 图神经网络中的无分位数不确定性量化：QpiGNN

[ICML 2026] 图神经网络中的无分位数不确定性量化：QpiGNN

专知会员服务

9+阅读 · 5月7日

《鲁棒优化中保形预测生成不确定性集的性能评价》最新95页

《鲁棒优化中保形预测生成不确定性集的性能评价》最新95页

专知会员服务

10+阅读 · 3月20日

【CMU博士论文】校准不确定性量化的方法及其效用解析

【CMU博士论文】校准不确定性量化的方法及其效用解析

专知会员服务

22+阅读 · 2025年9月1日

【博士论文】基于不确定性的可靠性：现代机器学习中的选择性预测与可信部署

【博士论文】基于不确定性的可靠性：现代机器学习中的选择性预测与可信部署

专知会员服务

24+阅读 · 2025年8月14日

【斯坦福博士论文】概率机器学习中的不确定性原理

【斯坦福博士论文】概率机器学习中的不确定性原理

专知会员服务

27+阅读 · 2025年8月4日

【EPFL博士论文】现代深度学习中的不确定性建模，169页pdf

【EPFL博士论文】现代深度学习中的不确定性建模，169页pdf

专知会员服务

26+阅读 · 2025年5月15日

【博士论文】《计算机视觉中潜在表示的不确定性》，66页pdf

【博士论文】《计算机视觉中潜在表示的不确定性》，66页pdf

专知会员服务

22+阅读 · 2024年8月28日

《图神经网络不确定性》最新综述

《图神经网络不确定性》最新综述

专知会员服务

28+阅读 · 2024年3月13日

【AAAI2023】基于Dirichlet元模型的事后不确定性学习

【AAAI2023】基于Dirichlet元模型的事后不确定性学习

专知会员服务

16+阅读 · 2022年12月16日

深度神经网络不确定性研究综述论文

专知会员服务

92+阅读 · 2021年7月9日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

美国从乌克兰无人机战争中学习经验

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

相关资讯

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

52+阅读 · 2022年11月16日

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

【干货书】深度不确定性条件下的决策:理论到实践，408页pdf

专知

17+阅读 · 2021年1月18日

ICML2020 图神经网络的预训练

ICML2020 图神经网络的预训练

图与推荐

12+阅读 · 2020年4月4日

深度学习模型不确定性方法对比

深度学习模型不确定性方法对比

PaperWeekly

20+阅读 · 2020年2月10日

「PPT」深度学习中的不确定性估计

「PPT」深度学习中的不确定性估计

专知

27+阅读 · 2019年7月20日

一行TensorFlow/Keras代码解决真实场景中数据不平衡(imbalanced)问题

一行TensorFlow/Keras代码解决真实场景中数据不平衡(imbalanced)问题

专知

78+阅读 · 2019年5月31日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

用模型不确定性理解模型

用模型不确定性理解模型

论智

11+阅读 · 2018年9月5日

资源 | GitHub新项目：轻松使用多种预训练卷积网络抽取图像特征

资源 | GitHub新项目：轻松使用多种预训练卷积网络抽取图像特征

机器之心

12+阅读 · 2018年4月16日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

相关论文

Uncertainty-Aware Offline Data-Driven Multi-Objective Optimization

Arxiv

0+阅读 · 4月29日

From Passive Metric to Active Signal: The Evolving Role of Uncertainty Quantification in Large Language Models

Arxiv

0+阅读 · 4月19日

Accurate and Reliable Uncertainty Estimates for Deterministic Predictions Extensions to Under and Overpredictions

Arxiv

0+阅读 · 4月9日

Risk-Constrained Belief-Space Optimization for Safe Control under Latent Uncertainty

Arxiv

0+阅读 · 4月4日

Safe learning-based control via function-based uncertainty quantification

Arxiv

0+阅读 · 4月1日

Uncertainty Quantification for Multimodal Large Language Models with Incoherence-adjusted Semantic Volume

Arxiv

0+阅读 · 2月27日

Conformalized Neural Networks for Federated Uncertainty Quantification under Dual Heterogeneity

Arxiv

0+阅读 · 2月26日

Active operator learning with predictive uncertainty quantification for partial differential equations

Arxiv

0+阅读 · 2月25日

Uncertainty Estimation by Flexible Evidential Deep Learning

Arxiv

0+阅读 · 2月20日

Uncertainty in Graph Neural Networks: A Survey

Arxiv

10+阅读 · 2024年3月11日

相关基金

知识不确定性度量的粒计算模型及其应用研究

国家自然科学基金

1+阅读 · 2017年12月31日

计及多重-复合不确定性的电力系统稳定约束优化调度研究

国家自然科学基金

1+阅读 · 2016年12月31日

随机振动响应预测中的模型形式不确定性量化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

通信网络在不确定业务流量需求下的路由鲁棒性优化研究

国家自然科学基金

1+阅读 · 2015年12月31日

复杂陆面过程模型的参数不确定性定量化研究

国家自然科学基金

1+阅读 · 2015年12月31日

电磁兼容仿真不确定性定量分析方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

不确定与动态信息环境下基于预规划-重规划集成建模的应急物流选址-调度鲁棒优化研究

国家自然科学基金

3+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员