Uncertainty Quantification in Forecast Comparisons - 专知论文

会员服务 ·

0

得分 · 置信度 · 推断 · MoDELS · Skills ·

Uncertainty Quantification in Forecast Comparisons

翻译：预报比较中的不确定性量化

Marc-Oliver Pohle,Tanja Zahn,Sebastian Lerch

Skill scores, which measure the relative improvement of a forecasting method over a benchmark via consistent scoring functions and proper scoring rules, are a standard tool in forecast evaluation, yet their sampling uncertainty is rarely rigorously quantified. With modern forecasting applications being increasingly multivariate and involving evaluations across multiple horizons, variables, spatial locations, and forecasting methods, standard tools like the pairwise Diebold-Mariano forecast accuracy test or pointwise confidence intervals fail to account for the multiple comparison problem, leading to inflated Type I error rates and invalid joint inference. To address the lack of a coherent, statistically rigorous framework for quantifying uncertainty across these multi-dimensional evaluation problems, we introduce simultaneous confidence bands for expected scores and skill scores. Our framework provides a versatile tool for joint inference that is applicable to any forecast type from mean and quantile to full distributional forecasts. We develop a bootstrap implementation and show that our bands are valid under multivariate extensions of the classical Diebold-Mariano assumptions. We demonstrate the practical utility of the approach in two case studies by quantifying the benefits of time-varying parameter models for macroeconomic forecasting, and by comparing data-driven and physics-based models in probabilistic weather forecasting.

翻译：技能得分通过一致评分函数和适当评分规则衡量预报方法相对于基准的相对改进，是预报评估中的标准工具，但其抽样不确定性鲜少得到严格量化。随着现代预报应用日益呈现多变量特征，并涉及跨多个预测期、变量、空间位置及预报方法的评估，诸如成对Diebold-Mariano预报精度检验或逐点置信区间等标准工具无法应对多重比较问题，导致第一类错误率膨胀及联合推断失效。为弥补当前在多维评估问题中缺乏连贯且统计严谨的不确定性量化框架的不足，我们引入了期望得分与技能得分的联合置信带。该框架为联合推断提供了通用工具，适用于从均值、分位数到完整分布预报的任何预报类型。我们开发了自助法实现方案，并证明在经典Diebold-Mariano假设的多变量扩展条件下，该置信带具有有效性。通过两项案例研究——量化时变参数模型在宏观经济预报中的优势，以及对比数据驱动与基于物理的模型在概率天气预报中的表现——我们展示了该方法的实际效用。

0

相关内容

【CMU博士论文】校准不确定性量化的方法及其效用解析

【CMU博士论文】校准不确定性量化的方法及其效用解析

专知会员服务

22+阅读 · 2025年9月1日

【斯坦福博士论文】概率机器学习中的不确定性原理

【斯坦福博士论文】概率机器学习中的不确定性原理

专知会员服务

27+阅读 · 2025年8月4日

【牛津大学博士论文】不确定性量化与因果考量在非策略决策制定中的应用

【牛津大学博士论文】不确定性量化与因果考量在非策略决策制定中的应用

专知会员服务

20+阅读 · 2025年2月24日

《基于文本的情报源不确定性定量建模》最新112页

《基于文本的情报源不确定性定量建模》最新112页

专知会员服务

38+阅读 · 2024年8月11日

【博士论文】统计学习中的可靠不确定性量化,128页pdf

【博士论文】统计学习中的可靠不确定性量化,128页pdf

专知会员服务

45+阅读 · 2023年11月23日

【CMU博士论文】分布偏移下的不确定性量化，226页pdf

【CMU博士论文】分布偏移下的不确定性量化，226页pdf

专知会员服务

31+阅读 · 2023年9月30日

万字长文《不确定性量化：军事系统中的人工智能与机器学习》2023最新报告

万字长文《不确定性量化：军事系统中的人工智能与机器学习》2023最新报告

专知会员服务

113+阅读 · 2023年6月17日

【硬核书】不确定性:不确定性估计的现代主题，160页pdf

【硬核书】不确定性:不确定性估计的现代主题，160页pdf

专知会员服务

87+阅读 · 2022年12月4日

宾夕法尼亚大学最新《不确定性估计》课程笔记，134页pdf，附Slides

宾夕法尼亚大学最新《不确定性估计》课程笔记，134页pdf，附Slides

专知会员服务

49+阅读 · 2022年11月13日

不确定性下如何决策？弗吉尼亚理工最新《不确定性推理与量化的决策研究综述》，51页pdf阐述信念理论与深度学习结合下的不确定性决策

不确定性下如何决策？弗吉尼亚理工最新《不确定性推理与量化的决策研究综述》，51页pdf阐述信念理论与深度学习结合下的不确定性决策

专知会员服务

109+阅读 · 2022年6月17日

北约384页技术报告《评估和沟通情报中的不确定性以支持决策》

北约384页技术报告《评估和沟通情报中的不确定性以支持决策》

专知

36+阅读 · 2022年7月26日

数据驱动的态势认知技术及发展思考

数据驱动的态势认知技术及发展思考

专知

20+阅读 · 2022年7月12日

深度学习模型不确定性方法对比

深度学习模型不确定性方法对比

PaperWeekly

20+阅读 · 2020年2月10日

「PPT」深度学习中的不确定性估计

「PPT」深度学习中的不确定性估计

专知

27+阅读 · 2019年7月20日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

【大数据】海量数据分析能力形成和大数据关键技术

【大数据】海量数据分析能力形成和大数据关键技术

产业智能官

17+阅读 · 2018年10月29日

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

论智

11+阅读 · 2018年10月9日

15款免费预测分析软件！收藏好，别丢了！

15款免费预测分析软件！收藏好，别丢了！

七月在线实验室

11+阅读 · 2018年2月27日

推荐｜北大：一种基于新闻特征抽取和循环神经网络的股票预测方法

推荐｜北大：一种基于新闻特征抽取和循环神经网络的股票预测方法

全球人工智能

14+阅读 · 2017年7月26日

回归预测&时间序列预测

回归预测&时间序列预测

GBASE数据工程部数据团队

44+阅读 · 2017年5月17日

知识不确定性度量的粒计算模型及其应用研究

国家自然科学基金

1+阅读 · 2017年12月31日

随机振动响应预测中的模型形式不确定性量化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

测量误差数据下部分线性模型有约束统计推断理论

国家自然科学基金

2+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

不确定线性系统故障诊断的区间分析理论与方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

不确定与动态信息环境下基于预规划-重规划集成建模的应急物流选址-调度鲁棒优化研究

国家自然科学基金

3+阅读 · 2014年12月31日

考虑不确定性和方向性的结构随机极值和疲劳风致响应及抗风可靠性评价理论

国家自然科学基金

0+阅读 · 2014年12月31日

灾害应急供应链中不确定与干扰下牛鞭效应风险弱化研究

国家自然科学基金

1+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

Efficient Estimation of A-basis and B-Basis Value under Epistemic Uncertainty using Importance Sampling and Control Variates

Arxiv

0+阅读 · 6月11日

Possibilistic Predictive Uncertainty for Deep Learning

Arxiv

0+阅读 · 6月11日

Scalable Uncertainty Quantification for Extreme Weather Forecasting via Empirical Neural Tangent Kernels

Arxiv

0+阅读 · 6月3日

Uncertainty Estimation using Variance-Gated Distributions

Arxiv

0+阅读 · 6月2日

Scalable Uncertainty Quantification for Extreme Weather Forecasting via Empirical Neural Tangent Kernels

Arxiv

0+阅读 · 6月1日

Uncertainty Quantification for Multimodal Retrieval Augmented Generation

Arxiv

0+阅读 · 5月28日

Uncertainty Quantification for Multi-level Models Using the Survey-Weighted Pseudo-Posterior

Arxiv

0+阅读 · 5月11日

Quantifying Exposure Information Uncertainty in Regional Risk Assessment

Arxiv

0+阅读 · 5月8日

Uncertainty Quantification of Spline Predictors on Compact Riemannian Manifolds

Arxiv

0+阅读 · 3月25日

Uncertainty in Graph Neural Networks: A Survey

Arxiv

10+阅读 · 2024年3月11日

VIP会员

文章信息

相关主题

最新内容

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

专知会员服务

2+阅读 · 今天7:13

俄乌无人机战争的六大启示

俄乌无人机战争的六大启示

专知会员服务

4+阅读 · 今天7:07

《无人机空中监控：通信实验洞察》

《无人机空中监控：通信实验洞察》

专知会员服务

3+阅读 · 今天7:05

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

专知会员服务

3+阅读 · 今天6:59

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

12+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

5+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

10+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

12+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

6+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

10+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

8+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

9+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

8+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

6+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

13+阅读 · 7月31日

相关VIP内容

【CMU博士论文】校准不确定性量化的方法及其效用解析

【CMU博士论文】校准不确定性量化的方法及其效用解析

专知会员服务

22+阅读 · 2025年9月1日

【斯坦福博士论文】概率机器学习中的不确定性原理

【斯坦福博士论文】概率机器学习中的不确定性原理

专知会员服务

27+阅读 · 2025年8月4日

【牛津大学博士论文】不确定性量化与因果考量在非策略决策制定中的应用

【牛津大学博士论文】不确定性量化与因果考量在非策略决策制定中的应用

专知会员服务

20+阅读 · 2025年2月24日

《基于文本的情报源不确定性定量建模》最新112页

《基于文本的情报源不确定性定量建模》最新112页

专知会员服务

38+阅读 · 2024年8月11日

【博士论文】统计学习中的可靠不确定性量化,128页pdf

【博士论文】统计学习中的可靠不确定性量化,128页pdf

专知会员服务

45+阅读 · 2023年11月23日

【CMU博士论文】分布偏移下的不确定性量化，226页pdf

【CMU博士论文】分布偏移下的不确定性量化，226页pdf

专知会员服务

31+阅读 · 2023年9月30日

万字长文《不确定性量化：军事系统中的人工智能与机器学习》2023最新报告

万字长文《不确定性量化：军事系统中的人工智能与机器学习》2023最新报告

专知会员服务

113+阅读 · 2023年6月17日

【硬核书】不确定性:不确定性估计的现代主题，160页pdf

【硬核书】不确定性:不确定性估计的现代主题，160页pdf

专知会员服务

87+阅读 · 2022年12月4日

宾夕法尼亚大学最新《不确定性估计》课程笔记，134页pdf，附Slides

宾夕法尼亚大学最新《不确定性估计》课程笔记，134页pdf，附Slides

专知会员服务

49+阅读 · 2022年11月13日

不确定性下如何决策？弗吉尼亚理工最新《不确定性推理与量化的决策研究综述》，51页pdf阐述信念理论与深度学习结合下的不确定性决策

不确定性下如何决策？弗吉尼亚理工最新《不确定性推理与量化的决策研究综述》，51页pdf阐述信念理论与深度学习结合下的不确定性决策

专知会员服务

109+阅读 · 2022年6月17日

热门VIP内容

开通专知VIP会员享更多权益服务

俄乌无人机战争的六大启示

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《无人机空中监控：通信实验洞察》

相关资讯

北约384页技术报告《评估和沟通情报中的不确定性以支持决策》

北约384页技术报告《评估和沟通情报中的不确定性以支持决策》

专知

36+阅读 · 2022年7月26日

数据驱动的态势认知技术及发展思考

数据驱动的态势认知技术及发展思考

专知

20+阅读 · 2022年7月12日

深度学习模型不确定性方法对比

深度学习模型不确定性方法对比

PaperWeekly

20+阅读 · 2020年2月10日

「PPT」深度学习中的不确定性估计

「PPT」深度学习中的不确定性估计

专知

27+阅读 · 2019年7月20日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

【大数据】海量数据分析能力形成和大数据关键技术

【大数据】海量数据分析能力形成和大数据关键技术

产业智能官

17+阅读 · 2018年10月29日

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

论智

11+阅读 · 2018年10月9日

15款免费预测分析软件！收藏好，别丢了！

15款免费预测分析软件！收藏好，别丢了！

七月在线实验室

11+阅读 · 2018年2月27日

推荐｜北大：一种基于新闻特征抽取和循环神经网络的股票预测方法

推荐｜北大：一种基于新闻特征抽取和循环神经网络的股票预测方法

全球人工智能

14+阅读 · 2017年7月26日

回归预测&时间序列预测

回归预测&时间序列预测

GBASE数据工程部数据团队

44+阅读 · 2017年5月17日

相关论文

Efficient Estimation of A-basis and B-Basis Value under Epistemic Uncertainty using Importance Sampling and Control Variates

Arxiv

0+阅读 · 6月11日

Possibilistic Predictive Uncertainty for Deep Learning

Arxiv

0+阅读 · 6月11日

Scalable Uncertainty Quantification for Extreme Weather Forecasting via Empirical Neural Tangent Kernels

Arxiv

0+阅读 · 6月3日

Uncertainty Estimation using Variance-Gated Distributions

Arxiv

0+阅读 · 6月2日

Scalable Uncertainty Quantification for Extreme Weather Forecasting via Empirical Neural Tangent Kernels

Arxiv

0+阅读 · 6月1日

Uncertainty Quantification for Multimodal Retrieval Augmented Generation

Arxiv

0+阅读 · 5月28日

Uncertainty Quantification for Multi-level Models Using the Survey-Weighted Pseudo-Posterior

Arxiv

0+阅读 · 5月11日

Quantifying Exposure Information Uncertainty in Regional Risk Assessment

Arxiv

0+阅读 · 5月8日

Uncertainty Quantification of Spline Predictors on Compact Riemannian Manifolds

Arxiv

0+阅读 · 3月25日

Uncertainty in Graph Neural Networks: A Survey

Arxiv

10+阅读 · 2024年3月11日

相关基金

知识不确定性度量的粒计算模型及其应用研究

国家自然科学基金

1+阅读 · 2017年12月31日

随机振动响应预测中的模型形式不确定性量化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

测量误差数据下部分线性模型有约束统计推断理论

国家自然科学基金

2+阅读 · 2015年12月31日

高维回归模型的预测稳定性研究

国家自然科学基金

3+阅读 · 2015年12月31日

不确定线性系统故障诊断的区间分析理论与方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

不确定与动态信息环境下基于预规划-重规划集成建模的应急物流选址-调度鲁棒优化研究

国家自然科学基金

3+阅读 · 2014年12月31日

考虑不确定性和方向性的结构随机极值和疲劳风致响应及抗风可靠性评价理论

国家自然科学基金

0+阅读 · 2014年12月31日

灾害应急供应链中不确定与干扰下牛鞭效应风险弱化研究

国家自然科学基金

1+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员