Enhancing the statistical evaluation of earthquake forecasts -- An application to Italy - 专知论文

会员服务 ·

0

工具 · 数学理论 · 新型 · 集成 · 集成模型 ·

Enhancing the statistical evaluation of earthquake forecasts -- An application to Italy

翻译：提升地震预测的统计评估方法——在意大利的应用

Jonas R. Brehmer,Kristof Kraus,Tilmann Gneiting,Marcus Herrmann,Warner Marzocchi

Testing earthquake forecasts is essential to obtain scientific information on forecasting models and sufficient credibility for societal usage. We aim at enhancing the testing phase proposed by the Collaboratory for the Study of Earthquake Predictability (CSEP, Schorlemmer et al., 2018) with new statistical methods supported by mathematical theory. To demonstrate their applicability, we evaluate three short-term forecasting models that were submitted to the CSEP-Italy experiment, and two ensemble models thereof. The models produce weekly overlapping forecasts for the expected number of M4+ earthquakes in a collection of grid cells. We compare the models' forecasts using consistent scoring functions for means or expectations, which are widely used and theoretically principled tools for forecast evaluation. We further discuss and demonstrate their connection to CSEP-style earthquake likelihood model testing, and specifically suggest an improvement of the T-test. Then, using tools from isotonic regression, we investigate forecast reliability and apply score decompositions in terms of calibration and discrimination. Our results show where and how models outperform their competitors and reveal a substantial lack of calibration for various models. The proposed methods also apply to full-distribution (e.g., catalog-based) forecasts, without requiring Poisson distributions or making any other type of parametric assumption.

翻译：检验地震预测对于获取预测模型的科学信息以及确保社会应用的可信度至关重要。本研究旨在利用数学理论支持的新型统计方法，增强由地震可预测性研究合作实验室（CSEP，Schorlemmer等人，2018年）提出的检验阶段。为论证其适用性，我们评估了提交至CSEP-意大利实验的三个短期预测模型及其两个集成模型。这些模型针对网格单元集合中M4+地震的预期数量生成每周重叠预测。我们采用均值或期望的一致评分函数（一种广泛使用且具有理论原则的预测评估工具）来比较模型预测。我们进一步讨论并论证了这些方法与CSEP式地震似然模型检验的关联，特别提出了对T检验的改进方案。随后，利用等渗回归工具，我们研究了预测的可靠性，并基于校准与辨别能力进行了评分分解。研究结果揭示了模型在何时何地优于竞争对手，并指出多种模型存在显著的校准不足问题。所提出的方法同样适用于全分布（例如基于目录的）预测，且无需假设泊松分布或任何其他参数化假设。

0

相关内容

深度学习与基础模型在天气预测中的应用：综述

深度学习与基础模型在天气预测中的应用：综述

专知会员服务

24+阅读 · 2025年1月15日

《地理信息系统和遥感在军事行动中的应用：综述》

《地理信息系统和遥感在军事行动中的应用：综述》

专知会员服务

43+阅读 · 2025年1月3日

《QuakeCast：使用机器学习进行地震预报——将震前电离层异常识别和分类为地震信号》2022最新58页报告，林肯实验室

《QuakeCast：使用机器学习进行地震预报——将震前电离层异常识别和分类为地震信号》2022最新58页报告，林肯实验室

专知会员服务

19+阅读 · 2023年1月9日

《灾难响应中的 AI赋能态势感知》约翰霍普金斯大学48页技术报告

《灾难响应中的 AI赋能态势感知》约翰霍普金斯大学48页技术报告

专知会员服务

44+阅读 · 2022年12月19日

【实用书】统计显著性测试以及在自然语言中的应用，118页pdf

【实用书】统计显著性测试以及在自然语言中的应用，118页pdf

专知会员服务

47+阅读 · 2022年6月4日

《计量经济学的数据科学：预测建模方法》宾夕法尼亚大学课程，含280页slides，355页书稿

《计量经济学的数据科学：预测建模方法》宾夕法尼亚大学课程，含280页slides，355页书稿

专知会员服务

26+阅读 · 2022年5月14日

【干货书】预测原理与实战，Forecasting: Principles & Practice

【干货书】预测原理与实战，Forecasting: Principles & Practice

专知会员服务

96+阅读 · 2022年4月11日

重磅！70+位作者272页pdf《预测：理论与实践》，概述预测体系

重磅！70+位作者272页pdf《预测：理论与实践》，概述预测体系

专知会员服务

61+阅读 · 2022年3月13日

最新《大数据时代事件预测》综述论文，40页pdf，Emory 大学

最新《大数据时代事件预测》综述论文，40页pdf，Emory 大学

专知会员服务

68+阅读 · 2020年7月21日

【论文推荐】NGBoost:用于概率预测的自然梯度增强（NGBoost: Natural Gradient Boosting for Probabilistic Prediction）

【论文推荐】NGBoost:用于概率预测的自然梯度增强（NGBoost: Natural Gradient Boosting for Probabilistic Prediction）

专知会员服务

18+阅读 · 2019年12月25日

【AI与军事】机器学习的军事应用，一种文献计量视角

【AI与军事】机器学习的军事应用，一种文献计量视角

专知

54+阅读 · 2022年4月25日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

90+阅读 · 2022年4月17日

【综述】交通流量预测，附15页论文下载

【综述】交通流量预测，附15页论文下载

专知

23+阅读 · 2020年4月23日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

自然语言处理中的语言模型预训练方法

自然语言处理中的语言模型预训练方法

PaperWeekly

14+阅读 · 2018年10月21日

深度学习在CTR预估中的应用 | CTR深度模型大盘点

深度学习在CTR预估中的应用 | CTR深度模型大盘点

PaperWeekly

15+阅读 · 2018年4月11日

15款免费预测分析软件！收藏好，别丢了！

15款免费预测分析软件！收藏好，别丢了！

七月在线实验室

11+阅读 · 2018年2月27日

推荐｜北大：一种基于新闻特征抽取和循环神经网络的股票预测方法

推荐｜北大：一种基于新闻特征抽取和循环神经网络的股票预测方法

全球人工智能

14+阅读 · 2017年7月26日

抗噪、抗假频叠前地震数据插值方法研究

国家自然科学基金

1+阅读 · 2016年12月31日

模拟地震监测波形记录矢量化关键算法研究与系统开发

国家自然科学基金

0+阅读 · 2015年12月31日

井震联合数据驱动下，多智能技术融合的煤层气储层参数预测与评价

国家自然科学基金

2+阅读 · 2015年12月31日

支持应急决策的气象灾害大数据融合的方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

融合多模GNSS和强震仪观测的地震实时监测技术方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂地震环境下多源遥感影像引力智能优化分类模型与算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

地震波入射方向对边坡地震响应影响的超声模拟研究

国家自然科学基金

0+阅读 · 2014年12月31日

震后松散堆积层降雨滑坡预警阈值与预警方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

粘弹地球模型的地震变形理论及其在大地震中的应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

高速铁路地震监测、预警理论与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

Predictive Query Language: A Domain-Specific Language for Predictive Modeling on Relational Databases

Arxiv

0+阅读 · 2月16日

Do More Predictions Improve Statistical Inference? Filtered Prediction-Powered Inference

Arxiv

0+阅读 · 2月11日

Analyzing the retraining frequency of global forecasting models: towards more stable forecasting systems

Arxiv

0+阅读 · 2月10日

Correcting exponentiality test for binned earthquake magnitudes

Arxiv

0+阅读 · 2月4日

StefaLand: An Efficient Geoscience Foundation Model That Improves Dynamic Land-Surface Predictions

Arxiv

0+阅读 · 2月2日

Integrating Fourier Neural Operators with Diffusion Models to improve Spectral Representation of Synthetic Earthquake Ground Motion Response

Arxiv

0+阅读 · 1月30日

Evaluating Large Language Models for Security Bug Report Prediction

Arxiv

0+阅读 · 1月30日

PROPHET: An Inferable Future Forecasting Benchmark with Causal Intervened Likelihood Estimation

Arxiv

0+阅读 · 1月27日

A Large-scale Benchmark on Geological Fault Delineation Models: Domain Shift, Training Dynamics, Generalizability, Evaluation and Inferential Behavior

Arxiv

0+阅读 · 1月19日

TrustEnergy: A Unified Framework for Accurate and Reliable User-level Energy Usage Prediction

Arxiv

0+阅读 · 1月19日

VIP会员

文章信息

相关主题

最新内容

【斯坦福博士论文】语言模型的机械可解释性与控制

【斯坦福博士论文】语言模型的机械可解释性与控制

专知会员服务

0+阅读 · 今天13:13

大语言模型智能体长期记忆安全性综述：迈向记忆主权

大语言模型智能体长期记忆安全性综述：迈向记忆主权

专知会员服务

0+阅读 · 今天13:08

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

专知会员服务

3+阅读 · 今天7:11

人工智能赋能无人机：俄乌战争（万字长文）

人工智能赋能无人机：俄乌战争（万字长文）

专知会员服务

5+阅读 · 今天6:56

国外海军作战管理系统与作战训练系统

国外海军作战管理系统与作战训练系统

专知会员服务

2+阅读 · 今天4:16

美军条令《海军陆战队规划流程（2026版）》

美军条令《海军陆战队规划流程（2026版）》

专知会员服务

10+阅读 · 今天3:36

《压缩式分布式交互仿真标准》120页

《压缩式分布式交互仿真标准》120页

专知会员服务

4+阅读 · 今天3:21

《电子战数据交换模型研究报告》

《电子战数据交换模型研究报告》

专知会员服务

6+阅读 · 今天3:13

美军运用水下无人机与机器人系统竞速清除霍尔木兹海峡水雷

美军运用水下无人机与机器人系统竞速清除霍尔木兹海峡水雷

专知会员服务

4+阅读 · 今天2:55

《基于Transformer的异常舰船导航识别与跟踪》80页

《基于Transformer的异常舰船导航识别与跟踪》80页

专知会员服务

8+阅读 · 今天2:45

《美国太空系统司令部实验室原型作战管理系统的数据与决策可追溯性》

《美国太空系统司令部实验室原型作战管理系统的数据与决策可追溯性》

专知会员服务

6+阅读 · 今天2:41

《低数据领域军事目标检测模型研究》

《低数据领域军事目标检测模型研究》

专知会员服务

6+阅读 · 今天2:37

《为韧性而设计：在战略不确定时代提升军事空军基地的生存能力》

《为韧性而设计：在战略不确定时代提升军事空军基地的生存能力》

专知会员服务

6+阅读 · 今天2:32

【CMU博士论文】物理世界的视觉感知与深度理解

【CMU博士论文】物理世界的视觉感知与深度理解

专知会员服务

10+阅读 · 4月22日

多智能体系统：从经典范式到大基础模型驱动的未来

多智能体系统：从经典范式到大基础模型驱动的未来

专知会员服务

17+阅读 · 4月22日

相关VIP内容

深度学习与基础模型在天气预测中的应用：综述

深度学习与基础模型在天气预测中的应用：综述

专知会员服务

24+阅读 · 2025年1月15日

《地理信息系统和遥感在军事行动中的应用：综述》

《地理信息系统和遥感在军事行动中的应用：综述》

专知会员服务

43+阅读 · 2025年1月3日

《QuakeCast：使用机器学习进行地震预报——将震前电离层异常识别和分类为地震信号》2022最新58页报告，林肯实验室

《QuakeCast：使用机器学习进行地震预报——将震前电离层异常识别和分类为地震信号》2022最新58页报告，林肯实验室

专知会员服务

19+阅读 · 2023年1月9日

《灾难响应中的 AI赋能态势感知》约翰霍普金斯大学48页技术报告

《灾难响应中的 AI赋能态势感知》约翰霍普金斯大学48页技术报告

专知会员服务

44+阅读 · 2022年12月19日

【实用书】统计显著性测试以及在自然语言中的应用，118页pdf

【实用书】统计显著性测试以及在自然语言中的应用，118页pdf

专知会员服务

47+阅读 · 2022年6月4日

《计量经济学的数据科学：预测建模方法》宾夕法尼亚大学课程，含280页slides，355页书稿

《计量经济学的数据科学：预测建模方法》宾夕法尼亚大学课程，含280页slides，355页书稿

专知会员服务

26+阅读 · 2022年5月14日

【干货书】预测原理与实战，Forecasting: Principles & Practice

【干货书】预测原理与实战，Forecasting: Principles & Practice

专知会员服务

96+阅读 · 2022年4月11日

重磅！70+位作者272页pdf《预测：理论与实践》，概述预测体系

重磅！70+位作者272页pdf《预测：理论与实践》，概述预测体系

专知会员服务

61+阅读 · 2022年3月13日

最新《大数据时代事件预测》综述论文，40页pdf，Emory 大学

最新《大数据时代事件预测》综述论文，40页pdf，Emory 大学

专知会员服务

68+阅读 · 2020年7月21日

【论文推荐】NGBoost:用于概率预测的自然梯度增强（NGBoost: Natural Gradient Boosting for Probabilistic Prediction）

【论文推荐】NGBoost:用于概率预测的自然梯度增强（NGBoost: Natural Gradient Boosting for Probabilistic Prediction）

专知会员服务

18+阅读 · 2019年12月25日

热门VIP内容

开通专知VIP会员享更多权益服务

大语言模型智能体长期记忆安全性综述：迈向记忆主权

人工智能赋能无人机：俄乌战争（万字长文）

【斯坦福博士论文】语言模型的机械可解释性与控制

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

相关资讯

【AI与军事】机器学习的军事应用，一种文献计量视角

【AI与军事】机器学习的军事应用，一种文献计量视角

专知

54+阅读 · 2022年4月25日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

90+阅读 · 2022年4月17日

【综述】交通流量预测，附15页论文下载

【综述】交通流量预测，附15页论文下载

专知

23+阅读 · 2020年4月23日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

自然语言处理中的语言模型预训练方法

自然语言处理中的语言模型预训练方法

PaperWeekly

14+阅读 · 2018年10月21日

深度学习在CTR预估中的应用 | CTR深度模型大盘点

深度学习在CTR预估中的应用 | CTR深度模型大盘点

PaperWeekly

15+阅读 · 2018年4月11日

15款免费预测分析软件！收藏好，别丢了！

15款免费预测分析软件！收藏好，别丢了！

七月在线实验室

11+阅读 · 2018年2月27日

推荐｜北大：一种基于新闻特征抽取和循环神经网络的股票预测方法

推荐｜北大：一种基于新闻特征抽取和循环神经网络的股票预测方法

全球人工智能

14+阅读 · 2017年7月26日

相关论文

Predictive Query Language: A Domain-Specific Language for Predictive Modeling on Relational Databases

Arxiv

0+阅读 · 2月16日

Do More Predictions Improve Statistical Inference? Filtered Prediction-Powered Inference

Arxiv

0+阅读 · 2月11日

Analyzing the retraining frequency of global forecasting models: towards more stable forecasting systems

Arxiv

0+阅读 · 2月10日

Correcting exponentiality test for binned earthquake magnitudes

Arxiv

0+阅读 · 2月4日

StefaLand: An Efficient Geoscience Foundation Model That Improves Dynamic Land-Surface Predictions

Arxiv

0+阅读 · 2月2日

Integrating Fourier Neural Operators with Diffusion Models to improve Spectral Representation of Synthetic Earthquake Ground Motion Response

Arxiv

0+阅读 · 1月30日

Evaluating Large Language Models for Security Bug Report Prediction

Arxiv

0+阅读 · 1月30日

PROPHET: An Inferable Future Forecasting Benchmark with Causal Intervened Likelihood Estimation

Arxiv

0+阅读 · 1月27日

A Large-scale Benchmark on Geological Fault Delineation Models: Domain Shift, Training Dynamics, Generalizability, Evaluation and Inferential Behavior

Arxiv

0+阅读 · 1月19日

TrustEnergy: A Unified Framework for Accurate and Reliable User-level Energy Usage Prediction

Arxiv

0+阅读 · 1月19日

相关基金

抗噪、抗假频叠前地震数据插值方法研究

国家自然科学基金

1+阅读 · 2016年12月31日

模拟地震监测波形记录矢量化关键算法研究与系统开发

国家自然科学基金

0+阅读 · 2015年12月31日

井震联合数据驱动下，多智能技术融合的煤层气储层参数预测与评价

国家自然科学基金

2+阅读 · 2015年12月31日

支持应急决策的气象灾害大数据融合的方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

融合多模GNSS和强震仪观测的地震实时监测技术方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂地震环境下多源遥感影像引力智能优化分类模型与算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

地震波入射方向对边坡地震响应影响的超声模拟研究

国家自然科学基金

0+阅读 · 2014年12月31日

震后松散堆积层降雨滑坡预警阈值与预警方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

粘弹地球模型的地震变形理论及其在大地震中的应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

高速铁路地震监测、预警理论与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员