Nowcasting and forecasting of infectious diseases have become increasingly important since the SARS-CoV-2 pandemic. In particular, methods for modeling the composition of circulating variants at a given time have seen more use in part due to a large increase in the frequency of genomic sequencing conducted as a part of routine surveillance. However, methods must take into account that locations have different amounts of data and sometimes have different trends. We discuss hierarchical multinomial logistic regression (HMLR), a commonly used method for forecasting SARS-CoV-2 variants, which allows for data sharing across locations. We show how it has been used in the literature, and define a class of HMLR models for SARS-CoV-2 variant nowcasting and forecasting. We rigorously test a subset of this class of models using the framework of the US SARS-CoV-2 Variant Nowcast Hub, a collaborative modeling project that launched in 2024. We created two years of weekly predictions based on retrospective datasets, with the prediction dates ranging from Wednesday, August 3, 2022, to Wednesday, August 7, 2024. We tested 12 HMLR models against a baseline model on these datasets. We found that the HMLR models outperformed the baseline both in terms of probabilistic accuracy, as measured by the energy score, as well as point accuracy, as measured by the Brier score. Overall, we find that HMLR models perform best with respect to the baseline model in locations with more data, and more complex HMLR models also showed more improvement in those high-data locations; however, there was no one best model across all metrics, and simpler HMLR models perform better in low-data locations. We find that HMLR models perform well in practice for nowcasting and forecasting SARS-CoV-2 variants.


翻译:自SARS-CoV-2大流行以来,传染病的临近预报与预测日益受到重视。特别是,对特定时间点流行毒株组成进行建模的方法应用更广,这在一定程度上归因于常规监测中基因组测序频率的大幅提升。然而,建模方法必须考虑不同地区数据量的差异及趋势的异质性。本文探讨了分层多项逻辑回归(HMLR)——一种常用于预测SARS-CoV-2变异株的方法,该方法允许跨地区数据共享。我们阐述了HMLR在文献中的应用方式,并定义了一类用于SARS-CoV-2变异株临近预报与预测的HMLR模型。我们以2024年启动的协作建模项目——美国SARS-CoV-2变异株临近预报中心为框架,对该模型类的一个子集进行了严格测试。基于回顾性数据集,我们生成了为期两年的周度预测,预测日期跨度从2022年8月3日(星期三)至2024年8月7日(星期三)。我们在这些数据集上测试了12种HMLR模型,并将其与基线模型进行对比。结果表明,无论是通过能量得分衡量的概率准确性,还是通过布莱尔评分衡量的点预测准确性,HMLR模型均优于基线模型。整体而言,我们发现HMLR模型在数据量更丰富的地区表现更佳,且复杂HMLR模型在数据量高的地区改进效果更显著;然而,在所有评估指标上并不存在单一最优模型,而简单HMLR模型在数据量少的地区表现更优。研究证实,HMLR模型在SARS-CoV-2变异株的临近预报与预测实践中具有良好性能。

0
下载
关闭预览

相关内容

流行病数据可视分析综述
专知会员服务
40+阅读 · 2022年4月4日
专知会员服务
28+阅读 · 2021年1月29日
异质信息网络分析与应用综述,软件学报-北京邮电大学
专知会员服务
29+阅读 · 2020年3月6日
【AAAI2021】对比聚类,Contrastive Clustering
专知
26+阅读 · 2021年1月30日
【工大SCIR笔记】多模态信息抽取简述
深度学习自然语言处理
19+阅读 · 2020年4月3日
读书报告 | Deep Learning for Extreme Multi-label Text Classification
科技创新与创业
48+阅读 · 2018年1月10日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
回归预测&时间序列预测
GBASE数据工程部数据团队
44+阅读 · 2017年5月17日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Arxiv
0+阅读 · 5月27日
VIP会员
最新内容
ICML 2026 | CFPO:用反事实策略优化提升多模态推理
专知会员服务
1+阅读 · 26分钟前
综述 | 世界动作模型:少做梦,多行动
专知会员服务
1+阅读 · 28分钟前
美以伊冲突:无人机与人工智能的运用
专知会员服务
2+阅读 · 40分钟前
《人工智能生成的零日漏洞:对未来作战的影响》
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关VIP内容
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员