Accurate and reliable forecasting models are critical for guiding public health responses and policy decisions during pandemics such as COVID-19. Retrospective evaluation of model performance is essential for improving epidemic forecasting capabilities. In this study, we used COVID-19 wastewater data from CDC's National Wastewater Surveillance System to generate sequential weekly retrospective forecasts for the United States from March 2022 through September 2024, both at the national level and for four major regions (Northeast, Midwest, South, and West). We produced 133 weekly forecasts using 11 models, including ARIMA, generalized additive models (GAM), simple linear regression (SLR), Prophet, and the n-sub-epidemic framework (top-ranked, weighted-ensemble, and unweighted-ensemble variants). Forecast performance was assessed using mean absolute error (MAE), mean squared error (MSE), weighted interval score (WIS), and 95% prediction interval coverage. The n-sub-epidemic unweighted ensembles outperformed all other models at 3-4-week horizons, particularly at the national level and in the Midwest and West. ARIMA and GAM performed best at 1-2-week horizons in most regions, whereas Prophet and SLR consistently underperformed across regions and horizons. These findings highlight the value of region-specific modeling strategies and demonstrate the utility of the n-sub-epidemic framework for real-time outbreak forecasting using wastewater surveillance data.


翻译:准确可靠的预测模型对于指导疫情期间(如COVID-19)的公共卫生应对措施和政策决策至关重要。对模型性能进行回顾性评估是提升疫情预测能力的关键。本研究利用美国疾病控制与预防中心国家废水监测系统的COVID-19废水数据,生成了2022年3月至2024年9月期间美国全国及四大区域(东北部、中西部、南部、西部)的连续周度回顾性预测。我们采用11种模型(包括ARIMA、广义加性模型、简单线性回归、Prophet以及n-子流行病框架的排名最优、加权集成与非加权集成变体)共生成了133次周度预测。使用平均绝对误差、均方误差、加权区间评分和95%预测区间覆盖率评估了预测性能。在3-4周预测期内,n-子流行病非加权集成在所有模型中表现最优,尤其在全国层面及中西部和西部地区。在大多数地区,ARIMA和广义加性模型在1-2周预测期内表现最佳,而Prophet和简单线性回归在各区域和预测期内均表现欠佳。这些发现凸显了区域特异性建模策略的价值,并展示了n-子流行病框架在利用废水监测数据进行实时疫情预测中的实用性。

0
下载
关闭预览

相关内容

流行病数据可视分析综述
专知会员服务
40+阅读 · 2022年4月4日
专知会员服务
28+阅读 · 2021年1月29日
COVID-19文献知识图谱构建,UIUC-哥伦比亚大学
专知会员服务
43+阅读 · 2020年7月2日
计算机视觉用于新冠病毒COVID-19的控制综述,25页pdf
专知会员服务
53+阅读 · 2020年4月22日
【华侨大学】基于混合深度学习算法的疾病预测模型
专知会员服务
97+阅读 · 2020年1月21日
【KDD2020】动态知识图谱的多事件预测
专知
88+阅读 · 2020年8月31日
【综述】交通流量预测,附15页论文下载
专知
23+阅读 · 2020年4月23日
[推荐] 这些年,我用过的点击率(CTR)预估模型!!!
菜鸟的机器学习
28+阅读 · 2017年7月31日
回归预测&时间序列预测
GBASE数据工程部数据团队
44+阅读 · 2017年5月17日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Arxiv
0+阅读 · 4月10日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
2+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
3+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
3+阅读 · 6月22日
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员