Heterogeneous susceptibility models for epidemic dynamics preferentially assume that individual susceptibility follows a gamma distribution, which permits analytical reduction to a low-dimensional system. However, the true empirical distributional form in any given population is unknown. Here we investigate the consequences of misspecifying the susceptibility distribution by comparing gamma and lognormal specifications in a Susceptible-Exposed-Infectious-Removed (SEIR) framework. When both distributions are matched on mean and coefficient of variation ($ν$), we find that their epidemic trajectories diverge once heterogeneity is moderate or high ($ν\gtrsim 1$), with the lognormal producing a later, larger peak and a greater final size. We then assess the impact of distributional misspecification on statistical inference. Using synthetic datasets, we fit correctly specified and misspecified models by maximum likelihood. In a default scenario, where inference is based on simulated data for a single epidemic, both models can reproduce the data by compensating through correlated shifts in heterogeneity and intervention parameters. When inference is based on two simulated epidemics, however, this compensation may be reduced by known constraints of how parameters are related across epidemics. In these cases, the correctly specified model recovers all parameters accurately, while the misspecified model tends to give biased estimates. These inference biases propagate into forecasts, but predictions remain relatively accurate when compared to homogeneous models which more than double peak incidences in scenarios where $ν\approx 1$, for instance. We conclude that deviations resulting from the susceptibility distribution misspecifications assessed here are minor and encourage the adoption of heterogeneous models in future epidemic forecasting.


翻译:针对传染病动力学中的异质性易感模型,通常假设个体易感性服从伽马分布,以便通过解析简化降维至低阶系统。然而,在给定人群中真实的经验分布形式是未知的。本研究通过比较易感-暴露-感染-移除(SEIR)框架下的伽马分布与对数正态分布,探讨错误设定易感性分布的后果。当两种分布在均值和变异系数($ν$)上相匹配时,我们发现一旦异质性达到中等或较高水平($ν\gtrsim 1$),疫情轨迹出现分歧——对数正态分布会导致更晚、更大的峰值以及更高的最终规模。我们继而评估分布错误设定对统计推断的影响。利用合成数据集,我们通过最大似然估计拟合正确设定与错误设定的模型。在默认情景下(基于单一疫情的模拟数据进行推断),两种模型都能通过异质性与干预参数的相关性偏移补偿并复现数据。然而,当基于两轮模拟疫情进行推断时,这种补偿可能因已知的参数跨疫情约束关系而减弱。在此类情形中,正确设定模型能精确恢复所有参数,而错误设定模型往往给出有偏估计。这些推断偏差会传导至预报,但与均匀模型(例如在$ν\approx 1$场景下,其峰值发病率超过两倍)相比,预测结果仍相对准确。我们得出结论:本研究所评估的因易感性分布错误设定导致的偏差较小,并建议在未来疫情预报中采用异质性模型。

0
下载
关闭预览

相关内容

【ETHZ博士论文】分布不确定性下的决策,234页pdf
专知会员服务
49+阅读 · 2024年4月5日
《分布外泛化评估》综述
专知会员服务
44+阅读 · 2024年3月6日
【CMU博士论文】分布偏移下的不确定性量化,226页pdf
专知会员服务
31+阅读 · 2023年9月30日
【NeurIPS2021】学习用于分布外预测的因果语义表示
专知会员服务
18+阅读 · 2021年11月19日
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
从信息论的角度来理解损失函数
深度学习每日摘要
17+阅读 · 2019年4月7日
稀疏性的3个优势 -《稀疏统计学习及其应用》
遇见数学
15+阅读 · 2018年10月24日
异常检测的阈值,你怎么选?给你整理好了...
机器学习算法与Python学习
10+阅读 · 2018年9月19日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
VIP会员
最新内容
《通过小型无人机系统将情报能力“作战化”》
消耗优势:美军的“精确规模化”概念
专知会员服务
8+阅读 · 6月15日
《离线语言支持系统:面向空战战术决策》
专知会员服务
10+阅读 · 6月15日
相关VIP内容
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员