Mantis: A Foundation Model for Mechanistic Disease Forecasting - 专知论文

会员服务 ·

0

疾病预测 · 平均绝对误差 · 大模型 · 调参 · 快速生成 ·

Mantis: A Foundation Model for Mechanistic Disease Forecasting

翻译：Mantis：一种用于机理疾病预测的基础模型

Carson Dudley,Reiden Magdaleno,Christopher Harding,Ananya Sharma,Emily Martin,Marisa Eisenberg

from arxiv, 11 pages, 4 figures

Infectious disease forecasting in novel outbreaks or low-resource settings is hampered by the need for large disease and covariate data sets, bespoke training, and expert tuning, all of which can hinder rapid generation of forecasts for new settings. To help address these challenges, we developed Mantis, a foundation model trained entirely on mechanistic simulations, which enables out-of-the-box forecasting across diseases, regions, and outcomes, even in settings with limited historical data. We evaluated Mantis against 48 forecasting models across six diseases with diverse modes of transmission, assessing both point forecast accuracy (mean absolute error) and probabilistic performance (weighted interval score and coverage). Despite using no real-world data during training, Mantis achieved lower mean absolute error than all models in the CDC's COVID-19 Forecast Hub when backtested on early pandemic forecasts which it had not previously seen. Across all other diseases tested, Mantis consistently ranked in the top two models across evaluation metrics. Mantis further generalized to diseases with transmission mechanisms not represented in its training data, demonstrating that it can capture fundamental contagion dynamics rather than memorizing disease-specific patterns. These capabilities illustrate that purely simulation-based foundation models such as Mantis can provide a practical foundation for disease forecasting: general-purpose, accurate, and deployable where traditional models struggle.

翻译：在新发传染病暴发或资源匮乏环境下进行传染病预测时，常因需要大规模疾病与协变量数据集、定制化训练及专家调参而受到限制，这些因素均会阻碍为新场景快速生成预测。为应对这些挑战，我们开发了Mantis——一种完全基于机理模拟训练的基础模型，该模型能够实现跨疾病、跨区域、跨预测指标的即用型预测，即使在历史数据有限的场景下亦能适用。我们在六种具有不同传播模式的疾病上，将Mantis与48种预测模型进行了对比评估，同时考察了点预测精度（平均绝对误差）与概率预测性能（加权区间评分与覆盖度）。尽管训练过程中未使用任何真实世界数据，在对先前未见过的早期大流行预测进行回溯测试时，Mantis的平均绝对误差低于美国疾病控制与预防中心（CDC）COVID-19预测中心的所有模型。在所有其他测试疾病中，Mantis在各项评估指标上均稳定位列前两名。Mantis进一步推广至训练数据中未包含传播机制的疾病，证明其能够捕捉基本的传染动力学规律，而非记忆疾病特异性模式。这些能力表明，如Mantis这类纯基于模拟的基础模型可为疾病预测提供实用基础：其具备通用性、准确性，并可在传统模型难以应对的场景中部署使用。

0

相关内容

疾病预测

LLM in Medical Domain: 大语言模型在医学领域的应用

LLM in Medical Domain: 大语言模型在医学领域的应用

专知会员服务

103+阅读 · 2023年6月17日

上海市数字医学创新中心：2022中国智慧数字病理行业发展白皮书（附报告），56页pdf

上海市数字医学创新中心：2022中国智慧数字病理行业发展白皮书（附报告），56页pdf

专知会员服务

45+阅读 · 2023年1月30日

AI如何做新冠疫情预测？佐治亚理工最新《以数据为中心的流行病预测》综述，67页pdf全面阐述流行病预测方法模型

AI如何做新冠疫情预测？佐治亚理工最新《以数据为中心的流行病预测》综述，67页pdf全面阐述流行病预测方法模型

专知会员服务

58+阅读 · 2022年7月20日

Nat. Mach. Intel. | 一种用于分子相互作用和分子性质预测自动图学习方法

Nat. Mach. Intel. | 一种用于分子相互作用和分子性质预测自动图学习方法

专知会员服务

20+阅读 · 2022年6月25日

国内数十位NLP大佬合作，综述预训练模型的过去、现在与未来

国内数十位NLP大佬合作，综述预训练模型的过去、现在与未来

专知会员服务

33+阅读 · 2021年9月8日

自动化所研发全球首个图文音三模态预训练模型，让AI更接近人类想象力！

自动化所研发全球首个图文音三模态预训练模型，让AI更接近人类想象力！

专知会员服务

35+阅读 · 2021年7月8日

网络攻击模型研究综述

专知会员服务

57+阅读 · 2020年12月28日

【KDD2020】通用文档预训练模型LayoutLM：文档结构信息和视觉信息进行建模，让模型在预训练阶段进行多模态对齐。

【KDD2020】通用文档预训练模型LayoutLM：文档结构信息和视觉信息进行建模，让模型在预训练阶段进行多模态对齐。

专知会员服务

32+阅读 · 2020年8月23日

【华侨大学】基于混合深度学习算法的疾病预测模型

【华侨大学】基于混合深度学习算法的疾病预测模型

专知会员服务

97+阅读 · 2020年1月21日

【Nature论文】用于理解图像分类决策和改进神经网络鲁棒性的对抗性解释（Adversarial Explanations for Understanding Image Classiﬁcation Decisions and Improved Neural Network Robustness ）

【Nature论文】用于理解图像分类决策和改进神经网络鲁棒性的对抗性解释（Adversarial Explanations for Understanding Image Classiﬁcation Decisions and Improved Neural Network Robustness ）

专知会员服务

14+阅读 · 2019年11月25日

哈佛大学｜构建知识图谱PrimeKG以实现精准医疗--数据与代码全部公开，帮你从零开始复现知识图谱

哈佛大学｜构建知识图谱PrimeKG以实现精准医疗--数据与代码全部公开，帮你从零开始复现知识图谱

GenomicAI

29+阅读 · 2022年5月4日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

论文浅尝 | 基于事理图谱的脚本事件预测

论文浅尝 | 基于事理图谱的脚本事件预测

开放知识图谱

10+阅读 · 2019年12月10日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

专家报告|深度学习+图像多模态融合

专家报告|深度学习+图像多模态融合

中国图象图形学报

12+阅读 · 2019年10月23日

大讲堂 | 基于医疗知识的疾病诊断预测

大讲堂 | 基于医疗知识的疾病诊断预测

AI科技评论

10+阅读 · 2019年1月22日

推荐｜上交大推出Texygen：文本生成模型的基准测试平台

推荐｜上交大推出Texygen：文本生成模型的基准测试平台

全球人工智能

15+阅读 · 2018年2月8日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

【360人工智能研究院与NUS颜水成团队】HashGAN:基于注意力机制的深度对抗哈希模型提升跨模态检索效果

【360人工智能研究院与NUS颜水成团队】HashGAN:基于注意力机制的深度对抗哈希模型提升跨模态检索效果

专知

16+阅读 · 2017年11月29日

基于子模优化的远程预警传感器管理研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于在线社会媒体数据的疾病传播过程中人类行为变化机制与模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于网络的复杂疾病动态表观修饰模块挖掘

国家自然科学基金

0+阅读 · 2015年12月31日

年龄结构传染病模型的动力学研究

国家自然科学基金

1+阅读 · 2015年12月31日

用于癫痫发作预测的脑电特征深度学习研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向帕金森病的多模态在线预警方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于公立医院动态人本化管理的医患冲突预警和干预模式构建

国家自然科学基金

1+阅读 · 2014年12月31日

新型统计模型在精神疾病的基因、脑影像和行为数据整合中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

传染病多维度分级预警研究

国家自然科学基金

4+阅读 · 2014年12月31日

DEpiABS: Differentiable Epidemic Agent-Based Simulator

Arxiv

0+阅读 · 2月12日

PatientHub: A Unified Framework for Patient Simulation

Arxiv

0+阅读 · 2月12日

MEmilio -- A high performance Modular EpideMIcs simuLatIOn software for multi-scale and comparative simulations of infectious disease dynamics

Arxiv

0+阅读 · 2月11日

Evaluating Predictive Modeling Strategies for Predicting Individual Treatment Effects in Precision Medicine

Arxiv

0+阅读 · 2月5日

StainNet: Scaling Self-Supervised Foundation Models on Immunohistochemistry and Special Stains for Computational Pathology

Arxiv

0+阅读 · 2月4日

StefaLand: An Efficient Geoscience Foundation Model That Improves Dynamic Land-Surface Predictions

Arxiv

0+阅读 · 2月2日

AnoMod: A Dataset for Anomaly Detection and Root Cause Analysis in Microservice Systems

Arxiv

0+阅读 · 1月30日

Cross-Country Learning for National Infectious Disease Forecasting Using European Data

Arxiv

0+阅读 · 1月28日

CaseMaster: Designing and Evaluating a Probe for Oral Case Presentation Training with LLM Assistance

Arxiv

0+阅读 · 1月27日

Whole Slide Concepts: A Supervised Foundation Model For Pathological Images

Arxiv

0+阅读 · 1月26日

VIP会员

文章信息

相关主题

平均绝对误差

最新内容

论文解读 | 医学图像修复中的扩散模型：挑战、分类与未来方向

论文解读 | 医学图像修复中的扩散模型：挑战、分类与未来方向

专知会员服务

1+阅读 · 7月28日

博士论文 | 从算法到基础模型：强化学习的统一视角

博士论文 | 从算法到基础模型：强化学习的统一视角

专知会员服务

4+阅读 · 7月28日

面向国防作战的最佳自主与蜂群无人机技术

面向国防作战的最佳自主与蜂群无人机技术

专知会员服务

7+阅读 · 7月28日

《异构人类团队的协作决策过程混合建模研究》

《异构人类团队的协作决策过程混合建模研究》

专知会员服务

6+阅读 · 7月28日

《C5ISR系统中的注意力动态与自适应决策支持研究：视觉与多模态注意力引导对任务绩效影响的递归量化分析》最新36页报告

《C5ISR系统中的注意力动态与自适应决策支持研究：视觉与多模态注意力引导对任务绩效影响的递归量化分析》最新36页报告

专知会员服务

7+阅读 · 7月28日

《设计思维中的人机协作：生成式人工智能对共情访谈影响的探究》140页

《设计思维中的人机协作：生成式人工智能对共情访谈影响的探究》140页

专知会员服务

8+阅读 · 7月28日

博士论文 | 面向大模型推理的内存高效算法

博士论文 | 面向大模型推理的内存高效算法

专知会员服务

5+阅读 · 7月27日

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

专知会员服务

8+阅读 · 7月27日

《无人系统互操作性导论——无人系统联合架构（JAUS）》

《无人系统互操作性导论——无人系统联合架构（JAUS）》

专知会员服务

14+阅读 · 7月27日

美空军新型反无人机部队初探

美空军新型反无人机部队初探

专知会员服务

9+阅读 · 7月27日

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

专知会员服务

8+阅读 · 7月27日

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

专知会员服务

6+阅读 · 7月27日

《防空交战流程的概率建模研究》

《防空交战流程的概率建模研究》

专知会员服务

12+阅读 · 7月27日

ICML 2026 教程 | 数值优化理论还重要吗？

ICML 2026 教程 | 数值优化理论还重要吗？

专知会员服务

7+阅读 · 7月26日

ICM 2026 | 陶哲轩：人工智能时代的数学

ICM 2026 | 陶哲轩：人工智能时代的数学

专知会员服务

10+阅读 · 7月26日

相关VIP内容

LLM in Medical Domain: 大语言模型在医学领域的应用

LLM in Medical Domain: 大语言模型在医学领域的应用

专知会员服务

103+阅读 · 2023年6月17日

上海市数字医学创新中心：2022中国智慧数字病理行业发展白皮书（附报告），56页pdf

上海市数字医学创新中心：2022中国智慧数字病理行业发展白皮书（附报告），56页pdf

专知会员服务

45+阅读 · 2023年1月30日

AI如何做新冠疫情预测？佐治亚理工最新《以数据为中心的流行病预测》综述，67页pdf全面阐述流行病预测方法模型

AI如何做新冠疫情预测？佐治亚理工最新《以数据为中心的流行病预测》综述，67页pdf全面阐述流行病预测方法模型

专知会员服务

58+阅读 · 2022年7月20日

Nat. Mach. Intel. | 一种用于分子相互作用和分子性质预测自动图学习方法

Nat. Mach. Intel. | 一种用于分子相互作用和分子性质预测自动图学习方法

专知会员服务

20+阅读 · 2022年6月25日

国内数十位NLP大佬合作，综述预训练模型的过去、现在与未来

国内数十位NLP大佬合作，综述预训练模型的过去、现在与未来

专知会员服务

33+阅读 · 2021年9月8日

自动化所研发全球首个图文音三模态预训练模型，让AI更接近人类想象力！

自动化所研发全球首个图文音三模态预训练模型，让AI更接近人类想象力！

专知会员服务

35+阅读 · 2021年7月8日

网络攻击模型研究综述

专知会员服务

57+阅读 · 2020年12月28日

【KDD2020】通用文档预训练模型LayoutLM：文档结构信息和视觉信息进行建模，让模型在预训练阶段进行多模态对齐。

【KDD2020】通用文档预训练模型LayoutLM：文档结构信息和视觉信息进行建模，让模型在预训练阶段进行多模态对齐。

专知会员服务

32+阅读 · 2020年8月23日

【华侨大学】基于混合深度学习算法的疾病预测模型

【华侨大学】基于混合深度学习算法的疾病预测模型

专知会员服务

97+阅读 · 2020年1月21日

【Nature论文】用于理解图像分类决策和改进神经网络鲁棒性的对抗性解释（Adversarial Explanations for Understanding Image Classiﬁcation Decisions and Improved Neural Network Robustness ）

【Nature论文】用于理解图像分类决策和改进神经网络鲁棒性的对抗性解释（Adversarial Explanations for Understanding Image Classiﬁcation Decisions and Improved Neural Network Robustness ）

专知会员服务

14+阅读 · 2019年11月25日

热门VIP内容

开通专知VIP会员享更多权益服务

博士论文 | 从算法到基础模型：强化学习的统一视角

《异构人类团队的协作决策过程混合建模研究》

论文解读 | 医学图像修复中的扩散模型：挑战、分类与未来方向

面向国防作战的最佳自主与蜂群无人机技术

相关资讯

哈佛大学｜构建知识图谱PrimeKG以实现精准医疗--数据与代码全部公开，帮你从零开始复现知识图谱

哈佛大学｜构建知识图谱PrimeKG以实现精准医疗--数据与代码全部公开，帮你从零开始复现知识图谱

GenomicAI

29+阅读 · 2022年5月4日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

论文浅尝 | 基于事理图谱的脚本事件预测

论文浅尝 | 基于事理图谱的脚本事件预测

开放知识图谱

10+阅读 · 2019年12月10日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

专家报告|深度学习+图像多模态融合

专家报告|深度学习+图像多模态融合

中国图象图形学报

12+阅读 · 2019年10月23日

大讲堂 | 基于医疗知识的疾病诊断预测

大讲堂 | 基于医疗知识的疾病诊断预测

AI科技评论

10+阅读 · 2019年1月22日

推荐｜上交大推出Texygen：文本生成模型的基准测试平台

推荐｜上交大推出Texygen：文本生成模型的基准测试平台

全球人工智能

15+阅读 · 2018年2月8日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

【360人工智能研究院与NUS颜水成团队】HashGAN:基于注意力机制的深度对抗哈希模型提升跨模态检索效果

【360人工智能研究院与NUS颜水成团队】HashGAN:基于注意力机制的深度对抗哈希模型提升跨模态检索效果

专知

16+阅读 · 2017年11月29日

相关论文

DEpiABS: Differentiable Epidemic Agent-Based Simulator

Arxiv

0+阅读 · 2月12日

PatientHub: A Unified Framework for Patient Simulation

Arxiv

0+阅读 · 2月12日

MEmilio -- A high performance Modular EpideMIcs simuLatIOn software for multi-scale and comparative simulations of infectious disease dynamics

Arxiv

0+阅读 · 2月11日

Evaluating Predictive Modeling Strategies for Predicting Individual Treatment Effects in Precision Medicine

Arxiv

0+阅读 · 2月5日

StainNet: Scaling Self-Supervised Foundation Models on Immunohistochemistry and Special Stains for Computational Pathology

Arxiv

0+阅读 · 2月4日

StefaLand: An Efficient Geoscience Foundation Model That Improves Dynamic Land-Surface Predictions

Arxiv

0+阅读 · 2月2日

AnoMod: A Dataset for Anomaly Detection and Root Cause Analysis in Microservice Systems

Arxiv

0+阅读 · 1月30日

Cross-Country Learning for National Infectious Disease Forecasting Using European Data

Arxiv

0+阅读 · 1月28日

CaseMaster: Designing and Evaluating a Probe for Oral Case Presentation Training with LLM Assistance

Arxiv

0+阅读 · 1月27日

Whole Slide Concepts: A Supervised Foundation Model For Pathological Images

Arxiv

0+阅读 · 1月26日

相关基金

基于子模优化的远程预警传感器管理研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于在线社会媒体数据的疾病传播过程中人类行为变化机制与模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于网络的复杂疾病动态表观修饰模块挖掘

国家自然科学基金

0+阅读 · 2015年12月31日

年龄结构传染病模型的动力学研究

国家自然科学基金

1+阅读 · 2015年12月31日

用于癫痫发作预测的脑电特征深度学习研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向帕金森病的多模态在线预警方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于公立医院动态人本化管理的医患冲突预警和干预模式构建

国家自然科学基金

1+阅读 · 2014年12月31日

新型统计模型在精神疾病的基因、脑影像和行为数据整合中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

传染病多维度分级预警研究

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员