Probabilistic forecasting of infectious diseases is crucial for public health but relies on labor-intensive manual model curation by expert modeling teams. This bespoke development bottlenecks scalability to granular geographic resolutions or emerging pathogens. Here, we present an autonomous system using Large Language Model (LLM)-guided tree search to iteratively generate, evaluate, and optimize executable forecasting software. In a fully prospective, real-time evaluation during the 2025-2026 US respiratory season, the system autonomously discovered methodologically diverse models for influenza, COVID-19, and respiratory syncytial virus (RSV). Aggregating these machine-generated models yielded an ensemble that consistently matched or outperformed the gold-standard, human-curated Centers for Disease Control and Prevention (CDC) hub ensembles out-of-sample. The system successfully navigated data-scarce "cold start" scenarios for RSV. Moreover, controlled retrospective ablations revealed that optimizing log-scale distance metrics prevents reward hacking, while an automated judge-in-the-loop ensures structural fidelity to complex scientific theories. By autonomously translating epidemiological theory into accurate, transparent code, this framework overcomes the modeling labor bottleneck, enabling rapid deployment of expert-level disease forecasting at unprecedented scales.


翻译:传染病概率预测对公共卫生至关重要,但当前依赖专家建模团队劳动密集型的人工模型配置。这种定制化开发限制了向精细地理区域或新兴病原体扩展的可扩展性。本文提出一种自主系统,利用大语言模型引导的树搜索迭代生成、评估并优化可执行的预测软件。在2025-2026年美国呼吸道流行季的完全前瞻性实时评估中,该系统自主发现针对流感、COVID-19及呼吸道合胞病毒的方法学多样化模型。整合这些机器生成模型形成的集成模型,在样本外预测中持续达到或超过黄金标准——即美国疾病控制与预防中心人工配置的枢纽集成模型。该系统成功应对了RSV数据稀疏的“冷启动”场景。此外,受控回顾性消融实验表明,优化对数尺度距离指标可防止奖励黑客行为,而自动化裁判循环机制确保了复杂科学理论的结构保真度。通过将流行病学理论自主转化为准确透明的代码,该框架克服了建模人力瓶颈,以前所未有的规模实现专家级疾病预测的快速部署。

0
下载
关闭预览

相关内容

【KDD2020】动态知识图谱的多事件预测
专知会员服务
128+阅读 · 2020年8月30日
【KDD2020】动态知识图谱的多事件预测
专知
88+阅读 · 2020年8月31日
基于车路协同的群体智能协同
智能交通技术
10+阅读 · 2019年1月23日
大讲堂 | 基于医疗知识的疾病诊断预测
AI科技评论
10+阅读 · 2019年1月22日
深度学习在CTR预估中的应用 | CTR深度模型大盘点
PaperWeekly
15+阅读 · 2018年4月11日
15款免费预测分析软件!收藏好,别丢了!
七月在线实验室
11+阅读 · 2018年2月27日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Arxiv
0+阅读 · 5月26日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
4+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
6+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
3+阅读 · 6月17日
相关VIP内容
【KDD2020】动态知识图谱的多事件预测
专知会员服务
128+阅读 · 2020年8月30日
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员