Development of COVID-19 Booster Vaccine Policy by Microsimulation and Q-learning - 专知论文

会员服务 ·

0

疫苗 · Q学习 · COVID-19 · 试验 · 视频 ·

Development of COVID-19 Booster Vaccine Policy by Microsimulation and Q-learning

翻译：基于微观模拟与Q学习的COVID-19加强针疫苗政策制定

Guoxuan Ma,Sicong Xie,Lili Zhao,Jian Kang

The COVID-19 pandemic highlighted the urgent need for effective vaccine policies, but traditional clinical trials often lack sufficient data to capture the diverse population characteristics necessary for comprehensive public health strategies. Ethical concerns around randomized trials during a pandemic further complicate policy development for public health. Reinforcement Learning (RL) offers a promising alternative for vaccine policy development. However, direct online RL exploration in real-world scenarios can result in suboptimal and potentially harmful decisions. This study proposes a novel framework combining tabular Q-learning with microsimulation, where a Recurrent Neural Network (RNN) serves as a digital twin environment simulator of the target population. This digital twin captures temporal associations between infection and patient characteristics to generate realistic individual disease trajectories, enabling safe and efficient policy learning without real-world interaction. Our tabular Q-learning model produces an interpretable policy table that balances the risks of severe infection against vaccination side effects. Applied to COVID-19 booster policies, the learned Q-learning-based policy outperforms current practices, offering a path toward more effective vaccination strategies. A project webpage introducing our work, including links to the software, a brief introductory video, and a step-by-step tutorial video, is available at https://public.websites.umich.edu/~jiankang/software/dtpl_website_umich/index.html.

翻译：COVID-19疫情凸显了制定有效疫苗政策的迫切需求，但传统临床试验往往缺乏足够的数据来捕捉制定全面公共卫生策略所需的多样化人群特征。疫情期间对随机试验的伦理关切进一步增加了公共卫生政策制定的复杂性。强化学习为疫苗政策制定提供了有前景的替代方案，然而在现实场景中直接进行在线RL探索可能导致次优甚至有害的决策。本研究提出了一种融合表格型Q学习与微观模拟的新框架，其中循环神经网络作为目标人群的数字孪生环境模拟器。该数字孪生模型通过捕捉感染与患者特征之间的时间关联性，生成逼真的个体疾病发展轨迹，从而在无需真实世界交互的情况下实现安全高效的政策学习。我们的表格型Q学习模型可生成具有可解释性的策略表，该策略表在重症感染风险与疫苗接种副作用之间取得平衡。应用于COVID-19加强针政策时，基于Q学习习得的策略优于当前实践，为制定更有效的疫苗接种策略提供了可行路径。介绍本工作的项目网页（含软件链接、简短介绍视频及分步教程视频）可见于：https://public.websites.umich.edu/~jiankang/software/dtpl_website_umich/index.html

0

相关内容

为了预防疾病而使用的产品，多数依靠刺激人自身的免疫起作用。

【NTU博士论文】基于协作式多智能体强化学习的决策制定

【NTU博士论文】基于协作式多智能体强化学习的决策制定

专知会员服务

40+阅读 · 2025年4月21日

【KDD2024教程】图神经网络在流行病建模中的应用综述, 81页ppt

【KDD2024教程】图神经网络在流行病建模中的应用综述, 81页ppt

专知会员服务

21+阅读 · 2024年8月26日

推荐！《医疗保健中强化学习的离策略评估》哈佛大学181页博士论文

推荐！《医疗保健中强化学习的离策略评估》哈佛大学181页博士论文

专知会员服务

27+阅读 · 2022年7月21日

【哈佛大学博士论文】面向人口健康的人工智能: 在网络上融合数据和算法

【哈佛大学博士论文】面向人口健康的人工智能: 在网络上融合数据和算法

专知会员服务

29+阅读 · 2022年5月13日

基于深度学习的新型冠状病毒肺炎诊断研究综述

专知会员服务

28+阅读 · 2021年1月29日

COVID-19文献知识图谱构建，UIUC-哥伦比亚大学

COVID-19文献知识图谱构建，UIUC-哥伦比亚大学

专知会员服务

43+阅读 · 2020年7月2日

计算机视觉用于新冠病毒COVID-19的控制综述，25页pdf

计算机视觉用于新冠病毒COVID-19的控制综述，25页pdf

专知会员服务

53+阅读 · 2020年4月22日

【滑铁卢大学】新冠肺炎网络COVID-Net:一种定制的深卷积神经网络设计，用于从胸片图像中检测COVID-19

【滑铁卢大学】新冠肺炎网络COVID-Net:一种定制的深卷积神经网络设计，用于从胸片图像中检测COVID-19

专知会员服务

35+阅读 · 2020年3月25日

【CoRL2019最佳论文】模仿学习，A Divergence Minimization Perspective on Imitation Learning Methods

【CoRL2019最佳论文】模仿学习，A Divergence Minimization Perspective on Imitation Learning Methods

专知会员服务

24+阅读 · 2019年11月11日

【强化学习研讨会|Microsoft Research】政策改进学习（Learning for policy improvement），卡内基梅隆大学教授| Geoff Gordon

【强化学习研讨会|Microsoft Research】政策改进学习（Learning for policy improvement），卡内基梅隆大学教授| Geoff Gordon

专知会员服务

13+阅读 · 2019年10月3日

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

33+阅读 · 2022年11月12日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

33+阅读 · 2022年10月17日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

专知

14+阅读 · 2022年5月31日

【AI与医学】多模态机器学习精准医疗健康

【AI与医学】多模态机器学习精准医疗健康

专知

17+阅读 · 2022年4月25日

【NeurlPS2019教程】微软首席研究员Katja Hofmann - 强化学习：过去、现在和未来展望，附97页ppt

【NeurlPS2019教程】微软首席研究员Katja Hofmann - 强化学习：过去、现在和未来展望，附97页ppt

专知

12+阅读 · 2019年12月16日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

每日论文 | 用循环世界模型改良策略进化；轻量级CNN：ChannelNets；强化学习知识点总结

每日论文 | 用循环世界模型改良策略进化；轻量级CNN：ChannelNets；强化学习知识点总结

论智

14+阅读 · 2018年9月7日

论强化学习和概率推断的等价性：一种全新概率模型

论强化学习和概率推断的等价性：一种全新概率模型

机器之心

26+阅读 · 2018年5月5日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

基于在线社会媒体数据的疾病传播过程中人类行为变化机制与模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

社会化媒体中突发公共卫生事件网络舆情的传播演化机制及干预策略研究

国家自然科学基金

0+阅读 · 2015年12月31日

流行性腮腺炎S79株疫苗抗原交叉性与腮腺炎病毒基因演变的分子流行病学研究

国家自然科学基金

0+阅读 · 2015年12月31日

肺炎链球菌疫苗SPY1的一种免疫保护机制：TGF-β信号通路介导Treg细胞参与保护性免疫

国家自然科学基金

0+阅读 · 2015年12月31日

年龄和免疫对乙肝传播影响的模型研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

基因表达随机调控的数学模型及动态分析

国家自然科学基金

0+阅读 · 2015年12月31日

智能化数字微流控免疫检测芯片平台构建及其初步应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

流动人口对新兴传染病防控影响的数学建模与研究

国家自然科学基金

0+阅读 · 2014年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

Precision Medicine for the Population-The Hope and Hype of Public Health Genomics

Arxiv

0+阅读 · 6月14日

Large Language Model Chatbot Conversations vs Public Health Materials and Parental HPV Vaccination Intentions: A Randomized Clinical Trial

Arxiv

0+阅读 · 6月9日

An Infectious Disease Spread Simulation Based on Large Language Model Decision Making

Arxiv

0+阅读 · 6月8日

Collaborative estimation and evaluation of SARS-CoV-2 variant nowcasting in the United States

Arxiv

0+阅读 · 6月5日

Evaluating the Impact of COVID-19 Vaccination in the United Kingdom: A Gaussian Process Approach

Arxiv

0+阅读 · 5月30日

Comparison of probabilistic nowcasts and forecasts of SARS-CoV-2 variant proportions made by hierarchical multinomial linear regression models

Arxiv

0+阅读 · 5月21日

Targeted maximum likelihood estimation of vaccine effectiveness and immune correlates in test-negative design studies with missing data

Arxiv

0+阅读 · 5月20日

A simple and powerful test of vaccine waning

Arxiv

0+阅读 · 5月20日

EpiCastBench: Datasets and Benchmarks for Multivariate Epidemic Forecasting

Arxiv

0+阅读 · 5月12日

Dynamic SIR/SEIR-like models comprising a time-dependent transmission rate: Hamiltonian Monte Carlo approach with applications to COVID-19

Arxiv

0+阅读 · 5月6日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

3+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

4+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

9+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

7+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

4+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

6+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

6+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

8+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

4+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

6+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

7+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

5+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

5+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

相关VIP内容

【NTU博士论文】基于协作式多智能体强化学习的决策制定

【NTU博士论文】基于协作式多智能体强化学习的决策制定

专知会员服务

40+阅读 · 2025年4月21日

【KDD2024教程】图神经网络在流行病建模中的应用综述, 81页ppt

【KDD2024教程】图神经网络在流行病建模中的应用综述, 81页ppt

专知会员服务

21+阅读 · 2024年8月26日

推荐！《医疗保健中强化学习的离策略评估》哈佛大学181页博士论文

推荐！《医疗保健中强化学习的离策略评估》哈佛大学181页博士论文

专知会员服务

27+阅读 · 2022年7月21日

【哈佛大学博士论文】面向人口健康的人工智能: 在网络上融合数据和算法

【哈佛大学博士论文】面向人口健康的人工智能: 在网络上融合数据和算法

专知会员服务

29+阅读 · 2022年5月13日

基于深度学习的新型冠状病毒肺炎诊断研究综述

专知会员服务

28+阅读 · 2021年1月29日

COVID-19文献知识图谱构建，UIUC-哥伦比亚大学

COVID-19文献知识图谱构建，UIUC-哥伦比亚大学

专知会员服务

43+阅读 · 2020年7月2日

计算机视觉用于新冠病毒COVID-19的控制综述，25页pdf

计算机视觉用于新冠病毒COVID-19的控制综述，25页pdf

专知会员服务

53+阅读 · 2020年4月22日

【滑铁卢大学】新冠肺炎网络COVID-Net:一种定制的深卷积神经网络设计，用于从胸片图像中检测COVID-19

【滑铁卢大学】新冠肺炎网络COVID-Net:一种定制的深卷积神经网络设计，用于从胸片图像中检测COVID-19

专知会员服务

35+阅读 · 2020年3月25日

【CoRL2019最佳论文】模仿学习，A Divergence Minimization Perspective on Imitation Learning Methods

【CoRL2019最佳论文】模仿学习，A Divergence Minimization Perspective on Imitation Learning Methods

专知会员服务

24+阅读 · 2019年11月11日

【强化学习研讨会|Microsoft Research】政策改进学习（Learning for policy improvement），卡内基梅隆大学教授| Geoff Gordon

【强化学习研讨会|Microsoft Research】政策改进学习（Learning for policy improvement），卡内基梅隆大学教授| Geoff Gordon

专知会员服务

13+阅读 · 2019年10月3日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

33+阅读 · 2022年11月12日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

33+阅读 · 2022年10月17日

基于模型的强化学习综述

基于模型的强化学习综述

专知

42+阅读 · 2022年7月13日

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

专知

14+阅读 · 2022年5月31日

【AI与医学】多模态机器学习精准医疗健康

【AI与医学】多模态机器学习精准医疗健康

专知

17+阅读 · 2022年4月25日

【NeurlPS2019教程】微软首席研究员Katja Hofmann - 强化学习：过去、现在和未来展望，附97页ppt

【NeurlPS2019教程】微软首席研究员Katja Hofmann - 强化学习：过去、现在和未来展望，附97页ppt

专知

12+阅读 · 2019年12月16日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

每日论文 | 用循环世界模型改良策略进化；轻量级CNN：ChannelNets；强化学习知识点总结

每日论文 | 用循环世界模型改良策略进化；轻量级CNN：ChannelNets；强化学习知识点总结

论智

14+阅读 · 2018年9月7日

论强化学习和概率推断的等价性：一种全新概率模型

论强化学习和概率推断的等价性：一种全新概率模型

机器之心

26+阅读 · 2018年5月5日

相关论文

Precision Medicine for the Population-The Hope and Hype of Public Health Genomics

Arxiv

0+阅读 · 6月14日

Large Language Model Chatbot Conversations vs Public Health Materials and Parental HPV Vaccination Intentions: A Randomized Clinical Trial

Arxiv

0+阅读 · 6月9日

An Infectious Disease Spread Simulation Based on Large Language Model Decision Making

Arxiv

0+阅读 · 6月8日

Collaborative estimation and evaluation of SARS-CoV-2 variant nowcasting in the United States

Arxiv

0+阅读 · 6月5日

Evaluating the Impact of COVID-19 Vaccination in the United Kingdom: A Gaussian Process Approach

Arxiv

0+阅读 · 5月30日

Comparison of probabilistic nowcasts and forecasts of SARS-CoV-2 variant proportions made by hierarchical multinomial linear regression models

Arxiv

0+阅读 · 5月21日

Targeted maximum likelihood estimation of vaccine effectiveness and immune correlates in test-negative design studies with missing data

Arxiv

0+阅读 · 5月20日

A simple and powerful test of vaccine waning

Arxiv

0+阅读 · 5月20日

EpiCastBench: Datasets and Benchmarks for Multivariate Epidemic Forecasting

Arxiv

0+阅读 · 5月12日

Dynamic SIR/SEIR-like models comprising a time-dependent transmission rate: Hamiltonian Monte Carlo approach with applications to COVID-19

Arxiv

0+阅读 · 5月6日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

基于在线社会媒体数据的疾病传播过程中人类行为变化机制与模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

社会化媒体中突发公共卫生事件网络舆情的传播演化机制及干预策略研究

国家自然科学基金

0+阅读 · 2015年12月31日

流行性腮腺炎S79株疫苗抗原交叉性与腮腺炎病毒基因演变的分子流行病学研究

国家自然科学基金

0+阅读 · 2015年12月31日

肺炎链球菌疫苗SPY1的一种免疫保护机制：TGF-β信号通路介导Treg细胞参与保护性免疫

国家自然科学基金

0+阅读 · 2015年12月31日

年龄和免疫对乙肝传播影响的模型研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

基因表达随机调控的数学模型及动态分析

国家自然科学基金

0+阅读 · 2015年12月31日

智能化数字微流控免疫检测芯片平台构建及其初步应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

流动人口对新兴传染病防控影响的数学建模与研究

国家自然科学基金

0+阅读 · 2014年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员