Cumulative Treatment Effect Testing under Continuous Time Reinforcement Learning - 专知论文

会员服务 ·

0

价值函数 · 值函数 · 离散 · 强化学习 · 无限 ·

Cumulative Treatment Effect Testing under Continuous Time Reinforcement Learning

翻译：连续时间强化学习框架下的累积治疗效果检验

Jiuchen Zhang,Annie Qu

Understanding the impact of treatment effect over time is a fundamental aspect of many scientific and medical studies. In this paper, we introduce a novel approach under a continuous-time reinforcement learning framework for testing a treatment effect. Specifically, our method provides an effective test on carryover effects of treatment over time utilizing the average treatment effect (ATE). The average treatment effect is defined as difference of value functions over an infinite horizon, which accounts for cumulative treatment effects, both immediate and carryover. The proposed method outperforms existing testing procedures such as discrete time reinforcement learning strategies in multi-resolution observation settings where observation times can be irregular. Another advantage of the proposed method is that it can capture treatment effects of a shorter duration and provide greater accuracy compared to discrete-time approximations, through the use of continuous-time estimation for the value function. We establish the asymptotic normality of the proposed test statistics and apply it to OhioT1DM diabetes data to evaluate the cumulative treatment effects of bolus insulin on patients' glucose levels.

翻译：理解治疗效果随时间的影响是众多科学与医学研究的基本课题。本文在连续时间强化学习框架下，提出了一种检验治疗效果的新方法。具体而言，本方法利用平均处理效应（ATE）对治疗随时间产生的遗留效应进行有效检验。平均处理效应定义为无限时间跨度上价值函数的差值，该定义同时考虑了即时治疗效果与遗留效应构成的累积治疗效果。在观测时间可能不规律的多分辨率观测场景中，所提方法的表现优于离散时间强化学习策略等现有检验流程。本方法的另一优势在于，通过对价值函数进行连续时间估计，能够捕捉持续时间更短的治疗效果，且相比离散时间近似方法具有更高的精度。我们建立了所提检验统计量的渐近正态性，并将其应用于OhioT1DM糖尿病数据集，以评估推注胰岛素对患者血糖水平的累积治疗效果。

0

相关内容

价值函数

因果强化学习的统一框架：综述、分类体系、算法与应用

因果强化学习的统一框架：综述、分类体系、算法与应用

专知会员服务

37+阅读 · 2025年12月24日

清华等最新《因果强化学习》综述，29页pdf详述因果强化学习方法与评价

清华等最新《因果强化学习》综述，29页pdf详述因果强化学习方法与评价

专知会员服务

103+阅读 · 2023年2月13日

核因果模型:治疗效果、反事实、中介和代理，57页ppt

核因果模型:治疗效果、反事实、中介和代理，57页ppt

专知会员服务

30+阅读 · 2022年8月30日

推荐！《医疗保健中强化学习的离策略评估》哈佛大学181页博士论文

推荐！《医疗保健中强化学习的离策略评估》哈佛大学181页博士论文

专知会员服务

27+阅读 · 2022年7月21日

因果机器学习模型-核方法:治疗效果、反事实、中介和代理，附72页ppt与视频

因果机器学习模型-核方法:治疗效果、反事实、中介和代理，附72页ppt与视频

专知会员服务

47+阅读 · 2022年7月17日

【ICML2022】用神经控制微分方程建立反事实结果的连续时间模型

【ICML2022】用神经控制微分方程建立反事实结果的连续时间模型

专知会员服务

35+阅读 · 2022年6月24日

带核的因果模型:治疗效果，反事实，调解，和代理，57页ppt

带核的因果模型:治疗效果，反事实，调解，和代理，57页ppt

专知会员服务

31+阅读 · 2022年2月21日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

133+阅读 · 2020年5月14日

因果关联学习，Causal Relational Learning

因果关联学习，Causal Relational Learning

专知会员服务

185+阅读 · 2020年4月21日

【Google AI新论文EfficientDet】规模化高效化的物体检测，EfficientDet: Scalable and Efficient Object Detection(附pdf)

【Google AI新论文EfficientDet】规模化高效化的物体检测，EfficientDet: Scalable and Efficient Object Detection(附pdf)

专知会员服务

27+阅读 · 2019年11月24日

《因果性与机器学习综述》2022最新40页报告，美国陆军研究实验室

《因果性与机器学习综述》2022最新40页报告，美国陆军研究实验室

专知

12+阅读 · 2022年11月25日

基于深度元学习的因果推断新方法

基于深度元学习的因果推断新方法

图与推荐

12+阅读 · 2020年7月21日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

专知

12+阅读 · 2018年5月18日

【论文推荐】最新七篇强化学习相关论文—逻辑约束、综述、多任务深度强化学习、参数服务器、事件抽取、分层强化学习、过拟合研究

【论文推荐】最新七篇强化学习相关论文—逻辑约束、综述、多任务深度强化学习、参数服务器、事件抽取、分层强化学习、过拟合研究

专知

25+阅读 · 2018年4月29日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

40+阅读 · 2015年12月31日

实时跟踪放射治疗中标记点可见性的优化策略及算法开发

国家自然科学基金

1+阅读 · 2015年12月31日

处理效应差异中位数的有效估计

国家自然科学基金

0+阅读 · 2015年12月31日

基于项目反应理论和混合值差度量的中医个体化诊疗疗效评价方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

心理与教育测量中项目反应时间数据的统计建模及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于体内过程分析的中西药注射剂联合序贯用药“时间窗”的探索性研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多模态影像学研究Aβ沉积对AD神经功能网络连接的影响机制

国家自然科学基金

0+阅读 · 2014年12月31日

基于时间反演的结构界面损伤监测理论及试验研究

国家自然科学基金

0+阅读 · 2014年12月31日

Conditional Distributional Treatment Effects: Doubly Robust Estimation and Testing

Conditional Distributional Treatment Effects: Doubly Robust Estimation and Testing

Arxiv

0+阅读 · 3月17日

Quantifying Aleatoric Uncertainty of the Treatment Effect: A Novel Orthogonal Learner

Arxiv

0+阅读 · 3月12日

Overlap-Adaptive Regularization for Conditional Average Treatment Effect Estimation

Arxiv

0+阅读 · 3月11日

Robust evaluation of treatment effects in longitudinal studies with truncation by death or other intercurrent events

Arxiv

0+阅读 · 3月11日

TEA-Time: Transporting Effects Across Time

Arxiv

0+阅读 · 3月7日

Testing Full Mediation of Treatment Effects and the Identifiability of Causal Mechanisms

Arxiv

0+阅读 · 3月4日

Identification and estimation of the conditional average treatment effect with nonignorable missing covariates, treatment, and outcome

Arxiv

0+阅读 · 2月22日

Dynamic covariate balancing: estimating treatment effects over time with potential local projections

Arxiv

0+阅读 · 2月22日

A Causal Machine Learning Framework for Treatment Personalization in Clinical Trials: Application to Ulcerative Colitis

Arxiv

0+阅读 · 2月9日

Bridging Binarization: Causal Inference with Dichotomized Continuous Exposures

Arxiv

0+阅读 · 2月4日

VIP会员

文章信息

相关主题

最新内容

博士论文 | 面向大模型推理的内存高效算法

博士论文 | 面向大模型推理的内存高效算法

专知会员服务

2+阅读 · 7月27日

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

专知会员服务

3+阅读 · 7月27日

《无人系统互操作性导论——无人系统联合架构（JAUS）》

《无人系统互操作性导论——无人系统联合架构（JAUS）》

专知会员服务

9+阅读 · 7月27日

美空军新型反无人机部队初探

美空军新型反无人机部队初探

专知会员服务

5+阅读 · 7月27日

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

专知会员服务

3+阅读 · 7月27日

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

专知会员服务

3+阅读 · 7月27日

《防空交战流程的概率建模研究》

《防空交战流程的概率建模研究》

专知会员服务

7+阅读 · 7月27日

ICML 2026 教程 | 数值优化理论还重要吗？

ICML 2026 教程 | 数值优化理论还重要吗？

专知会员服务

6+阅读 · 7月26日

ICM 2026 | 陶哲轩：人工智能时代的数学

ICM 2026 | 陶哲轩：人工智能时代的数学

专知会员服务

9+阅读 · 7月26日

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

专知会员服务

8+阅读 · 7月26日

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

专知会员服务

11+阅读 · 7月26日

《先进防空系统选型战略框架：基于巴基斯坦的实证启示》

《先进防空系统选型战略框架：基于巴基斯坦的实证启示》

专知会员服务

8+阅读 · 7月26日

《反无人机交战场景下的战斗归零研究》

《反无人机交战场景下的战斗归零研究》

专知会员服务

7+阅读 · 7月26日

霍尔木兹与不对称作战时代：水雷、无人系统与海军力量的重新定义

霍尔木兹与不对称作战时代：水雷、无人系统与海军力量的重新定义

专知会员服务

4+阅读 · 7月26日

博士论文 | 用代码结构感知方法推进代码大模型

博士论文 | 用代码结构感知方法推进代码大模型

专知会员服务

6+阅读 · 7月25日

相关VIP内容

因果强化学习的统一框架：综述、分类体系、算法与应用

因果强化学习的统一框架：综述、分类体系、算法与应用

专知会员服务

37+阅读 · 2025年12月24日

清华等最新《因果强化学习》综述，29页pdf详述因果强化学习方法与评价

清华等最新《因果强化学习》综述，29页pdf详述因果强化学习方法与评价

专知会员服务

103+阅读 · 2023年2月13日

核因果模型:治疗效果、反事实、中介和代理，57页ppt

核因果模型:治疗效果、反事实、中介和代理，57页ppt

专知会员服务

30+阅读 · 2022年8月30日

推荐！《医疗保健中强化学习的离策略评估》哈佛大学181页博士论文

推荐！《医疗保健中强化学习的离策略评估》哈佛大学181页博士论文

专知会员服务

27+阅读 · 2022年7月21日

因果机器学习模型-核方法:治疗效果、反事实、中介和代理，附72页ppt与视频

因果机器学习模型-核方法:治疗效果、反事实、中介和代理，附72页ppt与视频

专知会员服务

47+阅读 · 2022年7月17日

【ICML2022】用神经控制微分方程建立反事实结果的连续时间模型

【ICML2022】用神经控制微分方程建立反事实结果的连续时间模型

专知会员服务

35+阅读 · 2022年6月24日

带核的因果模型:治疗效果，反事实，调解，和代理，57页ppt

带核的因果模型:治疗效果，反事实，调解，和代理，57页ppt

专知会员服务

31+阅读 · 2022年2月21日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

133+阅读 · 2020年5月14日

因果关联学习，Causal Relational Learning

因果关联学习，Causal Relational Learning

专知会员服务

185+阅读 · 2020年4月21日

【Google AI新论文EfficientDet】规模化高效化的物体检测，EfficientDet: Scalable and Efficient Object Detection(附pdf)

【Google AI新论文EfficientDet】规模化高效化的物体检测，EfficientDet: Scalable and Efficient Object Detection(附pdf)

专知会员服务

27+阅读 · 2019年11月24日

热门VIP内容

开通专知VIP会员享更多权益服务

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

美空军新型反无人机部队初探

博士论文 | 面向大模型推理的内存高效算法

《无人系统互操作性导论——无人系统联合架构（JAUS）》

相关资讯

《因果性与机器学习综述》2022最新40页报告，美国陆军研究实验室

《因果性与机器学习综述》2022最新40页报告，美国陆军研究实验室

专知

12+阅读 · 2022年11月25日

基于深度元学习的因果推断新方法

基于深度元学习的因果推断新方法

图与推荐

12+阅读 · 2020年7月21日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

【论文推荐】最新十篇度量学习相关论文—可量化表示、非线性度量学习、在线深度量学习、大间隔最近邻、判别深度度量、域自适应

专知

12+阅读 · 2018年5月18日

【论文推荐】最新七篇强化学习相关论文—逻辑约束、综述、多任务深度强化学习、参数服务器、事件抽取、分层强化学习、过拟合研究

【论文推荐】最新七篇强化学习相关论文—逻辑约束、综述、多任务深度强化学习、参数服务器、事件抽取、分层强化学习、过拟合研究

专知

25+阅读 · 2018年4月29日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

相关论文

Conditional Distributional Treatment Effects: Doubly Robust Estimation and Testing

Conditional Distributional Treatment Effects: Doubly Robust Estimation and Testing

Arxiv

0+阅读 · 3月17日

Quantifying Aleatoric Uncertainty of the Treatment Effect: A Novel Orthogonal Learner

Arxiv

0+阅读 · 3月12日

Overlap-Adaptive Regularization for Conditional Average Treatment Effect Estimation

Arxiv

0+阅读 · 3月11日

Robust evaluation of treatment effects in longitudinal studies with truncation by death or other intercurrent events

Arxiv

0+阅读 · 3月11日

TEA-Time: Transporting Effects Across Time

Arxiv

0+阅读 · 3月7日

Testing Full Mediation of Treatment Effects and the Identifiability of Causal Mechanisms

Arxiv

0+阅读 · 3月4日

Identification and estimation of the conditional average treatment effect with nonignorable missing covariates, treatment, and outcome

Arxiv

0+阅读 · 2月22日

Dynamic covariate balancing: estimating treatment effects over time with potential local projections

Arxiv

0+阅读 · 2月22日

A Causal Machine Learning Framework for Treatment Personalization in Clinical Trials: Application to Ulcerative Colitis

Arxiv

0+阅读 · 2月9日

Bridging Binarization: Causal Inference with Dichotomized Continuous Exposures

Arxiv

0+阅读 · 2月4日

相关基金

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

基于复杂图知识表示的终身强化学习研究

国家自然科学基金

40+阅读 · 2015年12月31日

实时跟踪放射治疗中标记点可见性的优化策略及算法开发

国家自然科学基金

1+阅读 · 2015年12月31日

处理效应差异中位数的有效估计

国家自然科学基金

0+阅读 · 2015年12月31日

基于项目反应理论和混合值差度量的中医个体化诊疗疗效评价方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

心理与教育测量中项目反应时间数据的统计建模及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于体内过程分析的中西药注射剂联合序贯用药“时间窗”的探索性研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多模态影像学研究Aβ沉积对AD神经功能网络连接的影响机制

国家自然科学基金

0+阅读 · 2014年12月31日

基于时间反演的结构界面损伤监测理论及试验研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员