Instrumental variables (IVs) are widely used to estimate causal effects from non-randomized data. A canonical example is a randomized trial with noncompliance, in which the randomized treatment assignment serves as an IV for the non-ignorable treatment received. Under a monotonicity assumption, a valid IV nonparametrically identifies the average treatment effect among a latent complier subgroup, whose generalizability is often under debate. In many studies, there exist multiple versions of an IV, for instance, different nudges to take the same treatment in different study sites in a multicenter clinical trial. These different versions of an IV may result in different compliance rates and offer a unique opportunity to study IV estimates' generalizability. In this article, we introduce a novel nested IV assumption and study identification of the average treatment effect among two latent subgroups: always-compliers and switchers, who are defined based on the joint potential treatment received under two versions of a binary IV. We derive the efficient influence function for the SWitcher Average Treatment Effect (SWATE) under a nonparametric model and propose efficient estimators. We then propose formal statistical tests of the generalizability of IV estimates under the nested IV framework. The proposed tests are flexible nonparametric generalizations of classical overidentification tests that allow estimating nuisance parameters using machine learning tools. We apply the proposed method to the Prostate, Lung, Colorectal and Ovarian (PLCO) Cancer Screening Trial and study the causal effect of colorectal cancer screening and its generalizability.


翻译:工具变量(IV)被广泛用于从非随机化数据中估计因果效应。一个典型例子是存在不依从的随机化试验,其中随机化处理分配可作为不可忽略实际接受处理的工具变量。在单调性假设下,有效工具变量能够非参数地识别潜在依从者子群的平均处理效应,但其可推广性常受争议。在许多研究中,存在工具变量的多个版本,例如在多中心临床试验中,不同研究中心采用不同干预措施以促使接受相同处理。这些不同版本的工具变量可能导致不同的依从率,并为研究工具变量估计的可推广性提供了独特机会。本文引入一种新颖的嵌套工具变量假设,研究基于二元工具变量两个版本下联合潜在接受处理所定义的两个潜在子群——始终依从者与转换者——的平均处理效应识别问题。我们推导了非参数模型下转换者平均处理效应(SWATE)的有效影响函数,并提出了高效估计量。随后,我们在嵌套工具变量框架下提出工具变量估计可推广性的正式统计检验方法。所提出的检验是经典过度识别检验的灵活非参数推广,允许使用机器学习工具估计 nuisance 参数。我们将所提方法应用于前列腺、肺、结直肠和卵巢(PLCO)癌症筛查试验,研究结直肠癌筛查的因果效应及其可推广性。

0
下载
关闭预览

相关内容

【NTU博士论文】机器学习泛化性因果视角,200页pdf
专知会员服务
38+阅读 · 2023年12月25日
【ICML2022】因果Transformer:估算反事实结果的因果, 附ppt
专知会员服务
84+阅读 · 2022年7月20日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
VIP会员
相关VIP内容
【NTU博士论文】机器学习泛化性因果视角,200页pdf
专知会员服务
38+阅读 · 2023年12月25日
【ICML2022】因果Transformer:估算反事实结果的因果, 附ppt
专知会员服务
84+阅读 · 2022年7月20日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员