Variance reduction for causal inference in the presence of network interference is often achieved through either outcome modeling, typically analyzed under unit-randomized Bernoulli designs, or clustered experimental designs, typically analyzed without strong parametric assumptions. In this work, we study the intersection of these two approaches and make the following threefold contributions. First, we present an estimator of the total treatment effect (or global average treatment effect) in low-order outcome models when the data are collected under general experimental designs, generalizing previous results for Bernoulli designs. We refer to this estimator as the pseudoinverse estimator and give bounds on its bias and variance in terms of properties of the experimental design. Second, we evaluate these bounds for the case of Bernoulli graph cluster randomized (GCR) designs. Its variance scales like the smaller of the variance obtained by the estimator derived under a low-order assumption, and the variance obtained from cluster randomization, showing that combining these variance reduction strategies is preferable to using either individually. When the order of the potential outcomes model is correctly specified, our estimator is always unbiased, and under a misspecified model, we upper bound the bias by the closeness of the ground truth model to a low-order model. Third, we give empirical evidence that our variance bounds can be used to select a good clustering that minimizes the worst-case variance under a cluster randomized design from a set of candidate clusterings. Across a range of graphs and clustering algorithms, our method consistently selects clusterings that perform well on a range of response models, suggesting the practical use of our bounds.


翻译:在网络干扰存在的情况下,因果推断的方差缩减通常通过两种方式实现:要么通过结果建模(通常在单元随机化的伯努利设计下进行分析),要么通过聚类实验设计(通常在没有强参数假设的情况下进行分析)。本研究探讨了这两种方法的交叉点,并作出以下三方面贡献。首先,我们提出了一种在低阶结果模型中估计总处理效应(或全局平均处理效应)的方法,该方法适用于一般实验设计下收集的数据,推广了先前针对伯努利设计的结果。我们将此估计量称为伪逆估计量,并根据实验设计的特性给出了其偏差和方差的界限。其次,我们针对伯努利图聚类随机化设计评估了这些界限。其方差缩放类似于在低阶假设下推导的估计量所获得的方差与通过聚类随机化获得的方差中的较小者,这表明结合这些方差缩减策略优于单独使用任何一种。当潜在结果模型的阶数被正确设定时,我们的估计量始终是无偏的;而在模型设定错误的情况下,我们通过真实模型与低阶模型的接近程度来上界偏差。第三,我们提供了实证证据,表明我们的方差界限可用于从一组候选聚类中选择一种良好的聚类,以最小化聚类随机化设计下的最坏情况方差。在多种图结构和聚类算法中,我们的方法始终能选择在一系列响应模型上表现良好的聚类,这证明了我们提出的界限具有实际应用价值。

0
下载
关闭预览

相关内容

设计是对现有状的一种重新认识和打破重组的过程,设计让一切变得更美。
基于因果推断的推荐系统去偏研究
专知会员服务
21+阅读 · 2024年11月10日
【MIT博士论文】非参数因果推理的算法方法,424页pdf
专知会员服务
84+阅读 · 2022年9月20日
异质信息网络分析与应用综述,软件学报-北京邮电大学
因果关联学习,Causal Relational Learning
专知会员服务
185+阅读 · 2020年4月21日
「因果推理」概述论文,13页pdf
专知
16+阅读 · 2021年3月20日
【AAAI2021】对比聚类,Contrastive Clustering
专知
26+阅读 · 2021年1月30日
基于深度元学习的因果推断新方法
图与推荐
12+阅读 · 2020年7月21日
基于图神经网络的聚类研究与应用
THU数据派
10+阅读 · 2020年5月29日
因果推理学习算法资源大列表
专知
27+阅读 · 2019年3月3日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
26+阅读 · 2011年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
26+阅读 · 2011年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员