In observational studies, causal inference becomes difficult when confounders are missing-not-at-random (MNAR), particularly where the missingness depends on the confounder's own unreported value (self-masking). Existing methods for handling MNAR confounders often rely on strong, unverifiable assumptions, leading to biased estimates. We propose a simple approach with Stratified Delta-Imputed Propensity Estimator (SDIPE) in the presence of self-masking confounders. SDIPE first stratifies data into observed and missing groups, imputes missing confounders via delta-adjusted multiple imputation. Then, within each group, average-treatment-effects (ATEs) are estimated by stabilized-inverse-probability-weights. The final ATE is obtained by combining the subgroup-specific estimates, weighted by respective proportions in the sample. Simulation study shows that SDIPE achieves low bias and near-nominal coverage (94-96%) across varying missingness, sample sizes, and treatment prevalence. In contrast, conventional sensitivity-based multiple imputation exhibits substantial bias and poor coverage (18-89%). Additionally, SDIPE is robust to the choice of the delta parameter. Applied to NHANES-2017-2018, SDIPE estimates that married individuals have a 1.19-point lower depression score than unmarried individuals (95% CI: -1.76, -0.64), adjusting for MNAR income data. SDIPE provides a practical and robust approach for causal inference with self-masking MNAR confounders, offering improved performance over existing methods without requiring restrictive assumptions about the missingness mechanism.


翻译:在观察性研究中,当混杂因素存在非随机缺失(MNAR),尤其是缺失机制依赖于混杂因素自身未报告的值(自掩蔽)时,因果推断变得困难。处理MNAR混杂因素的现有方法通常依赖于强且无法验证的假设,导致估计结果存在偏差。针对存在自掩蔽混杂因素的情况,我们提出了一种采用分层Delta插补倾向性估计器(SDIPE)的简单方法。SDIPE首先将数据分层为观测组和缺失组,通过Delta调整的多重插补法对缺失的混杂因素进行插补。随后,在每个组内,通过稳定化逆概率加权法估计平均处理效应(ATEs)。最终的ATE通过合并各亚组特异性估计值获得,并以样本中各自的比例进行加权。模拟研究表明,在不同的缺失率、样本量和处理流行率下,SDIPE均实现了较低的偏差和接近名义水平的覆盖率(94-96%)。相比之下,传统的基于敏感性的多重插补法则表现出显著的偏差和较差的覆盖率(18-89%)。此外,SDIPE对Delta参数的选择具有鲁棒性。应用于NHANES-2017-2018数据,在调整了MNAR收入数据后,SDIPE估计已婚个体的抑郁评分比未婚个体低1.19分(95% CI: -1.76, -0.64)。SDIPE为处理自掩蔽MNAR混杂因素的因果推断提供了一种实用且稳健的方法,相较于现有方法,它在不要求对缺失机制施加限制性假设的情况下,提供了更优的性能。

0
下载
关闭预览

相关内容

基于因果推断的推荐系统去偏研究
专知会员服务
21+阅读 · 2024年11月10日
复杂处理下的因果推断:综述
专知会员服务
34+阅读 · 2024年7月22日
【CMU博士论文】非参数因果推断,241页pdf
专知会员服务
35+阅读 · 2023年6月20日
【苏黎世联邦理工博士论文】因果推断的混杂调整
专知会员服务
43+阅读 · 2022年11月7日
【MIT博士论文】非参数因果推理的算法方法,424页pdf
专知会员服务
84+阅读 · 2022年9月20日
专知会员服务
94+阅读 · 2021年9月5日
因果推断,Causal Inference:The Mixtape
专知会员服务
110+阅读 · 2021年8月27日
基于深度元学习的因果推断新方法
图与推荐
12+阅读 · 2020年7月21日
论文浅尝 | 时序与因果关系联合推理
开放知识图谱
36+阅读 · 2019年6月23日
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
相关性≠因果:概率图模型和do-calculus
论智
31+阅读 · 2018年10月29日
【学界】融合对抗学习的因果关系抽取
GAN生成式对抗网络
16+阅读 · 2018年7月14日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
26+阅读 · 2011年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
Arxiv
0+阅读 · 3月6日
VIP会员
最新内容
新兴反无人机技术与不对称防御对策
专知会员服务
3+阅读 · 今天15:12
《美空军条令出版物 3-60,目标定位(2026版)》
专知会员服务
4+阅读 · 今天15:06
《无人机在冲突地区提供紧急医疗与外科支持》
专知会员服务
4+阅读 · 今天14:48
《定向能武器交战授权治理管道》
专知会员服务
4+阅读 · 今天14:41
《人工智能与海军作战》最新报告
专知会员服务
4+阅读 · 今天14:00
具身AI安全综述:风险、攻击与防御
专知会员服务
3+阅读 · 今天12:02
DeepSeek 版Claude Code,免费小白安装教程来了!
专知会员服务
13+阅读 · 5月5日
相关VIP内容
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
26+阅读 · 2011年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员