Mediation analysis is widely used to disentangle causal pathways, yet in many real-world studies the mediator M and outcome Y are never jointly observed. This incompleteness breaks the standard identification strategy for natural direct and indirect effects. We introduce a novel data fusion framework that restores the identification by combining two incomplete data sources, one measuring $M$ and the other measuring Y. Our approach leverages shared instrumental variables (IVs) to circumvent the need to observe (M,Y) jointly, remains valid under unmeasured confounding via a no-interaction condition, and accommodates covariate and exposure shifts across data sources under a latent alignment condition. We establish two identification strategies, one for settings with a known set of valid IVs, and another for settings where valid IVs must be learned. We further develop semiparametric, influence-function-based estimators with multiple robustness properties, and propose an estimator that attains the semiparametric efficiency bound under appropriate conditions. We apply our framework to quantify the extent to which the effect of SNP rs610932 on dementia risk is mediated through immune-related gene-expression pathways.


翻译:摘要:中介分析广泛用于解析因果路径,然而在众多真实世界研究中,中介变量M与结局变量Y从未被联合观测。这一数据不完整性破坏了自然直接效应与间接效应的标准识别策略。我们提出了一种新颖的数据融合框架,通过整合两个不完整的数据源(一个测量M,另一个测量Y)来恢复识别能力。该方法利用共享的工具变量(IVs)规避联合观测(M,Y)的需求,在无交互作用条件下仍对未测量混杂因素保持有效性,并通过潜在对齐条件适应跨数据源的协变量与暴露偏移。我们建立了两种识别策略:其一适用于已知有效工具变量集的情形,其二适用于需要学习有效工具变量的情形。进一步开发了具有多重稳健性的基于影响函数的半参数估计量,并提出在适当条件下可达到半参数效率界的最优估计量。我们将该框架应用于量化SNP rs610932对痴呆风险的影响中由免疫相关基因表达通路介导的比例。

0
下载
关闭预览

相关内容

基于因果推断的推荐系统去偏研究
专知会员服务
21+阅读 · 2024年11月10日
复杂处理下的因果推断:综述
专知会员服务
34+阅读 · 2024年7月22日
【CMU博士论文】分布偏移下的不确定性量化,226页pdf
专知会员服务
31+阅读 · 2023年9月30日
【CMU博士论文】非参数因果推断,241页pdf
专知会员服务
35+阅读 · 2023年6月20日
【苏黎世联邦理工博士论文】因果推断的混杂调整
专知会员服务
43+阅读 · 2022年11月7日
【ICML2022】因果Transformer:估算反事实结果的因果, 附ppt
专知会员服务
84+阅读 · 2022年7月20日
「因果推理」概述论文,13页pdf
专知
16+阅读 · 2021年3月20日
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
综述 | 异质信息网络分析与应用综述
专知
27+阅读 · 2020年8月8日
基于深度元学习的因果推断新方法
图与推荐
12+阅读 · 2020年7月21日
【学界】融合对抗学习的因果关系抽取
GAN生成式对抗网络
16+阅读 · 2018年7月14日
论文浅尝 | 变分知识图谱推理:在KG中引入变分推理框架
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
1+阅读 · 57分钟前
定向能反无人机系统最新发展动态
专知会员服务
3+阅读 · 今天13:50
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
2+阅读 · 今天13:33
相关资讯
「因果推理」概述论文,13页pdf
专知
16+阅读 · 2021年3月20日
异常检测(Anomaly Detection)综述
极市平台
20+阅读 · 2020年10月24日
综述 | 异质信息网络分析与应用综述
专知
27+阅读 · 2020年8月8日
基于深度元学习的因果推断新方法
图与推荐
12+阅读 · 2020年7月21日
【学界】融合对抗学习的因果关系抽取
GAN生成式对抗网络
16+阅读 · 2018年7月14日
论文浅尝 | 变分知识图谱推理:在KG中引入变分推理框架
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员