Emerging single-cell technologies that integrate CRISPR-based genetic perturbations with single-cell RNA sequencing, such as Perturb-seq, have substantially advanced our understanding of gene regulation and causal influence of genes. While Perturb-seq data provide valuable causal insights into gene-gene interactions, statistical concerns remain regarding unobserved confounders that may bias inference. These latent factors may arise not only from intrinsic molecular features of regulatory elements encoded in Perturb-seq experiments, but also from unobserved genes arising from cost-constrained experimental designs. Although methods for analyzing large-scale Perturb-seq data are rapidly maturing, approaches that explicitly account for such unobserved confounders in learning the causal gene networks are still lacking. Here, we propose a novel method to recover causal gene networks from Perturb-seq experiments with robustness to arbitrarily omitted confounders. Our framework leverages proxy and instrumental variable strategies to exploit the rich information embedded in perturbations, enabling unbiased estimation of the underlying directed acyclic graph (DAG) of gene expressions. Simulation studies and analyses of CRISPR interference experiments of K562 cells demonstrate that our method outperforms baseline approaches that ignore unmeasured confounding, yielding more accurate and biologically relevant recovery of the true gene causal DAGs.


翻译:整合CRISPR基因扰动与单细胞RNA测序的新兴单细胞技术(如Perturb-seq)极大推进了我们对基因调控及基因因果影响的理解。尽管Perturb-seq数据为基因间相互作用提供了宝贵的因果洞察,但关于可能干扰推断的未观测混杂因子的统计问题依然存在。这些潜在因子不仅可能源自Perturb-seq实验中编码调控元件的内在分子特征,也可能来自受成本约束的实验设计中未观测的基因。虽然分析大规模Perturb-seq数据的方法正快速成熟,但在学习因果基因网络时明确考虑此类未观测混杂因子的方法仍属欠缺。本文提出一种新颖方法,能够从Perturb-seq实验中恢复因果基因网络,并对任意遗漏的混杂因子具有鲁棒性。我们的框架利用代理变量与工具变量策略,挖掘扰动中蕴含的丰富信息,从而实现对基因表达基础有向无环图(DAG)的无偏估计。对K562细胞的CRISPR干扰实验进行的模拟研究与分析表明,本方法优于忽略未测量混杂的基线方法,能更准确且更具生物学相关性地恢复真实的基因因果有向无环图。

0
下载
关闭预览

相关内容

【CMU博士论文】迈向可靠且稳健的高维结果因果推断
专知会员服务
17+阅读 · 2025年8月1日
ICML 2024 | 如何在含有隐变量的环境中识别因果关系?
专知会员服务
22+阅读 · 2024年7月18日
因果学习在可信赖推荐系统中的应用综述
专知会员服务
18+阅读 · 2024年2月15日
【苏黎世联邦理工博士论文】因果推断的混杂调整
专知会员服务
43+阅读 · 2022年11月7日
【MIT博士论文】非参数因果推理的算法方法,424页pdf
专知会员服务
84+阅读 · 2022年9月20日
基于深度元学习的因果推断新方法
图与推荐
12+阅读 · 2020年7月21日
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
相关性≠因果:概率图模型和do-calculus
论智
31+阅读 · 2018年10月29日
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
26+阅读 · 2011年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
26+阅读 · 2011年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员