Confounder-robust causal discovery and inference in Perturb-seq using proxy and instrumental variables - 专知论文

会员服务 ·

0

因子 · 工具 · 鲁棒 · 推断 · 代理变量 ·

Confounder-robust causal discovery and inference in Perturb-seq using proxy and instrumental variables

翻译：基于代理变量与工具变量的混杂因子鲁棒因果发现与推断方法在Perturb-seq中的应用

Kwangmoon Park,Hongzhe Li

Emerging single-cell technologies that integrate CRISPR-based genetic perturbations with single-cell RNA sequencing, such as Perturb-seq, have substantially advanced our understanding of gene regulation and causal influence of genes. While Perturb-seq data provide valuable causal insights into gene-gene interactions, statistical concerns remain regarding unobserved confounders that may bias inference. These latent factors may arise not only from intrinsic molecular features of regulatory elements encoded in Perturb-seq experiments, but also from unobserved genes arising from cost-constrained experimental designs. Although methods for analyzing large-scale Perturb-seq data are rapidly maturing, approaches that explicitly account for such unobserved confounders in learning the causal gene networks are still lacking. Here, we propose a novel method to recover causal gene networks from Perturb-seq experiments with robustness to arbitrarily omitted confounders. Our framework leverages proxy and instrumental variable strategies to exploit the rich information embedded in perturbations, enabling unbiased estimation of the underlying directed acyclic graph (DAG) of gene expressions. Simulation studies and analyses of CRISPR interference experiments of K562 cells demonstrate that our method outperforms baseline approaches that ignore unmeasured confounding, yielding more accurate and biologically relevant recovery of the true gene causal DAGs.

翻译：整合CRISPR基因扰动与单细胞RNA测序的新兴单细胞技术（如Perturb-seq）极大推进了我们对基因调控及基因因果影响的理解。尽管Perturb-seq数据为基因间相互作用提供了宝贵的因果洞察，但关于可能干扰推断的未观测混杂因子的统计问题依然存在。这些潜在因子不仅可能源自Perturb-seq实验中编码调控元件的内在分子特征，也可能来自受成本约束的实验设计中未观测的基因。虽然分析大规模Perturb-seq数据的方法正快速成熟，但在学习因果基因网络时明确考虑此类未观测混杂因子的方法仍属欠缺。本文提出一种新颖方法，能够从Perturb-seq实验中恢复因果基因网络，并对任意遗漏的混杂因子具有鲁棒性。我们的框架利用代理变量与工具变量策略，挖掘扰动中蕴含的丰富信息，从而实现对基因表达基础有向无环图（DAG）的无偏估计。对K562细胞的CRISPR干扰实验进行的模拟研究与分析表明，本方法优于忽略未测量混杂的基线方法，能更准确且更具生物学相关性地恢复真实的基因因果有向无环图。

0

相关内容

【CMU博士论文】迈向可靠且稳健的高维结果因果推断

【CMU博士论文】迈向可靠且稳健的高维结果因果推断

专知会员服务

17+阅读 · 2025年8月1日

【CMU博士论文】迈向具有高维结果的可靠且稳健的因果推断

【CMU博士论文】迈向具有高维结果的可靠且稳健的因果推断

专知会员服务

22+阅读 · 2025年7月13日

ICML 2024 | 如何在含有隐变量的环境中识别因果关系？

ICML 2024 | 如何在含有隐变量的环境中识别因果关系？

专知会员服务

22+阅读 · 2024年7月18日

【剑桥大学博士论文】使用机器学习的因果推断中的两个问题的半参数方法

【剑桥大学博士论文】使用机器学习的因果推断中的两个问题的半参数方法

专知会员服务

26+阅读 · 2024年5月25日

因果学习在可信赖推荐系统中的应用综述

因果学习在可信赖推荐系统中的应用综述

专知会员服务

18+阅读 · 2024年2月15日

推荐如何用因果推理？Rutgers大学最新《推荐中的因果推理: 基础、方法与应用》综述，全面阐述推荐因果推理方法体系

推荐如何用因果推理？Rutgers大学最新《推荐中的因果推理: 基础、方法与应用》综述，全面阐述推荐因果推理方法体系

专知会员服务

53+阅读 · 2023年1月13日

【苏黎世联邦理工博士论文】因果推断的混杂调整

【苏黎世联邦理工博士论文】因果推断的混杂调整

专知会员服务

43+阅读 · 2022年11月7日

【MIT博士论文】非参数因果推理的算法方法，424页pdf

【MIT博士论文】非参数因果推理的算法方法，424页pdf

专知会员服务

84+阅读 · 2022年9月20日

【MIT博士论文】通过最优传输不匹配措施的鲁棒贝叶斯推断:应用和算法

【MIT博士论文】通过最优传输不匹配措施的鲁棒贝叶斯推断:应用和算法

专知会员服务

24+阅读 · 2022年7月14日

最新「因果推断Causal Inference」综述论文38页pdf，Buffalo、Georgia、阿里巴巴、Virginia

专知会员服务

183+阅读 · 2020年2月11日

《因果性与机器学习综述》2022最新40页报告，美国陆军研究实验室

《因果性与机器学习综述》2022最新40页报告，美国陆军研究实验室

专知

12+阅读 · 2022年11月25日

基于深度元学习的因果推断新方法

基于深度元学习的因果推断新方法

图与推荐

12+阅读 · 2020年7月21日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

KAUST高欣组研发基于深度学习的研究RNA和RBP相互作用的全新方法｜Nat. Commun.

KAUST高欣组研发基于深度学习的研究RNA和RBP相互作用的全新方法｜Nat. Commun.

科研圈

17+阅读 · 2019年10月30日

用深度学习揭示数据的因果关系

用深度学习揭示数据的因果关系

专知

28+阅读 · 2019年5月18日

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

专知

42+阅读 · 2019年4月9日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

北京大学何洋波博士《因果推断和因果图模型》机器学习报告

北京大学何洋波博士《因果推断和因果图模型》机器学习报告

专知

103+阅读 · 2018年11月11日

相关性≠因果：概率图模型和do-calculus

相关性≠因果：概率图模型和do-calculus

论智

31+阅读 · 2018年10月29日

Facebook AI发布新版本FairSeq序列到序列(Seq2Seq)学习工具，可生成故事与快速推断

Facebook AI发布新版本FairSeq序列到序列(Seq2Seq)学习工具，可生成故事与快速推断

专知

23+阅读 · 2018年6月17日

基于共性视觉特征与反馈机制的SAR图像目标检测方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于非参数贝叶斯推断的RNA甲基化谱分解及关键致病酶基因的预测

国家自然科学基金

0+阅读 · 2015年12月31日

复杂疾病的全基因组SNP互作网络构建与分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于低秩表示的鲁棒特征抽取和分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于异构网络的致病基因及其复合物预测方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

通信网络在不确定业务流量需求下的路由鲁棒性优化研究

国家自然科学基金

1+阅读 · 2015年12月31日

来源于放线多孢菌的CRISPR/Cas系统的分析及功能鉴定

国家自然科学基金

0+阅读 · 2015年12月31日

含有隐变量的因果结构学习与统计因果推断

国家自然科学基金

21+阅读 · 2013年12月31日

因果推断的统计方法

国家自然科学基金

26+阅读 · 2011年12月31日

因果推断及不完全数据的统计分析

国家自然科学基金

23+阅读 · 2008年12月31日

Retrieval-Augmented Generation for Predicting Cellular Responses to Gene Perturbation

Arxiv

0+阅读 · 3月7日

Federated Causal Discovery Across Heterogeneous Datasets under Latent Confounding

Arxiv

0+阅读 · 3月5日

Identifiability of Treatment Effects with Unobserved Spatially Varying Confounders

Arxiv

0+阅读 · 2月26日

Bounds and Identification of Joint Probabilities of Potential Outcomes and Observed Variables under Monotonicity Assumptions

Arxiv

0+阅读 · 2月21日

Graph Machine Learning based Doubly Robust Estimator for Network Causal Effects

Arxiv

0+阅读 · 2月19日

Robust Causal Discovery in Real-World Time Series with Power-Laws

Arxiv

0+阅读 · 2月17日

Quadruply robust methods for causal mediation analysis

Arxiv

0+阅读 · 2月13日

CausalCompass: Evaluating the Robustness of Time-Series Causal Discovery in Misspecified Scenarios

Arxiv

0+阅读 · 2月8日

Progressive Multi-Agent Reasoning for Biological Perturbation Prediction

Arxiv

0+阅读 · 2月7日

Quadratic robust methods for causal mediation analysis

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

1+阅读 · 今天14:45

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

1+阅读 · 今天14:43

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

3+阅读 · 今天14:31

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 今天14:20

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

2+阅读 · 今天14:11

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

3+阅读 · 今天14:07

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 今天14:03

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 今天13:59

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

【CMU博士论文】迈向可靠且稳健的高维结果因果推断

【CMU博士论文】迈向可靠且稳健的高维结果因果推断

专知会员服务

17+阅读 · 2025年8月1日

【CMU博士论文】迈向具有高维结果的可靠且稳健的因果推断

【CMU博士论文】迈向具有高维结果的可靠且稳健的因果推断

专知会员服务

22+阅读 · 2025年7月13日

ICML 2024 | 如何在含有隐变量的环境中识别因果关系？

ICML 2024 | 如何在含有隐变量的环境中识别因果关系？

专知会员服务

22+阅读 · 2024年7月18日

【剑桥大学博士论文】使用机器学习的因果推断中的两个问题的半参数方法

【剑桥大学博士论文】使用机器学习的因果推断中的两个问题的半参数方法

专知会员服务

26+阅读 · 2024年5月25日

因果学习在可信赖推荐系统中的应用综述

因果学习在可信赖推荐系统中的应用综述

专知会员服务

18+阅读 · 2024年2月15日

推荐如何用因果推理？Rutgers大学最新《推荐中的因果推理: 基础、方法与应用》综述，全面阐述推荐因果推理方法体系

推荐如何用因果推理？Rutgers大学最新《推荐中的因果推理: 基础、方法与应用》综述，全面阐述推荐因果推理方法体系

专知会员服务

53+阅读 · 2023年1月13日

【苏黎世联邦理工博士论文】因果推断的混杂调整

【苏黎世联邦理工博士论文】因果推断的混杂调整

专知会员服务

43+阅读 · 2022年11月7日

【MIT博士论文】非参数因果推理的算法方法，424页pdf

【MIT博士论文】非参数因果推理的算法方法，424页pdf

专知会员服务

84+阅读 · 2022年9月20日

【MIT博士论文】通过最优传输不匹配措施的鲁棒贝叶斯推断:应用和算法

【MIT博士论文】通过最优传输不匹配措施的鲁棒贝叶斯推断:应用和算法

专知会员服务

24+阅读 · 2022年7月14日

最新「因果推断Causal Inference」综述论文38页pdf，Buffalo、Georgia、阿里巴巴、Virginia

专知会员服务

183+阅读 · 2020年2月11日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

《因果性与机器学习综述》2022最新40页报告，美国陆军研究实验室

《因果性与机器学习综述》2022最新40页报告，美国陆军研究实验室

专知

12+阅读 · 2022年11月25日

基于深度元学习的因果推断新方法

基于深度元学习的因果推断新方法

图与推荐

12+阅读 · 2020年7月21日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

KAUST高欣组研发基于深度学习的研究RNA和RBP相互作用的全新方法｜Nat. Commun.

KAUST高欣组研发基于深度学习的研究RNA和RBP相互作用的全新方法｜Nat. Commun.

科研圈

17+阅读 · 2019年10月30日

用深度学习揭示数据的因果关系

用深度学习揭示数据的因果关系

专知

28+阅读 · 2019年5月18日

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

专知

42+阅读 · 2019年4月9日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

北京大学何洋波博士《因果推断和因果图模型》机器学习报告

北京大学何洋波博士《因果推断和因果图模型》机器学习报告

专知

103+阅读 · 2018年11月11日

相关性≠因果：概率图模型和do-calculus

相关性≠因果：概率图模型和do-calculus

论智

31+阅读 · 2018年10月29日

Facebook AI发布新版本FairSeq序列到序列(Seq2Seq)学习工具，可生成故事与快速推断

Facebook AI发布新版本FairSeq序列到序列(Seq2Seq)学习工具，可生成故事与快速推断

专知

23+阅读 · 2018年6月17日

相关论文

Retrieval-Augmented Generation for Predicting Cellular Responses to Gene Perturbation

Arxiv

0+阅读 · 3月7日

Federated Causal Discovery Across Heterogeneous Datasets under Latent Confounding

Arxiv

0+阅读 · 3月5日

Identifiability of Treatment Effects with Unobserved Spatially Varying Confounders

Arxiv

0+阅读 · 2月26日

Bounds and Identification of Joint Probabilities of Potential Outcomes and Observed Variables under Monotonicity Assumptions

Arxiv

0+阅读 · 2月21日

Graph Machine Learning based Doubly Robust Estimator for Network Causal Effects

Arxiv

0+阅读 · 2月19日

Robust Causal Discovery in Real-World Time Series with Power-Laws

Arxiv

0+阅读 · 2月17日

Quadruply robust methods for causal mediation analysis

Arxiv

0+阅读 · 2月13日

CausalCompass: Evaluating the Robustness of Time-Series Causal Discovery in Misspecified Scenarios

Arxiv

0+阅读 · 2月8日

Progressive Multi-Agent Reasoning for Biological Perturbation Prediction

Arxiv

0+阅读 · 2月7日

Quadratic robust methods for causal mediation analysis

Arxiv

0+阅读 · 1月30日

相关基金

基于共性视觉特征与反馈机制的SAR图像目标检测方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于非参数贝叶斯推断的RNA甲基化谱分解及关键致病酶基因的预测

国家自然科学基金

0+阅读 · 2015年12月31日

复杂疾病的全基因组SNP互作网络构建与分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于低秩表示的鲁棒特征抽取和分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于异构网络的致病基因及其复合物预测方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

通信网络在不确定业务流量需求下的路由鲁棒性优化研究

国家自然科学基金

1+阅读 · 2015年12月31日

来源于放线多孢菌的CRISPR/Cas系统的分析及功能鉴定

国家自然科学基金

0+阅读 · 2015年12月31日

含有隐变量的因果结构学习与统计因果推断

国家自然科学基金

21+阅读 · 2013年12月31日

因果推断的统计方法

国家自然科学基金

26+阅读 · 2011年12月31日

因果推断及不完全数据的统计分析

国家自然科学基金

23+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员