We study causal discovery from observational data in linear Gaussian systems affected by \emph{mixed latent confounding}, where some unobserved factors act broadly across many variables while others influence only small subsets. This setting is common in practice and poses a challenge for existing methods: differentiable and score-based DAG learners can misinterpret global latent effects as causal edges, while latent-variable graphical models recover only undirected structure. We propose \textsc{DCL-DECOR}, a modular, precision-led pipeline that separates these roles. The method first isolates pervasive latent effects by decomposing the observed precision matrix into a structured component and a low-rank component. The structured component corresponds to the conditional distribution after accounting for pervasive confounders and retains only local dependence induced by the causal graph and localized confounding. A correlated-noise DAG learner is then applied to this deconfounded representation to recover directed edges while modeling remaining structured error correlations, followed by a simple reconciliation step to enforce bow-freeness. We provide identifiability results that characterize the recoverable causal target under mixed confounding and show how the overall problem reduces to well-studied subproblems with modular guarantees. Synthetic experiments that vary the strength and dimensionality of pervasive confounding demonstrate consistent improvements in directed edge recovery over applying correlated-noise DAG learning directly to the confounded data.


翻译:本研究探讨线性高斯系统中受**混合潜在混杂**影响的观测数据因果发现问题,其中部分未观测因子广泛作用于多个变量,而其他因子仅影响小规模变量子集。该设定在实际应用中普遍存在,并对现有方法构成挑战:可微分与基于评分的DAG学习器可能将全局潜在效应误判为因果边,而潜变量图模型仅能恢复无向结构。我们提出**DCL-DECOR**——一种模块化、以精度矩阵为主导的处理流程,以区分这些不同作用机制。该方法首先通过将观测精度矩阵分解为结构化分量与低秩分量,从而分离普遍存在的潜在效应。结构化分量对应消除普遍混杂因子后的条件分布,仅保留由因果图及局部化混杂引起的局部依赖关系。随后将相关噪声DAG学习器应用于该去混杂表示,在建模剩余结构化误差相关性的同时恢复有向边,最后通过简易协调步骤确保弓形结构不存在性。我们提供了可识别性分析结果,刻画了混合混杂条件下可恢复的因果目标,并论证了如何将整体问题转化为具有模块化保证的成熟子问题。通过改变普遍混杂强度与维度的合成实验表明,相较于直接将相关噪声DAG学习应用于混杂数据,本方法在有向边恢复方面持续提升性能。

0
下载
关闭预览

相关内容

ICML 2024 | 如何在含有隐变量的环境中识别因果关系?
专知会员服务
22+阅读 · 2024年7月18日
【CMU博士论文】非参数因果推断,241页pdf
专知会员服务
35+阅读 · 2023年6月20日
【苏黎世联邦理工博士论文】因果推断的混杂调整
专知会员服务
43+阅读 · 2022年11月7日
因果推断,Causal Inference:The Mixtape
专知会员服务
110+阅读 · 2021年8月27日
专知会员服务
35+阅读 · 2021年7月1日
「因果推理」概述论文,13页pdf
专知
16+阅读 · 2021年3月20日
基于深度元学习的因果推断新方法
图与推荐
12+阅读 · 2020年7月21日
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
相关性≠因果:概率图模型和do-calculus
论智
31+阅读 · 2018年10月29日
【学界】融合对抗学习的因果关系抽取
GAN生成式对抗网络
15+阅读 · 2018年7月14日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
26+阅读 · 2011年12月31日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
26+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员