This paper tackles a critical bottleneck in Super-Structure-based divide-and-conquer causal discovery: the high computational cost of constructing accurate Super-Structures--particularly when conditional independence (CI) tests are expensive and domain knowledge is unavailable. We propose a novel, lightweight framework that relaxes the strict requirements on Super-Structure construction while preserving the algorithmic benefits of divide-and-conquer. By integrating weakly constrained Super-Structures with efficient graph partitioning and merging strategies, our approach substantially lowers CI test overhead without sacrificing accuracy. We instantiate the framework in a concrete causal discovery algorithm and rigorously evaluate its components on synthetic data. Comprehensive experiments on Gaussian Bayesian networks, including magic-NIAB, ECOLI70, and magic-IRRI, demonstrate that our method matches or closely approximates the structural accuracy of PC and FCI while drastically reducing the number of CI tests. Further validation on the real-world China Health and Retirement Longitudinal Study (CHARLS) dataset confirms its practical applicability. Our results establish that accurate, scalable causal discovery is achievable even under minimal assumptions about the initial Super-Structure, opening new avenues for applying divide-and-conquer methods to large-scale, knowledge-scarce domains such as biomedical and social science research.


翻译:本文解决了基于超结构的分治因果发现中的一个关键瓶颈:构建精确超结构的高计算成本——尤其是在条件独立性检验代价高昂且领域知识不可用的情况下。我们提出了一种新颖的轻量级框架,该框架放宽了对超结构构建的严格要求,同时保留了分治算法的优势。通过将弱约束的超结构与高效的图分割及合并策略相结合,我们的方法在保持准确性的同时显著降低了条件独立性检验的开销。我们将该框架具体实现为一个因果发现算法,并在合成数据上对其各组件进行了严格评估。在高斯贝叶斯网络(包括magic-NIAB、ECOLI70和magic-IRRI)上的综合实验表明,我们的方法在结构准确性上与PC和FCI算法相当或非常接近,同时极大地减少了条件独立性检验的数量。在中国健康与养老追踪调查真实数据集上的进一步验证证实了其实际适用性。我们的结果表明,即使在对初始超结构做出最小假设的情况下,也能实现准确、可扩展的因果发现,这为将分治方法应用于生物医学和社会科学研究等大规模、知识稀缺的领域开辟了新途径。

0
下载
关闭预览

相关内容

【KDD2023】发现动态因果空间进行DAG结构学习
专知会员服务
33+阅读 · 2023年6月9日
【匹兹堡大学博士论文】数据限制下的因果推理,147页pdf
专知会员服务
35+阅读 · 2021年7月1日
专知会员服务
66+阅读 · 2021年1月6日
「因果推理」概述论文,13页pdf
专知
16+阅读 · 2021年3月20日
基于深度元学习的因果推断新方法
图与推荐
12+阅读 · 2020年7月21日
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
基于深度学习的图像超分辨率最新进展与趋势【附PDF】
人工智能前沿讲习班
15+阅读 · 2019年2月27日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
12+阅读 · 2011年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
Arxiv
0+阅读 · 1月16日
VIP会员
相关VIP内容
【KDD2023】发现动态因果空间进行DAG结构学习
专知会员服务
33+阅读 · 2023年6月9日
【匹兹堡大学博士论文】数据限制下的因果推理,147页pdf
专知会员服务
35+阅读 · 2021年7月1日
专知会员服务
66+阅读 · 2021年1月6日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
12+阅读 · 2011年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员