Causal discovery (CD) is an important component of many scientific applications, yet most techniques produce unreliable point estimates that often contradict expert knowledge. To mitigate this, recent research has focused on ex-ante incorporation of background knowledge into the CD process, typically under an unrealistic causal sufficiency assumption. When probing experts is costly (e.g., hidden behind expensive LLM APIs), however, ex-post model refinement that maximizes query utility is preferable. Also, when independent experts provide conflicting but better-than-random feedback, a principled aggregation method is required. In this context, we introduce the first CD algorithm that enables (i) distributional inference over ancestral graphs (AGs), which represent causal systems under latent confounding, and (ii) integration of both ex-ante and uncertain ex-post expert knowledge. Briefly, our method is a diversity-seeking reinforcement learning algorithm, termed Ancestral GFlowNet (AGFN), whose policy we iteratively refine based on a Bayesian model of the noisy expert feedback. Importantly, we prove convergence to the true AG given sufficiently accurate responses. Through validation on synthetic and realistic datasets using simulated humans and LLMs, we show AGFN is competitive with or superior to strong baselines in terms of structural Hamming distance and Bayesian Information Criterion.


翻译:因果发现(CD)是许多科学应用的重要组成部分,然而大多数技术产生不可靠的点估计,常常与专家知识相矛盾。为缓解此问题,近期研究聚焦于将背景知识以事前方式纳入CD过程,通常基于不现实的因果充分性假设。然而,当向专家征询成本高昂时(例如,隐藏于昂贵的LLM API之后),最大化查询效用的事后模型精炼更为可取。此外,当独立专家提供相互冲突但优于随机猜测的反馈时,需要一种原则性的聚合方法。在此背景下,我们提出了首个CD算法,该算法能够(i)对祖先图(AG)进行分布推断(AG表示存在潜在混杂的因果系统),并(ii)整合事前与不确定的事后专家知识。简言之,我们的方法是一种寻求多样性的强化学习算法,称为祖先GFlowNet(AGFN),其策略基于噪声专家反馈的贝叶斯模型进行迭代精炼。重要的是,我们证明了在专家反馈足够准确的条件下,算法能收敛至真实的AG。通过在合成与真实数据集上使用模拟人类和LLM进行验证,我们表明AGFN在结构汉明距离和贝叶斯信息准则方面与强基线方法相比具有竞争力或更优。

0
下载
关闭预览

相关内容

在数学和计算机科学之中,算法(Algorithm)为一个计算的具体步骤,常用于计算、数据处理和自动推理。精确而言,算法是一个表示为有限长列表的有效方法。算法应包含清晰定义的指令用于计算函数。 来自维基百科: 算法
【经典书】统计学中的因果推断,156页pdf
专知会员服务
98+阅读 · 2022年6月14日
因果推断,Causal Inference:The Mixtape
专知会员服务
110+阅读 · 2021年8月27日
「因果发现和因果推理」简明介绍,37页ppt
专知会员服务
119+阅读 · 2021年4月5日
专知会员服务
66+阅读 · 2021年1月6日
因果关联学习,Causal Relational Learning
专知会员服务
185+阅读 · 2020年4月21日
「因果推理」概述论文,13页pdf
专知
16+阅读 · 2021年3月20日
基于深度元学习的因果推断新方法
图与推荐
12+阅读 · 2020年7月21日
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
26+阅读 · 2011年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
Arxiv
0+阅读 · 3月15日
Arxiv
0+阅读 · 2月1日
VIP会员
最新内容
BES:让语言模型通过双向进化搜索自我改进
专知会员服务
3+阅读 · 5月30日
以色列-美国-伊朗战争中的无人机:关键要点
专知会员服务
4+阅读 · 5月30日
《Palantir任务保障性软件安全标准(MA-S2)》
专知会员服务
10+阅读 · 5月30日
基于声学的无人机检测技术综述
专知会员服务
7+阅读 · 5月30日
《当代混合战争分析框架:俄乌战争经验教训》
战略前沿人工智能的再思考(中文)
专知会员服务
8+阅读 · 5月29日
《量化地基防空系统间接效应的博弈论方法》
专知会员服务
6+阅读 · 5月29日
相关VIP内容
【经典书】统计学中的因果推断,156页pdf
专知会员服务
98+阅读 · 2022年6月14日
因果推断,Causal Inference:The Mixtape
专知会员服务
110+阅读 · 2021年8月27日
「因果发现和因果推理」简明介绍,37页ppt
专知会员服务
119+阅读 · 2021年4月5日
专知会员服务
66+阅读 · 2021年1月6日
因果关联学习,Causal Relational Learning
专知会员服务
185+阅读 · 2020年4月21日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
21+阅读 · 2013年12月31日
国家自然科学基金
26+阅读 · 2011年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员