Observationally Informed Adaptive Causal Experimental Design - 专知论文

会员服务 ·

0

设计 · 自适应 · 试验 · 偏差 · 冗余 ·

Observationally Informed Adaptive Causal Experimental Design

翻译：基于观测信息的自适应因果实验设计

Erdun Gao,Liang Zhang,Jake Fawkes,Aoqi Zuo,Wenqin Liu,Haoxuan Li,Mingming Gong,Dino Sejdinovic

Randomized Controlled Trials (RCTs) represent the gold standard for causal inference yet remain a scarce resource. While large-scale observational data is often available, it is utilized only for retrospective fusion, and remains discarded in prospective trial design due to bias concerns. We argue this "tabula rasa" data acquisition strategy is fundamentally inefficient. In this work, we propose Active Residual Learning, a new paradigm that leverages the observational model as a foundational prior. This approach shifts the experimental focus from learning target causal quantities from scratch to efficiently estimating the residuals required to correct observational bias. To operationalize this, we introduce the R-Design framework. Theoretically, we establish two key advantages: (1) a structural efficiency gap, proving that estimating smooth residual contrasts admits strictly faster convergence rates than reconstructing full outcomes; and (2) information efficiency, where we quantify the redundancy in standard parameter-based acquisition (e.g., BALD), demonstrating that such baselines waste budget on task-irrelevant nuisance uncertainty. We propose R-EPIG (Residual Expected Predictive Information Gain), a unified criterion that directly targets the causal estimand, minimizing residual uncertainty for estimation or clarifying decision boundaries for policy. Experiments on synthetic and semi-synthetic benchmarks demonstrate that R-Design significantly outperforms baselines, confirming that repairing a biased model is far more efficient than learning one from scratch.

翻译：随机对照试验（RCT）被视为因果推断的黄金标准，但其资源依然稀缺。尽管大规模观测数据通常易于获取，但以往仅被用于回顾性融合，并因偏差担忧而在前瞻性试验设计中被弃用。我们认为这种“白板式”数据获取策略本质上是低效的。本文提出一种新范式——主动残差学习，该范式将观测模型作为基础先验。该方法将实验重心从零开始学习目标因果量，转向高效估计校正观测偏差所需的残差。为实现这一目标，我们提出了R-Design框架。理论上，我们确立了两个关键优势：（1）结构效率差距：证明估计平滑残差对比量可获得比重构完整结果严格更快的收敛速率；（2）信息效率：我们量化了基于标准参数获取方法（如BALD）中的冗余，证明此类基线方法将预算浪费在与任务无关的冗余不确定性上。我们提出了R-EPIG（残差期望预测信息增益），这是一个直接以因果估计量为目标的统一准则，可最小化估计的残差不确定性或明晰决策边界以优化策略。在合成与半合成基准测试上的实验表明，R-Design显著优于基线方法，证实修正一个有偏模型远比从零开始学习一个模型更为高效。

0

相关内容

设计是对现有状的一种重新认识和打破重组的过程，设计让一切变得更美。

基于因果推断的推荐系统去偏研究

基于因果推断的推荐系统去偏研究

专知会员服务

21+阅读 · 2024年11月10日

因果学习在可信赖推荐系统中的应用综述

因果学习在可信赖推荐系统中的应用综述

专知会员服务

18+阅读 · 2024年2月15日

【剑桥大学博士论文】监督学习、模仿和强化学习中泛化和自适应的因果表示学习，202页pdf

【剑桥大学博士论文】监督学习、模仿和强化学习中泛化和自适应的因果表示学习，202页pdf

专知会员服务

55+阅读 · 2023年2月3日

最新《因果推断导论》，51页ppt，剑桥大学助理教授Qingyuan Zhao讲解

最新《因果推断导论》，51页ppt，剑桥大学助理教授Qingyuan Zhao讲解

专知会员服务

41+阅读 · 2022年8月28日

【ICML2022】因果Transformer:估算反事实结果的因果, 附ppt

【ICML2022】因果Transformer:估算反事实结果的因果, 附ppt

专知会员服务

84+阅读 · 2022年7月20日

因果如何用于推荐？中科大最新WWW2022《因果推荐: 进展与未来方向》教程，附123页ppt

因果如何用于推荐？中科大最新WWW2022《因果推荐: 进展与未来方向》教程，附123页ppt

专知会员服务

108+阅读 · 2022年4月28日

Nature计算科学综述：经由准实验从观察数据中推测因果关系

Nature计算科学综述：经由准实验从观察数据中推测因果关系

专知会员服务

36+阅读 · 2021年3月25日

基于人工智能的自适应实验设计, 加州理工Yisong Yue教授，附下载

专知会员服务

20+阅读 · 2021年1月27日

因果关联学习，Causal Relational Learning

因果关联学习，Causal Relational Learning

专知会员服务

185+阅读 · 2020年4月21日

最新「因果推断Causal Inference」综述论文38页pdf，Buffalo、Georgia、阿里巴巴、Virginia

专知会员服务

183+阅读 · 2020年2月11日

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

专知

11+阅读 · 2020年8月28日

基于深度元学习的因果推断新方法

基于深度元学习的因果推断新方法

图与推荐

12+阅读 · 2020年7月21日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

自动特征工程在推荐系统中的研究

自动特征工程在推荐系统中的研究

DataFunTalk

10+阅读 · 2019年12月20日

用深度学习揭示数据的因果关系

用深度学习揭示数据的因果关系

专知

28+阅读 · 2019年5月18日

北京大学何洋波博士《因果推断和因果图模型》机器学习报告

北京大学何洋波博士《因果推断和因果图模型》机器学习报告

专知

103+阅读 · 2018年11月11日

相关性≠因果：概率图模型和do-calculus

相关性≠因果：概率图模型和do-calculus

论智

31+阅读 · 2018年10月29日

赛尔原创 | ACM BCB 2018 CausalTriad: 从医学文本数据中推断出新的因果关系假设

赛尔原创 | ACM BCB 2018 CausalTriad: 从医学文本数据中推断出新的因果关系假设

哈工大SCIR

14+阅读 · 2018年6月28日

基于自适应学习平台促进学生个性化学习的研究

基于自适应学习平台促进学生个性化学习的研究

MOOC

12+阅读 · 2018年4月2日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

分数阶随机共振行为机制及其自适应控制与强色噪声背景中的微弱信号检测

国家自然科学基金

0+阅读 · 2015年12月31日

视觉信息的局部特征表示及应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

试验设计中的模型选择

国家自然科学基金

6+阅读 · 2014年12月31日

基于部分核实数据的统计推断及应用

国家自然科学基金

0+阅读 · 2014年12月31日

相依回归模型与扩散过程的统计推断及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

劣者淘汰两阶段自适应临床试验的设计和分析

国家自然科学基金

0+阅读 · 2014年12月31日

含有隐变量的因果结构学习与统计因果推断

国家自然科学基金

21+阅读 · 2013年12月31日

因果推断的统计方法

国家自然科学基金

26+阅读 · 2011年12月31日

因果推断及不完全数据的统计分析

国家自然科学基金

23+阅读 · 2008年12月31日

A Benchmark of Causal vs. Correlation AI for Predictive Maintenance

Arxiv

0+阅读 · 2月23日

Extrapolating Single-Treatment Effects Out of Factorial Experiments

Arxiv

0+阅读 · 2月23日

Design-based inference for generalized causal effects in randomized experiments

Arxiv

0+阅读 · 2月20日

Sample size and power calculations for causal inference of observational studies

Arxiv

0+阅读 · 2月14日

Modern Causal Inference Approaches to Improve Power for Subgroup Analysis in Randomized Controlled Trials

Arxiv

0+阅读 · 2月11日

A Causal Machine Learning Framework for Treatment Personalization in Clinical Trials: Application to Ulcerative Colitis

Arxiv

0+阅读 · 2月9日

Adaptive Experimental Design Using Shrinkage Estimators

Arxiv

0+阅读 · 2月7日

Designing Computational Tools for Exploring Causal Relationships in Qualitative Data

Arxiv

0+阅读 · 2月6日

Federated Causal Inference from Multi-Site Observational Data via Propensity Score Aggregation

Arxiv

0+阅读 · 2月3日

Causal Preference Elicitation

Arxiv

0+阅读 · 2月1日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

1+阅读 · 今天15:02

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

1+阅读 · 今天15:00

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

2+阅读 · 今天14:30

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

2+阅读 · 今天14:05

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

2+阅读 · 今天13:55

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

2+阅读 · 今天13:51

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

2+阅读 · 今天13:48

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

7+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

20+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

基于因果推断的推荐系统去偏研究

基于因果推断的推荐系统去偏研究

专知会员服务

21+阅读 · 2024年11月10日

因果学习在可信赖推荐系统中的应用综述

因果学习在可信赖推荐系统中的应用综述

专知会员服务

18+阅读 · 2024年2月15日

【剑桥大学博士论文】监督学习、模仿和强化学习中泛化和自适应的因果表示学习，202页pdf

【剑桥大学博士论文】监督学习、模仿和强化学习中泛化和自适应的因果表示学习，202页pdf

专知会员服务

55+阅读 · 2023年2月3日

最新《因果推断导论》，51页ppt，剑桥大学助理教授Qingyuan Zhao讲解

最新《因果推断导论》，51页ppt，剑桥大学助理教授Qingyuan Zhao讲解

专知会员服务

41+阅读 · 2022年8月28日

【ICML2022】因果Transformer:估算反事实结果的因果, 附ppt

【ICML2022】因果Transformer:估算反事实结果的因果, 附ppt

专知会员服务

84+阅读 · 2022年7月20日

因果如何用于推荐？中科大最新WWW2022《因果推荐: 进展与未来方向》教程，附123页ppt

因果如何用于推荐？中科大最新WWW2022《因果推荐: 进展与未来方向》教程，附123页ppt

专知会员服务

108+阅读 · 2022年4月28日

Nature计算科学综述：经由准实验从观察数据中推测因果关系

Nature计算科学综述：经由准实验从观察数据中推测因果关系

专知会员服务

36+阅读 · 2021年3月25日

基于人工智能的自适应实验设计, 加州理工Yisong Yue教授，附下载

专知会员服务

20+阅读 · 2021年1月27日

因果关联学习，Causal Relational Learning

因果关联学习，Causal Relational Learning

专知会员服务

185+阅读 · 2020年4月21日

最新「因果推断Causal Inference」综述论文38页pdf，Buffalo、Georgia、阿里巴巴、Virginia

专知会员服务

183+阅读 · 2020年2月11日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

专知

11+阅读 · 2020年8月28日

基于深度元学习的因果推断新方法

基于深度元学习的因果推断新方法

图与推荐

12+阅读 · 2020年7月21日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

自动特征工程在推荐系统中的研究

自动特征工程在推荐系统中的研究

DataFunTalk

10+阅读 · 2019年12月20日

用深度学习揭示数据的因果关系

用深度学习揭示数据的因果关系

专知

28+阅读 · 2019年5月18日

北京大学何洋波博士《因果推断和因果图模型》机器学习报告

北京大学何洋波博士《因果推断和因果图模型》机器学习报告

专知

103+阅读 · 2018年11月11日

相关性≠因果：概率图模型和do-calculus

相关性≠因果：概率图模型和do-calculus

论智

31+阅读 · 2018年10月29日

赛尔原创 | ACM BCB 2018 CausalTriad: 从医学文本数据中推断出新的因果关系假设

赛尔原创 | ACM BCB 2018 CausalTriad: 从医学文本数据中推断出新的因果关系假设

哈工大SCIR

14+阅读 · 2018年6月28日

基于自适应学习平台促进学生个性化学习的研究

基于自适应学习平台促进学生个性化学习的研究

MOOC

12+阅读 · 2018年4月2日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

相关论文

A Benchmark of Causal vs. Correlation AI for Predictive Maintenance

Arxiv

0+阅读 · 2月23日

Extrapolating Single-Treatment Effects Out of Factorial Experiments

Arxiv

0+阅读 · 2月23日

Design-based inference for generalized causal effects in randomized experiments

Arxiv

0+阅读 · 2月20日

Sample size and power calculations for causal inference of observational studies

Arxiv

0+阅读 · 2月14日

Modern Causal Inference Approaches to Improve Power for Subgroup Analysis in Randomized Controlled Trials

Arxiv

0+阅读 · 2月11日

A Causal Machine Learning Framework for Treatment Personalization in Clinical Trials: Application to Ulcerative Colitis

Arxiv

0+阅读 · 2月9日

Adaptive Experimental Design Using Shrinkage Estimators

Arxiv

0+阅读 · 2月7日

Designing Computational Tools for Exploring Causal Relationships in Qualitative Data

Arxiv

0+阅读 · 2月6日

Federated Causal Inference from Multi-Site Observational Data via Propensity Score Aggregation

Arxiv

0+阅读 · 2月3日

Causal Preference Elicitation

Arxiv

0+阅读 · 2月1日

相关基金

分数阶随机共振行为机制及其自适应控制与强色噪声背景中的微弱信号检测

国家自然科学基金

0+阅读 · 2015年12月31日

视觉信息的局部特征表示及应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

试验设计中的模型选择

国家自然科学基金

6+阅读 · 2014年12月31日

基于部分核实数据的统计推断及应用

国家自然科学基金

0+阅读 · 2014年12月31日

相依回归模型与扩散过程的统计推断及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

劣者淘汰两阶段自适应临床试验的设计和分析

国家自然科学基金

0+阅读 · 2014年12月31日

含有隐变量的因果结构学习与统计因果推断

国家自然科学基金

21+阅读 · 2013年12月31日

因果推断的统计方法

国家自然科学基金

26+阅读 · 2011年12月31日

因果推断及不完全数据的统计分析

国家自然科学基金

23+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员