To test scientific theories and develop individualized treatment rules, researchers often wish to learn heterogeneous treatment effects that can be consistently found across diverse populations and contexts. We consider the problem of generalizing heterogeneous treatment effects (HTE) based on data from multiple sites. A key challenge is that a target population may differ from the source sites in unknown and unobservable ways. This means that the estimates from site-specific models lack external validity, and a simple pooled analysis risks bias. We develop a robust CATE (conditional average treatment effect) estimation methodology with multisite data from heterogeneous populations. We propose a minimax-regret framework that learns a generalizable CATE model by minimizing the worst-case regret over a class of target populations whose CATE can be represented as convex combinations of site-specific CATEs. Using robust optimization, the proposed methodology accounts for distribution shifts in both individual covariates and treatment effect heterogeneity across sites. We show that the resulting CATE model has an interpretable closed-form solution, expressed as a weighted average of site-specific CATE models. Thus, researchers can utilize a flexible CATE estimation method within each site and aggregate site-specific estimates to produce the final model. Through simulations and a real-world application, we show that the proposed methodology improves the robustness and generalizability of existing approaches.


翻译:为检验科学理论并制定个性化治疗方案,研究人员通常希望学习能在不同人群与情境中保持一致的异质性处理效应。本文研究基于多站点数据推广异质性处理效应(HTE)的问题。核心挑战在于目标人群与来源站点可能存在未知且不可观测的差异,这意味着基于各站点模型得到的估计缺乏外部有效性,而简单合并分析则存在偏倚风险。为此,我们提出了一种面向异质性人群多站点数据的鲁棒条件平均处理效应(CATE)估计方法。我们构建了极小化最大遗憾框架,通过最小化最坏情况下的遗憾值来学习可推广的CATE模型,其中目标人群的CATE可表示为各站点CATE的凸组合。借助鲁棒优化技术,本方法能有效应对跨站点个体协变量分布偏移与处理效应异质性问题。研究表明,所得CATE模型具有可解释的闭合解形式,可表示为各站点CATE模型的加权平均。因此,研究人员可在各站点内灵活运用CATE估计方法,并通过聚合站点级估计值生成最终模型。通过模拟实验与实际应用案例,我们证明该方法显著提升了现有方法的鲁棒性与泛化能力。

0
下载
关闭预览

相关内容

【MIT博士论文】数据丰富的个性化因果推断
专知会员服务
28+阅读 · 2025年4月12日
专知会员服务
58+阅读 · 2021年8月12日
专知会员服务
16+阅读 · 2021年5月21日
数据受限条件下的多模态处理技术综述
专知
22+阅读 · 2022年7月16日
综述 | 异质信息网络分析与应用综述
专知
27+阅读 · 2020年8月8日
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
如何做数据治理?
智能交通技术
19+阅读 · 2019年4月20日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
VIP会员
相关主题
最新内容
ICML 2026 | CFPO:用反事实策略优化提升多模态推理
专知会员服务
1+阅读 · 今天14:45
综述 | 世界动作模型:少做梦,多行动
专知会员服务
1+阅读 · 今天14:43
美以伊冲突:无人机与人工智能的运用
专知会员服务
3+阅读 · 今天14:31
《特种部队在透明战场中的生存力》最新报告
专知会员服务
2+阅读 · 今天14:11
《人工智能生成的零日漏洞:对未来作战的影响》
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关VIP内容
【MIT博士论文】数据丰富的个性化因果推断
专知会员服务
28+阅读 · 2025年4月12日
专知会员服务
58+阅读 · 2021年8月12日
专知会员服务
16+阅读 · 2021年5月21日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员