We develop a novel method for personalized off-policy learning in scenarios with unobserved confounding. Thereby, we address a key limitation of standard policy learning: standard policy learning assumes unconfoundedness, meaning that no unobserved factors influence both treatment assignment and outcomes. However, this assumption is often violated, because of which standard policy learning produces biased estimates and thus leads to policies that can be harmful. To address this limitation, we employ causal sensitivity analysis and derive a semi-parametrically efficient estimator for a sharp bound on the value function under unobserved confounding. Our estimator has three advantages: (1) Unlike existing works, our estimator avoids unstable minimax optimization based on inverse propensity weighted outcomes. (2) Our estimator is semi-parametrically efficient. (3) We prove that our estimator leads to the optimal confounding-robust policy. Finally, we extend our theory to the related task of policy improvement under unobserved confounding, i.e., when a baseline policy such as the standard of care is available. We show in experiments with synthetic and real-world data that our method outperforms simple plug-in approaches and existing baselines. Our method is highly relevant for decision-making where unobserved confounding can be problematic, such as in healthcare and public policy.


翻译:我们提出了一种在存在未观测混杂情况下进行个性化离策略学习的新方法。该方法解决了标准策略学习的一个关键局限:标准策略学习假设无混杂性,即不存在同时影响治疗分配和结果的未观测因素。然而,该假设常被违背,导致标准策略学习产生有偏估计,进而可能产生有害的策略。为克服此局限,我们采用因果敏感性分析,并推导出未观测混杂下价值函数锐利界的一个半参数有效估计量。我们的估计量具有三个优势:(1) 与现有工作不同,我们的估计量避免了基于逆倾向加权结果的不稳定极小极大优化。(2) 我们的估计量是半参数有效的。(3) 我们证明了该估计量能导出最优的混杂鲁棒策略。最后,我们将理论扩展至未观测混杂下的策略改进这一相关任务,即当存在基线策略(如标准治疗方案)时。我们在合成数据与真实数据的实验中表明,本方法优于简单的插件方法及现有基线。本方法对未观测混杂可能成问题的决策领域(如医疗保健与公共政策)具有高度相关性。

0
下载
关闭预览

相关内容

【ETH博士论文】基于离散优化的学习,193页pdf
专知会员服务
44+阅读 · 2023年9月17日
国家自然科学基金
42+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2013年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
Arxiv
0+阅读 · 2月2日
VIP会员
相关VIP内容
【ETH博士论文】基于离散优化的学习,193页pdf
专知会员服务
44+阅读 · 2023年9月17日
相关基金
国家自然科学基金
42+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
23+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2013年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员