Design-based inference, also known as randomization-based or finite-population inference, provides a principled framework for trustworthy statistical inference by attributing randomness solely to the design mechanism (e.g., treatment assignment, survey sampling, or missingness), without imposing super-population distributional or modeling assumptions on outcome data. From Fisher's and Neyman's seminal work to the recent resurgence of design-based inference, this perspective has played a central role in causal inference, survey sampling, and missing data analysis. However, a fundamental obstacle has limited its use in many modern applications: existing design-based inference theory typically relies on known propensity scores (i.e., known design probabilities), whereas propensity scores are usually unknown in observational studies, real-world survey settings, and missing data problems. We propose propensity score propagation, a general framework for valid design-based inference with unknown propensity scores. The framework introduces a regeneration-and-union procedure that propagates uncertainty from propensity score estimation into downstream design-based inference without imposing super-population outcome assumptions. It accommodates both parametric and nonparametric propensity score models, integrates seamlessly with existing design-based methods developed under known propensity scores, and applies broadly across design-based inference problems. Theoretical results and simulation studies show that the proposed framework achieves nominal coverage, even when existing approaches exhibit substantial under-coverage.


翻译:基于设计的推断(又称随机化推断或有限总体推断)通过将随机性完全归因于设计机制(如处理分配、调查抽样或数据缺失),在不依赖超总体分布假设或结果数据建模假设的前提下,为可信统计推断提供了严谨框架。从费希尔和内曼的奠基性工作到近期基于设计推断的复兴,该视角在因果推断、抽样调查和缺失数据分析中始终占据核心地位。然而,一个根本性障碍限制了其在现代应用中的广泛使用:现有基于设计的推断理论通常依赖已知倾向性得分(即已知的设计概率),而在观察性研究、真实调查场景和缺失数据问题中,倾向性得分往往未知。我们提出倾向性得分传播这一通用框架,用于在倾向性得分未知时实现有效的基于设计推断。该框架引入了再生-联合过程,将倾向性得分估计的不确定性传播至下游基于设计的推断,而无需依赖超总体结果假设。它兼容参数与非参数倾向性得分模型,可与现有已知倾向性得分下的基于设计方法无缝集成,并广泛适用于各类基于设计的推断问题。理论结果与仿真研究表明,即使现有方法出现显著覆盖不足,本框架仍能达到名义覆盖水平。

0
下载
关闭预览

相关内容

基于因果推断的推荐系统去偏研究
专知会员服务
21+阅读 · 2024年11月10日
具有组合结构的统计推断和在线算法
专知会员服务
12+阅读 · 2022年12月13日
因果推断,Causal Inference:The Mixtape
专知会员服务
110+阅读 · 2021年8月27日
自动结构变分推理,Automatic structured variational inference
专知会员服务
41+阅读 · 2020年2月10日
【干货书】贝叶斯推断随机过程,449页pdf
专知
31+阅读 · 2020年8月27日
基于深度元学习的因果推断新方法
图与推荐
12+阅读 · 2020年7月21日
【机器学习】深入剖析机器学习中的统计思想
产业智能官
17+阅读 · 2019年1月24日
【论文】变分推断(Variational inference)的总结
机器学习研究会
39+阅读 · 2017年11月16日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
26+阅读 · 2011年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
VIP会员
最新内容
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
学习数据的几何:形状空间分析数学综述
专知会员服务
10+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
12+阅读 · 6月17日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
26+阅读 · 2011年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员