Design-based inference, also known as randomization-based or finite-population inference, provides a principled framework for trustworthy statistical inference by attributing randomness solely to the design mechanism (e.g., treatment assignment, survey sampling, or missingness), without imposing distributional or modeling assumptions on outcome data. Despite its conceptual appeal and long history, applying this framework becomes challenging when the underlying design probabilities (i.e., propensity scores) are unknown, as is common in observational studies, real-world surveys, and missing-data settings. Existing plug-in and matching-based methods either ignore uncertainty from propensity score estimation or rely on near-exact covariate matching, often leading to systematic under-coverage, while existing finite-population M-estimation approaches remain largely restricted to parametric propensity score models. In this work, we propose propensity score propagation, a general framework for valid design-based inference with unknown propensity scores. The framework introduces a regeneration-and-union procedure to propagate uncertainty from propensity score estimation into downstream design-based inference. It accommodates both parametric and nonparametric propensity score models, integrates seamlessly with existing design-based inference methods developed under known propensity scores, and applies broadly across design-based inference problems. Theoretical and simulation studies show that the proposed framework achieves nominal coverage, even in settings where conventional approaches exhibit substantial under-coverage.


翻译:基于设计的推断(也称为随机化推断或有限总体推断)通过将随机性完全归因于设计机制(如处理分配、调查抽样或数据缺失),不对结果数据施加分布或模型假设,为可信统计推断提供了严谨框架。尽管该框架在概念上具有吸引力且历史悠久,但当底层设计概率(即倾向性评分)未知时(常见于观察性研究、真实世界调查和缺失数据场景),应用该框架面临挑战。现有插件法和匹配法要么忽略倾向性评分估计的不确定性,要么依赖近乎精确的协变量匹配,常导致系统性覆盖不足;而现有有限总体M估计方法仍主要局限于参数化倾向性评分模型。本文提出倾向性评分传播框架,为未知倾向评分下的有效基于设计推断提供统一方案。该框架引入再生-联合程序,将倾向性评分估计的不确定性传播至下游基于设计的推断中。它兼容参数化与非参数化倾向性评分模型,可无缝集成现有已知倾向评分下的基于设计推断方法,并广泛适用于各类基于设计的推断问题。理论与模拟研究表明:即使在传统方法呈现显著覆盖不足的场景中,所提框架仍能达到名义覆盖水平。

0
下载
关闭预览

相关内容

基于因果推断的推荐系统去偏研究
专知会员服务
21+阅读 · 2024年11月10日
具有组合结构的统计推断和在线算法
专知会员服务
12+阅读 · 2022年12月13日
自动结构变分推理,Automatic structured variational inference
专知会员服务
41+阅读 · 2020年2月10日
推荐系统(一):推荐系统基础
菜鸟的机器学习
25+阅读 · 2019年9月2日
深度 | 推荐系统评估
AI100
24+阅读 · 2019年3月16日
【机器学习】深入剖析机器学习中的统计思想
产业智能官
17+阅读 · 2019年1月24日
推荐系统
炼数成金订阅号
28+阅读 · 2019年1月17日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
26+阅读 · 2011年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
Arxiv
0+阅读 · 4月7日
VIP会员
最新内容
美国从乌克兰无人机战争中学习经验
专知会员服务
5+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
2+阅读 · 6月21日
学习数据的几何:形状空间分析数学综述
专知会员服务
9+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
11+阅读 · 6月17日
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
26+阅读 · 2011年12月31日
国家自然科学基金
23+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员