两阶段多波次抽样下的M估计及其在预测驱动推断中的应用 (M-estimation under Two-Phase Multiwave Sampling with Applications to Prediction-Powered Inference) - 专知论文

会员服务 ·

0

推断 · 自适应 · 单元 · 代理变量 · 样本 ·

M-estimation under Two-Phase Multiwave Sampling with Applications to Prediction-Powered Inference

翻译：两阶段多波次抽样下的M估计及其在预测驱动推断中的应用

Dan M. Kluger,Stephen Bates

In two-phase multiwave sampling, inexpensive measurements are collected on a large sample and expensive, more informative measurements are adaptively obtained on subsets of units across multiple waves. Adaptively collecting the expensive measurements can increase efficiency but complicates statistical inference. We give valid estimators and confidence intervals for M-estimation under adaptive two-phase multiwave sampling. We focus on the case where proxies for the expensive variables -- such as predictions from pretrained machine learning models -- are available for all units and propose a Multiwave Predict-Then-Debias estimator that combines proxy information with the expensive, higher-quality measurements to improve efficiency while removing bias. We establish asymptotic linearity and normality and propose asymptotically valid confidence intervals. We also develop an approximately greedy sampling strategy that improves efficiency relative to uniform sampling. Data-based simulation studies support the theoretical results and demonstrate efficiency gains.

翻译：在两阶段多波次抽样中，首先在大样本上收集成本较低的测量值，随后在多轮抽样中自适应地在单元子集上获取成本较高但信息更丰富的测量值。自适应收集高成本测量值可提升效率，但会使统计推断复杂化。本文针对自适应两阶段多波次抽样提出有效的M估计量及置信区间。我们重点关注以下情形：所有单元均可获得高成本变量的代理变量（例如来自预训练机器学习模型的预测结果），并提出一种多波次预测-去偏估计量。该估计量将代理变量信息与高质量高成本测量值相结合，在消除偏差的同时提升估计效率。我们证明了估计量的渐近线性与正态性，并构建了渐近有效的置信区间。同时提出一种近似贪婪抽样策略，相较于均匀抽样可进一步提升效率。基于数据的模拟研究验证了理论结果，并证实了效率提升效应。

0

相关内容

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

专知会员服务

48+阅读 · 2025年9月8日

基于因果推断的推荐系统去偏研究

基于因果推断的推荐系统去偏研究

专知会员服务

21+阅读 · 2024年11月10日

《多目标响应面可取性函数最优点评价的统计推断》2022最新295页博士论文【含代码】，美国空军技术学院

《多目标响应面可取性函数最优点评价的统计推断》2022最新295页博士论文【含代码】，美国空军技术学院

专知会员服务

29+阅读 · 2022年11月3日

多模态认知计算

多模态认知计算

专知会员服务

182+阅读 · 2022年9月16日

《异构观测数据中的联合因果推理》美国艾莫利大学、微软、约翰霍普金斯大学、哈佛大学、斯坦福大学等联合发表最新论文63页PDF

《异构观测数据中的联合因果推理》美国艾莫利大学、微软、约翰霍普金斯大学、哈佛大学、斯坦福大学等联合发表最新论文63页PDF

专知会员服务

29+阅读 · 2022年4月28日

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

专知会员服务

27+阅读 · 2022年3月22日

【IJCAI2020】通过双向对抗训练生成中间域样本提升半监督域自适应效果

【IJCAI2020】通过双向对抗训练生成中间域样本提升半监督域自适应效果

专知会员服务

35+阅读 · 2020年9月17日

【论文推荐】不同图像域弱监督语义分割的综合分析，A Comprehensive Analysis of Weakly-Supervised Semantic Segmentation in Different Image Domains

【论文推荐】不同图像域弱监督语义分割的综合分析，A Comprehensive Analysis of Weakly-Supervised Semantic Segmentation in Different Image Domains

专知会员服务

28+阅读 · 2019年12月27日

【KDD2019|讲座推荐】假设检验与统计声音模式挖掘：Hypothesis Testing and Statistically-sound Pattern Mining

【KDD2019|讲座推荐】假设检验与统计声音模式挖掘：Hypothesis Testing and Statistically-sound Pattern Mining

专知会员服务

22+阅读 · 2019年12月6日

【论文|CMU】用于多模序列学习的因数分解多模态变压器，Factorized Multimodal Transformer for Multimodal Sequential Learning

【论文|CMU】用于多模序列学习的因数分解多模态变压器，Factorized Multimodal Transformer for Multimodal Sequential Learning

专知会员服务

23+阅读 · 2019年11月26日

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

专知

18+阅读 · 2022年9月9日

小样本也能增量学习？CVPR 2020 Oral最新干货：小样本类增量学习

小样本也能增量学习？CVPR 2020 Oral最新干货：小样本类增量学习

CVer

54+阅读 · 2020年5月1日

赛尔笔记 | 多模态信息抽取简述

赛尔笔记 | 多模态信息抽取简述

专知

29+阅读 · 2020年4月12日

【工大SCIR笔记】多模态信息抽取简述

【工大SCIR笔记】多模态信息抽取简述

深度学习自然语言处理

19+阅读 · 2020年4月3日

自动特征工程在推荐系统中的研究

自动特征工程在推荐系统中的研究

DataFunTalk

10+阅读 · 2019年12月20日

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

AINLP

38+阅读 · 2019年9月3日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

专知

12+阅读 · 2018年1月12日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

回归预测&时间序列预测

回归预测&时间序列预测

GBASE数据工程部数据团队

44+阅读 · 2017年5月17日

通信约束下间歇量测的多自主体系统趋同控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

M-矩阵（张量）最小特征值估计及其相关问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于复杂数据的回归模型统计推断及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

基于自适应采样和变复杂度近似的多学科稳健性设计优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于稀疏互质阵列的DOA估计算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

随机波动率模型的统计推断及数值解

国家自然科学基金

1+阅读 · 2015年12月31日

普适计算对象感知多模态不精确性数据融合算法研究

国家自然科学基金

5+阅读 · 2014年12月31日

相依回归模型与扩散过程的统计推断及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

概率抽样设计及其统计推断方法

国家自然科学基金

6+阅读 · 2014年12月31日

基于似然函数的统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

Detection of Multiple Influential Observations on Model Selection

Arxiv

0+阅读 · 3月15日

Adaptive and Stratified Subsampling for High-Dimensional Robust Estimation

Arxiv

0+阅读 · 3月10日

Two-Stage Decoding Algorithm and Bounds for Group Testing with Prior Statistics

Arxiv

0+阅读 · 2月28日

Efficient Targeted Maximum Likelihood Estimators for Two-Phase Design Problems

Arxiv

0+阅读 · 2月27日

Reducing Estimation Uncertainty Using Normalizing Flows and Stratification

Arxiv

0+阅读 · 2月12日

Two-phase validation sampling via principal components to improve efficiency in multi-model estimation from error-prone biomedical databases

Arxiv

0+阅读 · 2月11日

Generalized Prediction-Powered Inference, with Application to Binary Classifier Evaluation

Arxiv

0+阅读 · 2月10日

Meta-analysis of diagnostic test accuracy with multiple disease stages: combining stage-specific and merged-stage data

Arxiv

0+阅读 · 2月8日

Adaptive Off-Policy Inference for M-Estimators Under Model Misspecification

Arxiv

0+阅读 · 2月8日

Online conformal inference for multi-step time series forecasting

Arxiv

0+阅读 · 2月2日

VIP会员

文章信息

相关主题

最新内容

《面向战术决策的广义智能：大语言模型驱动的动态武器-目标分配》

《面向战术决策的广义智能：大语言模型驱动的动态武器-目标分配》

专知会员服务

7+阅读 · 今天6:31

《分布式军事人工智能理论：部分可观测与通信条件下的协调约束多智能体强化学习》

《分布式军事人工智能理论：部分可观测与通信条件下的协调约束多智能体强化学习》

专知会员服务

6+阅读 · 今天6:28

《第四代军事特种作战部队选拔与评估》

《第四代军事特种作战部队选拔与评估》

专知会员服务

1+阅读 · 今天6:23

《迈向可解释强化学习及面向战略决策的定制化学习基准》（70页）

《迈向可解释强化学习及面向战略决策的定制化学习基准》（70页）

专知会员服务

4+阅读 · 今天6:19

美军有人-无人协同作战的下一阶段演进：分布式电子战构想

美军有人-无人协同作战的下一阶段演进：分布式电子战构想

专知会员服务

2+阅读 · 今天6:06

不对称优势上升：自主系统如何强化海上拒止

不对称优势上升：自主系统如何强化海上拒止

专知会员服务

1+阅读 · 今天5:51

延伸海上作战中心的触角：如何保持舰队从陆地到海洋的连通

延伸海上作战中心的触角：如何保持舰队从陆地到海洋的连通

专知会员服务

4+阅读 · 4月17日

美军“数据2030”概念设想：数字化杀伤链统一标准

美军“数据2030”概念设想：数字化杀伤链统一标准

专知会员服务

3+阅读 · 4月17日

《自主集群系统的战略架构：多域集成、韧性及海上作战框架（2025-2035）》（2026报告）

《自主集群系统的战略架构：多域集成、韧性及海上作战框架（2025-2035）》（2026报告）

专知会员服务

6+阅读 · 4月17日

前沿军事人工智能系统的理解与控制（报告1.8万字）

前沿军事人工智能系统的理解与控制（报告1.8万字）

专知会员服务

2+阅读 · 4月17日

《机器学习赋能情报工作：国家安全的机遇与风险》（报告）

《机器学习赋能情报工作：国家安全的机遇与风险》（报告）

专知会员服务

3+阅读 · 4月17日

《人工智能赋能电磁战》（报告）

《人工智能赋能电磁战》（报告）

专知会员服务

2+阅读 · 4月17日

《海基核巡航导弹（SLCM-N）部署后的威慑动态与操作要求》（报告）

《海基核巡航导弹（SLCM-N）部署后的威慑动态与操作要求》（报告）

专知会员服务

2+阅读 · 4月17日

超越卫星通信：战术无线电与网络防御如何锻造联盟韧性（美军报告）

超越卫星通信：战术无线电与网络防御如何锻造联盟韧性（美军报告）

专知会员服务

2+阅读 · 4月17日

【CMU博士论文】迈向可扩展的开放世界三维感知

【CMU博士论文】迈向可扩展的开放世界三维感知

专知会员服务

4+阅读 · 4月17日

相关VIP内容

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

推荐！《不确定性条件下的联合多域作战规划：自适应与模块化》最新174页博士论文

专知会员服务

48+阅读 · 2025年9月8日

基于因果推断的推荐系统去偏研究

基于因果推断的推荐系统去偏研究

专知会员服务

21+阅读 · 2024年11月10日

《多目标响应面可取性函数最优点评价的统计推断》2022最新295页博士论文【含代码】，美国空军技术学院

《多目标响应面可取性函数最优点评价的统计推断》2022最新295页博士论文【含代码】，美国空军技术学院

专知会员服务

29+阅读 · 2022年11月3日

多模态认知计算

多模态认知计算

专知会员服务

182+阅读 · 2022年9月16日

《异构观测数据中的联合因果推理》美国艾莫利大学、微软、约翰霍普金斯大学、哈佛大学、斯坦福大学等联合发表最新论文63页PDF

《异构观测数据中的联合因果推理》美国艾莫利大学、微软、约翰霍普金斯大学、哈佛大学、斯坦福大学等联合发表最新论文63页PDF

专知会员服务

29+阅读 · 2022年4月28日

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

专知会员服务

27+阅读 · 2022年3月22日

【IJCAI2020】通过双向对抗训练生成中间域样本提升半监督域自适应效果

【IJCAI2020】通过双向对抗训练生成中间域样本提升半监督域自适应效果

专知会员服务

35+阅读 · 2020年9月17日

【论文推荐】不同图像域弱监督语义分割的综合分析，A Comprehensive Analysis of Weakly-Supervised Semantic Segmentation in Different Image Domains

【论文推荐】不同图像域弱监督语义分割的综合分析，A Comprehensive Analysis of Weakly-Supervised Semantic Segmentation in Different Image Domains

专知会员服务

28+阅读 · 2019年12月27日

【KDD2019|讲座推荐】假设检验与统计声音模式挖掘：Hypothesis Testing and Statistically-sound Pattern Mining

【KDD2019|讲座推荐】假设检验与统计声音模式挖掘：Hypothesis Testing and Statistically-sound Pattern Mining

专知会员服务

22+阅读 · 2019年12月6日

【论文|CMU】用于多模序列学习的因数分解多模态变压器，Factorized Multimodal Transformer for Multimodal Sequential Learning

【论文|CMU】用于多模序列学习的因数分解多模态变压器，Factorized Multimodal Transformer for Multimodal Sequential Learning

专知会员服务

23+阅读 · 2019年11月26日

热门VIP内容

开通专知VIP会员享更多权益服务

《分布式军事人工智能理论：部分可观测与通信条件下的协调约束多智能体强化学习》

《迈向可解释强化学习及面向战略决策的定制化学习基准》（70页）

《面向战术决策的广义智能：大语言模型驱动的动态武器-目标分配》

《第四代军事特种作战部队选拔与评估》

相关资讯

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

专知

18+阅读 · 2022年9月9日

小样本也能增量学习？CVPR 2020 Oral最新干货：小样本类增量学习

小样本也能增量学习？CVPR 2020 Oral最新干货：小样本类增量学习

CVer

54+阅读 · 2020年5月1日

赛尔笔记 | 多模态信息抽取简述

赛尔笔记 | 多模态信息抽取简述

专知

29+阅读 · 2020年4月12日

【工大SCIR笔记】多模态信息抽取简述

【工大SCIR笔记】多模态信息抽取简述

深度学习自然语言处理

19+阅读 · 2020年4月3日

自动特征工程在推荐系统中的研究

自动特征工程在推荐系统中的研究

DataFunTalk

10+阅读 · 2019年12月20日

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

AINLP

38+阅读 · 2019年9月3日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

专知

12+阅读 · 2018年1月12日

【论文】变分推断（Variational inference)的总结

【论文】变分推断（Variational inference)的总结

机器学习研究会

39+阅读 · 2017年11月16日

回归预测&时间序列预测

回归预测&时间序列预测

GBASE数据工程部数据团队

44+阅读 · 2017年5月17日

相关论文

Detection of Multiple Influential Observations on Model Selection

Arxiv

0+阅读 · 3月15日

Adaptive and Stratified Subsampling for High-Dimensional Robust Estimation

Arxiv

0+阅读 · 3月10日

Two-Stage Decoding Algorithm and Bounds for Group Testing with Prior Statistics

Arxiv

0+阅读 · 2月28日

Efficient Targeted Maximum Likelihood Estimators for Two-Phase Design Problems

Arxiv

0+阅读 · 2月27日

Reducing Estimation Uncertainty Using Normalizing Flows and Stratification

Arxiv

0+阅读 · 2月12日

Two-phase validation sampling via principal components to improve efficiency in multi-model estimation from error-prone biomedical databases

Arxiv

0+阅读 · 2月11日

Generalized Prediction-Powered Inference, with Application to Binary Classifier Evaluation

Arxiv

0+阅读 · 2月10日

Meta-analysis of diagnostic test accuracy with multiple disease stages: combining stage-specific and merged-stage data

Arxiv

0+阅读 · 2月8日

Adaptive Off-Policy Inference for M-Estimators Under Model Misspecification

Arxiv

0+阅读 · 2月8日

Online conformal inference for multi-step time series forecasting

Arxiv

0+阅读 · 2月2日

相关基金

通信约束下间歇量测的多自主体系统趋同控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

M-矩阵（张量）最小特征值估计及其相关问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于复杂数据的回归模型统计推断及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

基于自适应采样和变复杂度近似的多学科稳健性设计优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于稀疏互质阵列的DOA估计算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

随机波动率模型的统计推断及数值解

国家自然科学基金

1+阅读 · 2015年12月31日

普适计算对象感知多模态不精确性数据融合算法研究

国家自然科学基金

5+阅读 · 2014年12月31日

相依回归模型与扩散过程的统计推断及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

概率抽样设计及其统计推断方法

国家自然科学基金

6+阅读 · 2014年12月31日

基于似然函数的统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员