Prior-Free Sample Size Design for Test-and-Roll Experiments - 专知论文

会员服务 ·

0

样本 · 单元 · 设计 · 准则 · 设计方法 ·

Prior-Free Sample Size Design for Test-and-Roll Experiments

翻译：前置无关的测试与推广实验样本量设计方法

Kentaro Kawato,Shosei Sakaguchi

from arxiv, 54 pages, 5 figures

This paper studies sample-size design for finite-population test-and-roll experiments, where a decision-maker first conducts an experiment on $m$ units and then assigns the remaining $N-m$ units to the treatment that performs better in the experiment. We consider welfare-aware sample-size choice, which involves an exploration-exploitation tradeoff: larger experiments improve the rollout decision but impose welfare losses on experimental units assigned to the inferior treatment. We show that the standard absolute minimax regret criterion can lead to implausibly small experiments by over-penalizing exploration in its worst-case objective. To address this limitation, we propose the Worst-case Marginal Benefit (WMB) rule, which compares the worst-case marginal benefit of adding one more matched pair to the experiment with the corresponding marginal exploration cost. We establish a simple rule-of-thirds benchmark. For Bernoulli outcomes, after excluding pathological cases, the WMB criterion yields the optimal sample size of $m \approx N/3$ through a Gaussian approximation. For Gaussian outcomes with a known common variance, the same benchmark arises exactly. These results provide a prior-free and practically implementable guide for welfare-based sample-size design.

翻译：本文研究有限总体下测试与推广实验的样本量设计问题，其中决策者首先对 $m$ 个单元进行实验，随后将剩余的 $N-m$ 个单元分配给实验中表现更优的处理方案。我们考虑福利导向的样本量选择，这涉及到探索与利用之间的权衡：扩大实验规模虽能改进推广决策，但会因将实验单元分配至劣质处理方案而造成福利损失。研究表明，标准绝对极小化最大遗憾准则可能因在极端情形下过度惩罚探索行为，导致不合理的极小实验规模。为克服这一局限，我们提出最坏情形边际效益（WMB）准则，通过比较向实验额外增加一对匹配单元的最坏情形边际效益与相应的边际探索成本，建立简洁的三分律基准。对于伯努利型结果，在排除病态情形后，借助高斯近似可得WMB准则下的最优样本量为 $m \approx N/3$。对于已知公共方差的高斯型结果，同样可精确推导该基准。这些结果为基于福利的样本量设计提供了无需先验信息且可实际操作的指导方案。

0

相关内容

【牛津大学博士论文】通过增加推理计算量来改进大型语言模型的系统与方法

【牛津大学博士论文】通过增加推理计算量来改进大型语言模型的系统与方法

专知会员服务

16+阅读 · 2025年11月23日

《设计人机协作：一种充分统计量方法》最新72页

《设计人机协作：一种充分统计量方法》最新72页

专知会员服务

17+阅读 · 2025年7月7日

基于深度学习的小样本目标检测综述

基于深度学习的小样本目标检测综述

专知会员服务

35+阅读 · 2024年1月30日

小样本目标检测研究综述

小样本目标检测研究综述

专知会员服务

69+阅读 · 2023年8月6日

【ICML2022】基于少样本策略泛化的决策Transformer

【ICML2022】基于少样本策略泛化的决策Transformer

专知会员服务

37+阅读 · 2022年7月11日

小样本研究2022进展到哪了？华东师大最新《少样本学习》全面综述，从近三年200篇文献阐述小样本学习的演变、应用、挑战和机遇

小样本研究2022进展到哪了？华东师大最新《少样本学习》全面综述，从近三年200篇文献阐述小样本学习的演变、应用、挑战和机遇

专知会员服务

128+阅读 · 2022年5月19日

【ICML2021】学习一个通用模板的少样本数据集泛化

专知会员服务

26+阅读 · 2021年5月23日

【单样本(One-shot)学习】《One-shot learning》by Pragati Baheti Part 1/2: Definitions and fundamental techniques

【单样本(One-shot)学习】《One-shot learning》by Pragati Baheti Part 1/2: Definitions and fundamental techniques

专知会员服务

30+阅读 · 2020年4月22日

【香港科技大学】最新《小样本学习(Few-shot learning)》2020综述论文大全，34页pdf166篇参考文献

【香港科技大学】最新《小样本学习(Few-shot learning)》2020综述论文大全，34页pdf166篇参考文献

专知会员服务

210+阅读 · 2020年4月13日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知会员服务

61+阅读 · 2020年3月14日

论文浅尝 - ICML2020 | 通过关系图上的贝叶斯元学习进行少样本关系提取

论文浅尝 - ICML2020 | 通过关系图上的贝叶斯元学习进行少样本关系提取

开放知识图谱

16+阅读 · 2020年9月11日

【ICML2020】拉普拉斯正则化小样本学习，Laplacian Regularized Few-Shot Learning

【ICML2020】拉普拉斯正则化小样本学习，Laplacian Regularized Few-Shot Learning

专知

27+阅读 · 2020年7月3日

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知

12+阅读 · 2020年6月9日

小样本也能增量学习？CVPR 2020 Oral最新干货：小样本类增量学习

小样本也能增量学习？CVPR 2020 Oral最新干货：小样本类增量学习

CVer

54+阅读 · 2020年5月1日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

【三星AI-CVPR2020】增量小样本目标检测，Incremental Few-Shot Object Detection

【三星AI-CVPR2020】增量小样本目标检测，Incremental Few-Shot Object Detection

专知

55+阅读 · 2020年3月11日

【AAAI 2020论文】一种面向推荐的自适应margin对称度量学习方法

【AAAI 2020论文】一种面向推荐的自适应margin对称度量学习方法

专知

16+阅读 · 2019年12月29日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

小样本学习（Few-shot Learning）综述

小样本学习（Few-shot Learning）综述

机器之心

18+阅读 · 2019年4月1日

【领域报告】小样本学习年度进展|VALSE2018

【领域报告】小样本学习年度进展|VALSE2018

深度学习大讲堂

26+阅读 · 2018年6月14日

测量误差数据下部分线性模型有约束统计推断理论

国家自然科学基金

2+阅读 · 2015年12月31日

上下文无关文法在排列统计量研究中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

非参数核方法的样本外扩展研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于自适应采样和变复杂度近似的多学科稳健性设计优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维数据下多样本均值检验问题的研究

国家自然科学基金

0+阅读 · 2015年12月31日

试验设计中的模型选择

国家自然科学基金

6+阅读 · 2014年12月31日

多重比较中控制FDR的有效检验方法

国家自然科学基金

0+阅读 · 2014年12月31日

劣者淘汰两阶段自适应临床试验的设计和分析

国家自然科学基金

0+阅读 · 2014年12月31日

概率抽样设计及其统计推断方法

国家自然科学基金

6+阅读 · 2014年12月31日

基于似然函数的统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

Sample size calculations for multilevel factorial longitudinal cluster randomised trials

Arxiv

0+阅读 · 5月1日

Sample-efficient evidence estimation of score based priors for model selection

Arxiv

0+阅读 · 4月30日

Estimator-Aligned Prospective Sample Size Determination for Designs Using Inverse Probability of Treatment Weighting

Arxiv

0+阅读 · 4月23日

Beyond One-Size-Fits-All: Adaptive Test-Time Augmentation for Sequential Recommendation

Arxiv

0+阅读 · 4月17日

Adaptive Sample Size Simulations with R package adsasi

Arxiv

0+阅读 · 4月15日

Conformal Inference for Experimental Attrition in Social Science Research

Arxiv

0+阅读 · 4月10日

One-sample survival tests in the presence of non-proportional hazards in oncology clinical trials

Arxiv

0+阅读 · 4月9日

Distributionally balanced sampling designs via minimum tactical configurations

Arxiv

0+阅读 · 3月25日

Post-Experiment Decisions: The Dual Adjustments for Rollout and Downstream Optimizations

Arxiv

0+阅读 · 3月11日

From Asymptotic to Finite-Sample Minimax Robust Hypothesis Testing

Arxiv

0+阅读 · 2月23日

VIP会员

文章信息

相关主题

最新内容

【博士论文】面向可扩展且可信智能系统的强化学习

【博士论文】面向可扩展且可信智能系统的强化学习

专知会员服务

1+阅读 · 今天12:32

世界动作模型: 具身AI的下一个前沿

世界动作模型: 具身AI的下一个前沿

专知会员服务

1+阅读 · 今天12:28

全球十大防空反导系统：列表、射程与用途

全球十大防空反导系统：列表、射程与用途

专知会员服务

10+阅读 · 今天3:53

俄乌战争中的乌克兰一体化防空反导实战经验教训（5000字，中文版下载）

俄乌战争中的乌克兰一体化防空反导实战经验教训（5000字，中文版下载）

专知会员服务

20+阅读 · 今天3:03

集中式指挥、分布式控制、脱节训练？——统一作战管理架构是北约分布式作战与训练的关键（中文版PDF下载）

集中式指挥、分布式控制、脱节训练？——统一作战管理架构是北约分布式作战与训练的关键（中文版PDF下载）

专知会员服务

15+阅读 · 今天2:35

《实现协作自主：从人机团队到多智能体系统》190页

《实现协作自主：从人机团队到多智能体系统》190页

专知会员服务

11+阅读 · 今天2:31

《推进多智能体系统：面向可扩展与鲁棒的学习与控制》200页

《推进多智能体系统：面向可扩展与鲁棒的学习与控制》200页

专知会员服务

7+阅读 · 今天2:28

《基于事件相机的模拟与神经网络处理在自主空中加油中的应用》最新100页

《基于事件相机的模拟与神经网络处理在自主空中加油中的应用》最新100页

专知会员服务

8+阅读 · 今天2:25

[ICML 2026] SOL：让大模型把算力花在关键Token上：自优化语言模型

[ICML 2026] SOL：让大模型把算力花在关键Token上：自优化语言模型

专知会员服务

4+阅读 · 5月12日

人工智能解释公平性：统一框架、公理与负责任AI的未来方向

人工智能解释公平性：统一框架、公理与负责任AI的未来方向

专知会员服务

7+阅读 · 5月12日

《美军软件工厂案例研究：空军数字人才的人员需求》

《美军软件工厂案例研究：空军数字人才的人员需求》

专知会员服务

11+阅读 · 5月12日

《美国防部DevSecOps实践现状：软件工厂之现代战争的数字兵工厂》47页文件

《美国防部DevSecOps实践现状：软件工厂之现代战争的数字兵工厂》47页文件

专知会员服务

11+阅读 · 5月12日

有意义的人类指挥：迈向军事人机交互新模型探析（中文版PDF下载，2.5万字，2026年）

有意义的人类指挥：迈向军事人机交互新模型探析（中文版PDF下载，2.5万字，2026年）

专知会员服务

22+阅读 · 5月12日

《执行无人机蜂群任务：智能体增强大语言模型推理赋能无人机物联网》

《执行无人机蜂群任务：智能体增强大语言模型推理赋能无人机物联网》

专知会员服务

10+阅读 · 5月12日

下一代软件定义无线电：锻造现代战场的数字支柱

下一代软件定义无线电：锻造现代战场的数字支柱

专知会员服务

9+阅读 · 5月12日

相关VIP内容

【牛津大学博士论文】通过增加推理计算量来改进大型语言模型的系统与方法

【牛津大学博士论文】通过增加推理计算量来改进大型语言模型的系统与方法

专知会员服务

16+阅读 · 2025年11月23日

《设计人机协作：一种充分统计量方法》最新72页

《设计人机协作：一种充分统计量方法》最新72页

专知会员服务

17+阅读 · 2025年7月7日

基于深度学习的小样本目标检测综述

基于深度学习的小样本目标检测综述

专知会员服务

35+阅读 · 2024年1月30日

小样本目标检测研究综述

小样本目标检测研究综述

专知会员服务

69+阅读 · 2023年8月6日

【ICML2022】基于少样本策略泛化的决策Transformer

【ICML2022】基于少样本策略泛化的决策Transformer

专知会员服务

37+阅读 · 2022年7月11日

小样本研究2022进展到哪了？华东师大最新《少样本学习》全面综述，从近三年200篇文献阐述小样本学习的演变、应用、挑战和机遇

小样本研究2022进展到哪了？华东师大最新《少样本学习》全面综述，从近三年200篇文献阐述小样本学习的演变、应用、挑战和机遇

专知会员服务

128+阅读 · 2022年5月19日

【ICML2021】学习一个通用模板的少样本数据集泛化

专知会员服务

26+阅读 · 2021年5月23日

【单样本(One-shot)学习】《One-shot learning》by Pragati Baheti Part 1/2: Definitions and fundamental techniques

【单样本(One-shot)学习】《One-shot learning》by Pragati Baheti Part 1/2: Definitions and fundamental techniques

专知会员服务

30+阅读 · 2020年4月22日

【香港科技大学】最新《小样本学习(Few-shot learning)》2020综述论文大全，34页pdf166篇参考文献

【香港科技大学】最新《小样本学习(Few-shot learning)》2020综述论文大全，34页pdf166篇参考文献

专知会员服务

210+阅读 · 2020年4月13日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知会员服务

61+阅读 · 2020年3月14日

热门VIP内容

开通专知VIP会员享更多权益服务

世界动作模型: 具身AI的下一个前沿

俄乌战争中的乌克兰一体化防空反导实战经验教训（5000字，中文版下载）

【博士论文】面向可扩展且可信智能系统的强化学习

全球十大防空反导系统：列表、射程与用途

相关资讯

论文浅尝 - ICML2020 | 通过关系图上的贝叶斯元学习进行少样本关系提取

论文浅尝 - ICML2020 | 通过关系图上的贝叶斯元学习进行少样本关系提取

开放知识图谱

16+阅读 · 2020年9月11日

【ICML2020】拉普拉斯正则化小样本学习，Laplacian Regularized Few-Shot Learning

【ICML2020】拉普拉斯正则化小样本学习，Laplacian Regularized Few-Shot Learning

专知

27+阅读 · 2020年7月3日

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

【CVPR2020-北京大学】自适应间隔损失的提升小样本学习

专知

12+阅读 · 2020年6月9日

小样本也能增量学习？CVPR 2020 Oral最新干货：小样本类增量学习

小样本也能增量学习？CVPR 2020 Oral最新干货：小样本类增量学习

CVer

54+阅读 · 2020年5月1日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

【三星AI-CVPR2020】增量小样本目标检测，Incremental Few-Shot Object Detection

【三星AI-CVPR2020】增量小样本目标检测，Incremental Few-Shot Object Detection

专知

55+阅读 · 2020年3月11日

【AAAI 2020论文】一种面向推荐的自适应margin对称度量学习方法

【AAAI 2020论文】一种面向推荐的自适应margin对称度量学习方法

专知

16+阅读 · 2019年12月29日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

小样本学习（Few-shot Learning）综述

小样本学习（Few-shot Learning）综述

机器之心

18+阅读 · 2019年4月1日

【领域报告】小样本学习年度进展|VALSE2018

【领域报告】小样本学习年度进展|VALSE2018

深度学习大讲堂

26+阅读 · 2018年6月14日

相关论文

Sample size calculations for multilevel factorial longitudinal cluster randomised trials

Arxiv

0+阅读 · 5月1日

Sample-efficient evidence estimation of score based priors for model selection

Arxiv

0+阅读 · 4月30日

Estimator-Aligned Prospective Sample Size Determination for Designs Using Inverse Probability of Treatment Weighting

Arxiv

0+阅读 · 4月23日

Beyond One-Size-Fits-All: Adaptive Test-Time Augmentation for Sequential Recommendation

Arxiv

0+阅读 · 4月17日

Adaptive Sample Size Simulations with R package adsasi

Arxiv

0+阅读 · 4月15日

Conformal Inference for Experimental Attrition in Social Science Research

Arxiv

0+阅读 · 4月10日

One-sample survival tests in the presence of non-proportional hazards in oncology clinical trials

Arxiv

0+阅读 · 4月9日

Distributionally balanced sampling designs via minimum tactical configurations

Arxiv

0+阅读 · 3月25日

Post-Experiment Decisions: The Dual Adjustments for Rollout and Downstream Optimizations

Arxiv

0+阅读 · 3月11日

From Asymptotic to Finite-Sample Minimax Robust Hypothesis Testing

Arxiv

0+阅读 · 2月23日

相关基金

测量误差数据下部分线性模型有约束统计推断理论

国家自然科学基金

2+阅读 · 2015年12月31日

上下文无关文法在排列统计量研究中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

非参数核方法的样本外扩展研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于自适应采样和变复杂度近似的多学科稳健性设计优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维数据下多样本均值检验问题的研究

国家自然科学基金

0+阅读 · 2015年12月31日

试验设计中的模型选择

国家自然科学基金

6+阅读 · 2014年12月31日

多重比较中控制FDR的有效检验方法

国家自然科学基金

0+阅读 · 2014年12月31日

劣者淘汰两阶段自适应临床试验的设计和分析

国家自然科学基金

0+阅读 · 2014年12月31日

概率抽样设计及其统计推断方法

国家自然科学基金

6+阅读 · 2014年12月31日

基于似然函数的统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员