Determining an appropriate sample size for a study is a crucial step in planning scientific research. Appropriate sample size planning avoids both inadequate and inflated sample sizes. Inflated sample sizes wastes resources, time and effort of human subjects, and lives of experimental animals. Inadequate sample sizes, a much more common problem, wastes even more resources through the inability to detect biologically meaningful differences and encourages questionable research practices like $p$-hacking. Microbiome studies are particularly challenged by small sample sizes, particularly in studies of human subjects or expensive animal models. In practice, the statistical power of taxa within a differential abundance study is influenced by the effect size (typically quantified as fold change), mean abundance of individual taxa, and the number of samples. We present a novel approach for sample size calculation for differential abundance studies as a function of effect size, mean abundance and statistical power of taxa. Our method is implemented in the power.nb R package, available at https://michaelagronah.com/power.nb/articles/stub.html. We applied our model for sample size calculation using estimates of mean abundance and fold change of taxa obtained from thirty real-world microbiome datasets. Our results showed that differential abundance microbiome studies require larger sample sizes than are currently prevalent in the literature to achieve adequate statistical power. Our framework will help researchers make informed decisions about appropriate sample sizes.


翻译:确定适当的研究样本量是科研规划中的关键步骤。合理的样本量规划可避免样本量不足或过度膨胀:过度膨胀的样本量会浪费资源、时间、受试者精力及实验动物生命;而样本量不足这一更普遍的问题不仅因无法检测生物学上有意义的差异而浪费更多资源,还会助长$p$-值操纵等可疑研究行为。微生物组研究尤其受小样本量困扰,在人类受试者或昂贵动物模型的研究中尤为突出。实践中,差异丰度研究中各分类群的统计效力受效应量(通常以倍数变化量化)、各分类群平均丰度及样本数量共同影响。我们提出了一种差异丰度研究中样本量估算的新方法,该方法可基于效应量、平均丰度及分类群统计效力进行函数化计算。本方法已通过power.nb R包实现,详见https://michaelagronah.com/power.nb/articles/stub.html。利用三十个真实微生物组数据集获得的分类群平均丰度与倍数变化估计值,我们将模型应用于样本量计算。结果表明:要获得足够的统计效力,差异丰度微生物组研究所需的样本量远大于当前文献普遍采用的规模。本框架将帮助研究人员就合理样本量做出明智决策。

0
下载
关闭预览

相关内容

多样化偏好优化
专知会员服务
12+阅读 · 2025年2月3日
专知会员服务
26+阅读 · 2021年5月23日
专知会员服务
204+阅读 · 2020年12月5日
【康奈尔大学】度量数据粒度,Measuring Dataset Granularity
专知会员服务
13+阅读 · 2019年12月27日
训练数据多少才够用
专知
16+阅读 · 2019年5月4日
小样本学习(Few-shot Learning)综述
机器之心
18+阅读 · 2019年4月1日
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
6+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
4+阅读 · 6月17日
相关VIP内容
多样化偏好优化
专知会员服务
12+阅读 · 2025年2月3日
专知会员服务
26+阅读 · 2021年5月23日
专知会员服务
204+阅读 · 2020年12月5日
【康奈尔大学】度量数据粒度,Measuring Dataset Granularity
专知会员服务
13+阅读 · 2019年12月27日
相关基金
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员