A common task in high-throughput biology is to test for differences in means between two samples across thousands of features (e.g., genes or proteins), often with only a handful of replicates per sample. Moderated t-tests handle this problem by assuming normality and equal variances, and by applying the empirical partially Bayes principle: a prior is posited and estimated for the nuisance parameters (variances) but not for the primary parameters (means). This approach has been highly successful in genomics, yet the equal variance assumption is often violated in practice. Meanwhile, Welch's unequal variance t-test with few replicates suffers from inflated type-I error and low power. Taking inspiration from moderated t-tests, we extend the empirical partially Bayes paradigm to two-sample testing with unequal variances. We develop two procedures: one that models the ratio of the two sample-specific variances and another that models the two variances jointly, with prior distributions estimated by nonparametric maximum likelihood. Our empirical partially Bayes methods yield p-values that are asymptotically uniform as the number of features grows while the number of replicates remains fixed, ensuring asymptotic type-I error control. Simulations and applications to genomic data demonstrate substantial gains in power.


翻译:在高通量生物学中,一项常见任务是对两个样本在数千个特征(如基因或蛋白质)上的均值差异进行检验,而每个样本通常仅有少量重复观测。调节t检验通过假设正态性和等方差性,并应用经验性部分贝叶斯原理来处理这一问题:对冗余参数(方差)设定并估计先验分布,但对主要参数(均值)则不设定先验。该方法在基因组学中取得了巨大成功,然而等方差假设在实践中常被违反。同时,针对少量重复观测的韦尔奇不等方差t检验则存在I类错误膨胀和检验功效低下的问题。受调节t检验的启发,我们将经验性部分贝叶斯范式推广至不等方差条件下的双样本检验。我们提出了两种方法:一种对两个样本特异性方差的比值进行建模,另一种则对方差进行联合建模,其先验分布通过非参数最大似然估计得到。我们的经验性部分贝叶斯方法所产生的p值,在特征数量增长而重复观测数保持固定时,具有渐近均匀性,从而保证了渐近的I类错误控制。模拟实验及在基因组数据上的应用均表明,该方法能显著提升检验功效。

0
下载
关闭预览

相关内容

【ACL2020】多模态信息抽取,365页ppt
专知会员服务
151+阅读 · 2020年7月6日
专知会员服务
55+阅读 · 2020年3月16日
FlowQA: Grasping Flow in History for Conversational Machine Comprehension
专知会员服务
34+阅读 · 2019年10月18日
《DeepGCNs: Making GCNs Go as Deep as CNNs》
专知会员服务
32+阅读 · 2019年10月17日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
164+阅读 · 2019年10月12日
强化学习最新教程,17页pdf
专知会员服务
182+阅读 · 2019年10月11日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
41+阅读 · 2019年10月9日
RL解决'BipedalWalkerHardcore-v2' (SOTA)
CreateAMind
31+阅读 · 2019年7月17日
强化学习的Unsupervised Meta-Learning
CreateAMind
18+阅读 · 2019年1月7日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
利用动态深度学习预测金融时间序列基于Python
量化投资与机器学习
18+阅读 · 2018年10月30日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
STRCF for Visual Object Tracking
统计学习与视觉计算组
15+阅读 · 2018年5月29日
Focal Loss for Dense Object Detection
统计学习与视觉计算组
12+阅读 · 2018年3月15日
From Softmax to Sparsemax-ICML16(1)
KingsGarden
74+阅读 · 2016年11月26日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Arxiv
69+阅读 · 2022年9月7日
Arxiv
16+阅读 · 2022年5月17日
Arxiv
18+阅读 · 2021年3月16日
A survey on deep hashing for image retrieval
Arxiv
15+阅读 · 2020年6月10日
Phase-aware Speech Enhancement with Deep Complex U-Net
VIP会员
相关资讯
RL解决'BipedalWalkerHardcore-v2' (SOTA)
CreateAMind
31+阅读 · 2019年7月17日
强化学习的Unsupervised Meta-Learning
CreateAMind
18+阅读 · 2019年1月7日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
利用动态深度学习预测金融时间序列基于Python
量化投资与机器学习
18+阅读 · 2018年10月30日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
STRCF for Visual Object Tracking
统计学习与视觉计算组
15+阅读 · 2018年5月29日
Focal Loss for Dense Object Detection
统计学习与视觉计算组
12+阅读 · 2018年3月15日
From Softmax to Sparsemax-ICML16(1)
KingsGarden
74+阅读 · 2016年11月26日
相关论文
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员