A pervasive methodological error is the post-hoc interpretation of $p$-values. A $p$-value $p$ is not the level at which we reject the null, it is the level at which we would have rejected the null had we chosen level $p$. We introduce post-hoc $p$-values, that do admit this interpretation. We show that $p$ is a post-hoc $p$-value if and only if $1/p$ is an $e$-value. This implies that the product of independent post-hoc $p$-values is a post-hoc $p$-value, making them easy to combine. If we permit external randomization, we find any non-randomized post-hoc $p$-value can be trivially improved. However, we find only (essentially) non-randomized post-hoc $p$-values can be arbitrarily merged through multiplication. Our results extend to post-hoc anytime validity in a sequential setting. Moreover, we introduce two-way post-hoc $p$-values, whose reciprocal is also post-hoc under the alternative. Likelihood ratios are two-way post-hoc $p$-values, which supports their 'direct' interpretation often purported in the context of Bayes factors and links their interpretation to post-hoc $p$-values. Finally, we extend to geometric post-hoc validity and show that GRO $e$-values are the reciprocal of post-hoc $p$-values that minimize the geometric post-hoc error under the alternative.


翻译:一种普遍的方法论错误是对$p$值的事后解释。$p$值$p$并非我们拒绝原假设的显著性水平,而是若我们选择水平$p$时本应拒绝原假设的水平。我们引入了事后$p$值,它确实允许这种解释。我们证明$p$是事后$p$值当且仅当$1/p$是一个$e$值。这意味着独立事后$p$值的乘积仍为事后$p$值,从而便于合并。如果允许外部随机化,我们发现任何非随机化的事后$p$值都可以被平凡地改进。然而,我们发现只有(本质上)非随机化的事后$p$值才能通过乘法任意合并。我们的结果扩展到了序列设定中的事后任意有效性。此外,我们引入了双向事后$p$值,其倒数在备择假设下也是事后有效的。似然比是双向事后$p$值,这支持了其在贝叶斯因子背景下常被宣称的“直接”解释,并将其解释与事后$p$值联系起来。最后,我们将之扩展到几何事后有效性,并证明GRO $e$值是在备择假设下最小化几何事后误差的事后$p$值的倒数。

0
下载
关闭预览

相关内容

FlowQA: Grasping Flow in History for Conversational Machine Comprehension
专知会员服务
34+阅读 · 2019年10月18日
Stabilizing Transformers for Reinforcement Learning
专知会员服务
60+阅读 · 2019年10月17日
《DeepGCNs: Making GCNs Go as Deep as CNNs》
专知会员服务
32+阅读 · 2019年10月17日
Keras François Chollet 《Deep Learning with Python 》, 386页pdf
专知会员服务
164+阅读 · 2019年10月12日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
41+阅读 · 2019年10月9日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
18+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
44+阅读 · 2019年1月3日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
STRCF for Visual Object Tracking
统计学习与视觉计算组
15+阅读 · 2018年5月29日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
Focal Loss for Dense Object Detection
统计学习与视觉计算组
12+阅读 · 2018年3月15日
IJCAI | Cascade Dynamics Modeling with Attention-based RNN
KingsGarden
13+阅读 · 2017年7月16日
From Softmax to Sparsemax-ICML16(1)
KingsGarden
74+阅读 · 2016年11月26日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2024年2月12日
Arxiv
0+阅读 · 2024年2月12日
Arxiv
0+阅读 · 2024年2月12日
Arxiv
0+阅读 · 2024年2月12日
Arxiv
0+阅读 · 2024年2月11日
Arxiv
0+阅读 · 2024年2月11日
Arxiv
0+阅读 · 2024年2月9日
Arxiv
0+阅读 · 2024年2月8日
UNITER: Learning UNiversal Image-TExt Representations
Arxiv
23+阅读 · 2019年9月25日
VIP会员
最新内容
马赛克战:俄乌战场透析
专知会员服务
10+阅读 · 今天4:12
《利用人工智能增强军事决策》
专知会员服务
2+阅读 · 今天4:09
《自动机器学习在军事数据耕耘法中的应用》
专知会员服务
4+阅读 · 今天4:02
为何指挥所生存能力要求范式转变
专知会员服务
2+阅读 · 今天3:54
打造“新蛛网”模式与高科技动员
专知会员服务
2+阅读 · 今天3:33
“蛛网”行动一周年:远程无人机战争
专知会员服务
2+阅读 · 今天3:23
【剑桥博士论文】智能体-环境协同优化
专知会员服务
6+阅读 · 6月9日
为初级军官战术训练设计生成式人工智能平台
专知会员服务
8+阅读 · 6月9日
《美军条令:作战伤员后送保障》
专知会员服务
6+阅读 · 6月9日
相关资讯
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
强化学习的Unsupervised Meta-Learning
CreateAMind
18+阅读 · 2019年1月7日
Unsupervised Learning via Meta-Learning
CreateAMind
44+阅读 · 2019年1月3日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
STRCF for Visual Object Tracking
统计学习与视觉计算组
15+阅读 · 2018年5月29日
Hierarchical Imitation - Reinforcement Learning
CreateAMind
19+阅读 · 2018年5月25日
Focal Loss for Dense Object Detection
统计学习与视觉计算组
12+阅读 · 2018年3月15日
IJCAI | Cascade Dynamics Modeling with Attention-based RNN
KingsGarden
13+阅读 · 2017年7月16日
From Softmax to Sparsemax-ICML16(1)
KingsGarden
74+阅读 · 2016年11月26日
相关论文
Arxiv
0+阅读 · 2024年2月12日
Arxiv
0+阅读 · 2024年2月12日
Arxiv
0+阅读 · 2024年2月12日
Arxiv
0+阅读 · 2024年2月12日
Arxiv
0+阅读 · 2024年2月11日
Arxiv
0+阅读 · 2024年2月11日
Arxiv
0+阅读 · 2024年2月9日
Arxiv
0+阅读 · 2024年2月8日
UNITER: Learning UNiversal Image-TExt Representations
Arxiv
23+阅读 · 2019年9月25日
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员