The Bayesian and Akaike information criteria aim at finding a good balance between under- and over-fitting. They are extensively used every day by practitioners. Yet we contend they suffer from at least two afflictions: their penalty parameter $λ=\log n$ and $λ=2$ are too small, leading to many false discoveries, and their inherent (best subset) discrete optimization is infeasible in high dimension. We alleviate these issues with the pivotal information criterion: PIC is defined as a continuous optimization problem, and the PIC penalty parameter $λ$ is selected at the detection boundary (under pure noise). PIC's choice of $λ$ is the quantile of a statistic that we prove to be (asymptotically) pivotal, provided the loss function is appropriately transformed. As a result, simulations show a phase transition in the probability of exact support recovery with PIC, a phenomenon studied with no noise in compressed sensing. Applied on real data, for similar predictive performances, PIC selects the least complex model among state-of-the-art learners.


翻译:贝叶斯信息准则与赤池信息准则旨在欠拟合与过拟合之间寻求良好平衡,这些准则已被实践工作者广泛使用。然而我们认为它们至少存在两个缺陷:其惩罚参数 $λ=\log n$ 与 $λ=2$ 取值过小,导致大量错误发现;且其固有的(最优子集)离散优化问题在高维情形下不可行。我们通过关键信息准则缓解这些问题:PIC 被定义为一个连续优化问题,其惩罚参数 $λ$ 在检测边界(纯噪声条件下)被选定。PIC 对 $λ$ 的选择基于某统计量的分位数,我们证明在损失函数经过适当变换后,该统计量具有(渐近)关键性。实验结果显示,PIC 在精确支撑恢复概率上呈现相变现象,该现象在压缩感知的无噪声研究中已被探讨。在实际数据应用中,在预测性能相近的情况下,PIC 能从当前先进学习器中选出复杂度最低的模型。

0
下载
关闭预览

相关内容

《信息作为作战任务变量》
专知会员服务
45+阅读 · 2024年5月14日
【经典书】信息论原理,774页pdf
专知会员服务
265+阅读 · 2021年3月22日
【经典书】信息理论、推理和学习算法,640页pdf
专知会员服务
84+阅读 · 2020年9月21日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2月22日
Arxiv
0+阅读 · 2月19日
Arxiv
0+阅读 · 2月16日
Arxiv
0+阅读 · 2月10日
Arxiv
0+阅读 · 2月10日
VIP会员
最新内容
超越网格:作战环境对炮兵的影响
专知会员服务
1+阅读 · 今天15:35
KDD 2026 | MixRAGRec:面向LLM推荐的混合专家KG-RAG框架
BES:让语言模型通过双向进化搜索自我改进
专知会员服务
4+阅读 · 5月30日
以色列-美国-伊朗战争中的无人机:关键要点
专知会员服务
4+阅读 · 5月30日
《Palantir任务保障性软件安全标准(MA-S2)》
专知会员服务
14+阅读 · 5月30日
基于声学的无人机检测技术综述
专知会员服务
8+阅读 · 5月30日
《当代混合战争分析框架:俄乌战争经验教训》
相关基金
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员