The Pivotal Information Criterion - 专知论文

会员服务 ·

0

准则 · PIC · 关键信息 · 拟合 · 最优 ·

The Pivotal Information Criterion

翻译：关键信息准则

Sylvain Sardy,Maxime van Cutsem,Sara van de Geer

The Bayesian and Akaike information criteria aim at finding a good balance between under- and over-fitting. They are extensively used every day by practitioners. Yet we contend they suffer from at least two afflictions: their penalty parameter $λ=\log n$ and $λ=2$ are too small, leading to many false discoveries, and their inherent (best subset) discrete optimization is infeasible in high dimension. We alleviate these issues with the pivotal information criterion: PIC is defined as a continuous optimization problem, and the PIC penalty parameter $λ$ is selected at the detection boundary (under pure noise). PIC's choice of $λ$ is the quantile of a statistic that we prove to be (asymptotically) pivotal, provided the loss function is appropriately transformed. As a result, simulations show a phase transition in the probability of exact support recovery with PIC, a phenomenon studied with no noise in compressed sensing. Applied on real data, for similar predictive performances, PIC selects the least complex model among state-of-the-art learners.

翻译：贝叶斯信息准则与赤池信息准则旨在平衡欠拟合与过拟合，被实践者广泛日常使用。然而我们认为它们至少存在两个缺陷：其惩罚参数λ=log n和λ=2过小，导致大量错误发现；其固有的（最优子集）离散优化在高维情况下不可行。我们通过提出关键信息准则来缓解这些问题：PIC被定义为连续优化问题，其惩罚参数λ在检测边界（纯噪声条件下）选取。PIC对λ的选择基于某个统计量的分位数，我们证明了该统计量（在渐近意义下）具有枢轴性，前提是损失函数经过适当变换。因此，模拟实验表明PIC在精确支撑恢复概率上呈现相变现象——这一现象在压缩感知的无噪声研究中已被探讨。应用于实际数据时，在预测性能相近的情况下，PIC从当前最优学习器中选出了复杂度最低的模型。

0

相关内容

【ICML2025】学习最优多模态信息瓶颈表示

【ICML2025】学习最优多模态信息瓶颈表示

专知会员服务

11+阅读 · 2025年5月28日

《军事情报分析标准》

《军事情报分析标准》

专知会员服务

41+阅读 · 2024年11月17日

《信息作为作战任务变量》

《信息作为作战任务变量》

专知会员服务

46+阅读 · 2024年5月14日

《关于信息完整性研究和开发优先事项的路线图》【信息战】2022.12最新73页报告，美国家科学技术委员会

《关于信息完整性研究和开发优先事项的路线图》【信息战】2022.12最新73页报告，美国家科学技术委员会

专知会员服务

20+阅读 · 2023年1月28日

《数据标准管理实践白皮书》，20页pdf，中国信息通信研究院云计算与大数据研究所

《数据标准管理实践白皮书》，20页pdf，中国信息通信研究院云计算与大数据研究所

专知会员服务

51+阅读 · 2022年5月31日

【经典书】信息论原理，774页pdf

【经典书】信息论原理，774页pdf

专知会员服务

265+阅读 · 2021年3月22日

【经典书】信息理论、推理和学习算法，640页pdf

【经典书】信息理论、推理和学习算法，640页pdf

专知会员服务

84+阅读 · 2020年9月21日

【硬核书】信息论，528页pdf，Information Theory and Coding by Example

【硬核书】信息论，528页pdf，Information Theory and Coding by Example

专知会员服务

151+阅读 · 2020年4月20日

贝叶斯分类器以及与互信息分类器—国科大UCAS胡包钢教授《信息论与机器学习》课程第七讲

贝叶斯分类器以及与互信息分类器—国科大UCAS胡包钢教授《信息论与机器学习》课程第七讲

专知会员服务

70+阅读 · 2020年3月30日

《信息技术人工智能面向机器学习的数据标注规程》，中国电子工业标准化技术协会

《信息技术人工智能面向机器学习的数据标注规程》，中国电子工业标准化技术协会

专知会员服务

60+阅读 · 2019年12月14日

什么是物理信息机器学习(PIML)？清华最新《基于物理信息的机器学习:问题、方法和应用》综述，42页pdf全面阐述PIML进展

什么是物理信息机器学习(PIML)？清华最新《基于物理信息的机器学习:问题、方法和应用》综述，42页pdf全面阐述PIML进展

专知

32+阅读 · 2022年11月16日

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

专知

18+阅读 · 2022年9月9日

重磅！国家标准《信息技术人工智能知识图谱技术框架》征求意见稿发布，35页pdf详细规定知识图谱技术框架

重磅！国家标准《信息技术人工智能知识图谱技术框架》征求意见稿发布，35页pdf详细规定知识图谱技术框架

专知

11+阅读 · 2022年2月19日

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

专知

27+阅读 · 2020年2月25日

《知识图谱标准化白皮书》发布，200页pdf，中国电子技术标准化研究院主编

《知识图谱标准化白皮书》发布，200页pdf，中国电子技术标准化研究院主编

专知

53+阅读 · 2019年9月16日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

最新36页《贝叶斯非参学习综述》，机器学习内功修炼手册

最新36页《贝叶斯非参学习综述》，机器学习内功修炼手册

专知

26+阅读 · 2019年2月27日

这有一份花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

这有一份花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

专知

42+阅读 · 2019年1月7日

学界 | 最大化互信息来学习深度表示，Bengio等提出Deep INFOMAX

学界 | 最大化互信息来学习深度表示，Bengio等提出Deep INFOMAX

机器之心

10+阅读 · 2018年9月6日

知识提取的一种应用，从上市公司年报中抽取因果关系

知识提取的一种应用，从上市公司年报中抽取因果关系

文因互联

10+阅读 · 2017年7月7日

面向海量高维数据的可深度结合的贝叶斯网学习与推理新方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

贝叶斯柔性密度方法及其在高维金融数据中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

信息不完全的双边匹配决策方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

关联规则集上的知识发现

国家自然科学基金

9+阅读 · 2015年12月31日

面向DS证据理论的关联信息融合研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于WEB信息的信息错误自动检测与修复技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

信息论学习中的正则化及相关高维数据分析方法的数学理论

国家自然科学基金

12+阅读 · 2014年12月31日

贝叶斯博弈关于信息结构的比较静态分析及应用

国家自然科学基金

1+阅读 · 2014年12月31日

A Sufficient-Statistic Reduction of the Information Bottleneck to a Low-Dimensional Problem

Arxiv

0+阅读 · 4月29日

Information-Theoretic Measures in AI: A Practical Decision Guide

Arxiv

0+阅读 · 4月26日

Exponential Error Bounds for Information Bottleneck Source Coding Problems

Arxiv

0+阅读 · 4月20日

Conserved active information

Arxiv

0+阅读 · 4月17日

Staying on Track: Efficient Trajectory Discovery with Adaptive Batch Sampling

Arxiv

0+阅读 · 4月15日

Trustworthy Feature Importance Avoids Unrestricted Permutations

Arxiv

0+阅读 · 4月13日

The Price of Competitive Information Disclosure

Arxiv

0+阅读 · 4月4日

A Bayesian Information-Theoretic Approach to Data Attribution

Arxiv

0+阅读 · 4月4日

An Exponential-Polynomial Divergence-based Robust Information Criterion for Linear Panel Data Models and Neural Networks

Arxiv

0+阅读 · 3月25日

Computation-Utility-Privacy Tradeoffs in Bayesian Estimation

Arxiv

0+阅读 · 3月18日

VIP会员

文章信息

相关主题

最新内容

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

专知会员服务

4+阅读 · 7月17日

《边缘端实时无线感知赋能现场多机器人部署》200页

《边缘端实时无线感知赋能现场多机器人部署》200页

专知会员服务

5+阅读 · 7月17日

战力倍增器：自主武器系统与乌克兰及加沙冲突

战力倍增器：自主武器系统与乌克兰及加沙冲突

专知会员服务

4+阅读 · 7月17日

人工智能赋能战场情报：提速决策进程

人工智能赋能战场情报：提速决策进程

专知会员服务

2+阅读 · 7月17日

《拥抱新兴技术：面向未来军官的教育革新》

《拥抱新兴技术：面向未来军官的教育革新》

专知会员服务

5+阅读 · 7月17日

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

专知会员服务

2+阅读 · 7月17日

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

专知会员服务

3+阅读 · 7月17日

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

专知会员服务

11+阅读 · 7月16日

《无人地面战车（UGV）的崛起》报告

《无人地面战车（UGV）的崛起》报告

专知会员服务

7+阅读 · 7月16日

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

专知会员服务

6+阅读 · 7月16日

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

专知会员服务

13+阅读 · 7月16日

美陆军任务式指挥人工智能解决方案

美陆军任务式指挥人工智能解决方案

专知会员服务

13+阅读 · 7月16日

ICML 2026 | 理论级自动形式化：从孤立命题到统一形式化知识库

ICML 2026 | 理论级自动形式化：从孤立命题到统一形式化知识库

专知会员服务

9+阅读 · 7月16日

综述 | 现代智能体自我改进，从模型更新到脚手架演化

综述 | 现代智能体自我改进，从模型更新到脚手架演化

专知会员服务

16+阅读 · 7月16日

美国陆军宣布“项目融合-顶点6”：现代化进程的关键里程碑

美国陆军宣布“项目融合-顶点6”：现代化进程的关键里程碑

专知会员服务

13+阅读 · 7月15日

相关VIP内容

【ICML2025】学习最优多模态信息瓶颈表示

【ICML2025】学习最优多模态信息瓶颈表示

专知会员服务

11+阅读 · 2025年5月28日

《军事情报分析标准》

《军事情报分析标准》

专知会员服务

41+阅读 · 2024年11月17日

《信息作为作战任务变量》

《信息作为作战任务变量》

专知会员服务

46+阅读 · 2024年5月14日

《关于信息完整性研究和开发优先事项的路线图》【信息战】2022.12最新73页报告，美国家科学技术委员会

《关于信息完整性研究和开发优先事项的路线图》【信息战】2022.12最新73页报告，美国家科学技术委员会

专知会员服务

20+阅读 · 2023年1月28日

《数据标准管理实践白皮书》，20页pdf，中国信息通信研究院云计算与大数据研究所

《数据标准管理实践白皮书》，20页pdf，中国信息通信研究院云计算与大数据研究所

专知会员服务

51+阅读 · 2022年5月31日

【经典书】信息论原理，774页pdf

【经典书】信息论原理，774页pdf

专知会员服务

265+阅读 · 2021年3月22日

【经典书】信息理论、推理和学习算法，640页pdf

【经典书】信息理论、推理和学习算法，640页pdf

专知会员服务

84+阅读 · 2020年9月21日

【硬核书】信息论，528页pdf，Information Theory and Coding by Example

【硬核书】信息论，528页pdf，Information Theory and Coding by Example

专知会员服务

151+阅读 · 2020年4月20日

贝叶斯分类器以及与互信息分类器—国科大UCAS胡包钢教授《信息论与机器学习》课程第七讲

贝叶斯分类器以及与互信息分类器—国科大UCAS胡包钢教授《信息论与机器学习》课程第七讲

专知会员服务

70+阅读 · 2020年3月30日

《信息技术人工智能面向机器学习的数据标注规程》，中国电子工业标准化技术协会

《信息技术人工智能面向机器学习的数据标注规程》，中国电子工业标准化技术协会

专知会员服务

60+阅读 · 2019年12月14日

热门VIP内容

开通专知VIP会员享更多权益服务

《边缘端实时无线感知赋能现场多机器人部署》200页

人工智能赋能战场情报：提速决策进程

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

战力倍增器：自主武器系统与乌克兰及加沙冲突

相关资讯

什么是物理信息机器学习(PIML)？清华最新《基于物理信息的机器学习:问题、方法和应用》综述，42页pdf全面阐述PIML进展

什么是物理信息机器学习(PIML)？清华最新《基于物理信息的机器学习:问题、方法和应用》综述，42页pdf全面阐述PIML进展

专知

32+阅读 · 2022年11月16日

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

国家标准《信息技术大数据数据资产价值评估》（征求意见稿）

专知

18+阅读 · 2022年9月9日

重磅！国家标准《信息技术人工智能知识图谱技术框架》征求意见稿发布，35页pdf详细规定知识图谱技术框架

重磅！国家标准《信息技术人工智能知识图谱技术框架》征求意见稿发布，35页pdf详细规定知识图谱技术框架

专知

11+阅读 · 2022年2月19日

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

【纽约大学】贝叶斯深度学习和泛化性的概率观点，附27页PPT下载

专知

27+阅读 · 2020年2月25日

《知识图谱标准化白皮书》发布，200页pdf，中国电子技术标准化研究院主编

《知识图谱标准化白皮书》发布，200页pdf，中国电子技术标准化研究院主编

专知

53+阅读 · 2019年9月16日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

最新36页《贝叶斯非参学习综述》，机器学习内功修炼手册

最新36页《贝叶斯非参学习综述》，机器学习内功修炼手册

专知

26+阅读 · 2019年2月27日

这有一份花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

这有一份花书《深度学习》笔记，深度学习规则，帮你抓住精髓！(附下载)

专知

42+阅读 · 2019年1月7日

学界 | 最大化互信息来学习深度表示，Bengio等提出Deep INFOMAX

学界 | 最大化互信息来学习深度表示，Bengio等提出Deep INFOMAX

机器之心

10+阅读 · 2018年9月6日

知识提取的一种应用，从上市公司年报中抽取因果关系

知识提取的一种应用，从上市公司年报中抽取因果关系

文因互联

10+阅读 · 2017年7月7日

相关论文

A Sufficient-Statistic Reduction of the Information Bottleneck to a Low-Dimensional Problem

Arxiv

0+阅读 · 4月29日

Information-Theoretic Measures in AI: A Practical Decision Guide

Arxiv

0+阅读 · 4月26日

Exponential Error Bounds for Information Bottleneck Source Coding Problems

Arxiv

0+阅读 · 4月20日

Conserved active information

Arxiv

0+阅读 · 4月17日

Staying on Track: Efficient Trajectory Discovery with Adaptive Batch Sampling

Arxiv

0+阅读 · 4月15日

Trustworthy Feature Importance Avoids Unrestricted Permutations

Arxiv

0+阅读 · 4月13日

The Price of Competitive Information Disclosure

Arxiv

0+阅读 · 4月4日

A Bayesian Information-Theoretic Approach to Data Attribution

Arxiv

0+阅读 · 4月4日

An Exponential-Polynomial Divergence-based Robust Information Criterion for Linear Panel Data Models and Neural Networks

Arxiv

0+阅读 · 3月25日

Computation-Utility-Privacy Tradeoffs in Bayesian Estimation

Arxiv

0+阅读 · 3月18日

相关基金

面向海量高维数据的可深度结合的贝叶斯网学习与推理新方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

贝叶斯柔性密度方法及其在高维金融数据中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

信息不完全的双边匹配决策方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

关联规则集上的知识发现

国家自然科学基金

9+阅读 · 2015年12月31日

面向DS证据理论的关联信息融合研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于WEB信息的信息错误自动检测与修复技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

信息论学习中的正则化及相关高维数据分析方法的数学理论

国家自然科学基金

12+阅读 · 2014年12月31日

贝叶斯博弈关于信息结构的比较静态分析及应用

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员