Takeuchi's Information Criteria as Generalization Measures for DNNs Close to NTK Regime - 专知论文

会员服务 ·

0

泛化 · 度量 · 准则 · 相关性 · 深度神经网络 ·

Takeuchi's Information Criteria as Generalization Measures for DNNs Close to NTK Regime

翻译：竹内信息准则作为接近NTK机制深度神经网络泛化度量指标的研究

Hiroki Naganuma,Taiji Suzuki,Rio Yokota,Masahiro Nomura,Kohta Ishikawa,Ikuro Sato

Generalization measures have been studied extensively in the machine learning community to better characterize generalization gaps. However, establishing a reliable generalization measure for statistically singular models such as deep neural networks (DNNs) is difficult due to their complex nature. This study focuses on Takeuchi's information criterion (TIC) to investigate the conditions under which this classical measure can effectively explain the generalization gaps of DNNs. Importantly, the developed theory indicates the applicability of TIC near the neural tangent kernel (NTK) regime. In a series of experiments, we trained more than 5,000 DNN models with 12 architectures, including large models (e.g., VGG-16), on four datasets, and estimated the corresponding TIC values to examine the relationship between the generalization gap and the TIC estimates. We applied several TIC approximation methods with feasible computational costs and assessed the accuracy trade-off. Our experimental results indicate that the estimated TIC values correlate well with the generalization gap under conditions close to the NTK regime. However, we show both theoretically and empirically that outside the NTK regime such correlation disappears. Finally, we demonstrate that TIC provides better trial pruning ability than existing methods for hyperparameter optimization.

翻译：泛化度量指标在机器学习领域被广泛研究，以更好地刻画泛化差距。然而，由于深度神经网络（DNNs）的复杂特性，为这类统计奇异模型建立可靠的泛化度量指标具有挑战性。本研究聚焦于竹内信息准则（TIC），探讨这一经典度量指标在何种条件下能有效解释DNNs的泛化差距。值得注意的是，所发展的理论表明TIC在接近神经正切核（NTK）机制的区域具有适用性。通过一系列实验，我们在四个数据集上训练了超过5,000个包含12种架构的DNN模型（包括VGG-16等大型模型），并估计了相应的TIC值以检验泛化差距与TIC估计值之间的关系。我们采用多种计算成本可行的TIC近似方法，并评估了其精度权衡。实验结果表明，在接近NTK机制的条件下，估计的TIC值与泛化差距呈现良好相关性。然而，我们从理论和实验两方面证明，在NTK机制之外这种相关性会消失。最后，我们论证了TIC在超参数优化方面比现有方法具有更优的试验剪枝能力。

0

相关内容

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

专知会员服务

27+阅读 · 2025年2月4日

【博士论文】从噪声数据中深度学习的信息特征和示例的优先排序，94页pdf

【博士论文】从噪声数据中深度学习的信息特征和示例的优先排序，94页pdf

专知会员服务

32+阅读 · 2024年3月11日

GNN如何处理表格？NCKU等最新《图神经网络表格数据学习》综述，详述其技术体系和方向

GNN如何处理表格？NCKU等最新《图神经网络表格数据学习》综述，详述其技术体系和方向

专知会员服务

37+阅读 · 2024年1月6日

更透明的AI？MIT等最新《可解释AI: 深度神经网络内部结构解释》综述，17页pdf全面阐述DNN内部可解释性技术

更透明的AI？MIT等最新《可解释AI: 深度神经网络内部结构解释》综述，17页pdf全面阐述DNN内部可解释性技术

专知会员服务

87+阅读 · 2022年8月11日

GNN如何可解释？悉尼科大最新《可解释图神经网络研究》综述，全面阐述可解释GNN的方法与评价指标

GNN如何可解释？悉尼科大最新《可解释图神经网络研究》综述，全面阐述可解释GNN的方法与评价指标

专知会员服务

112+阅读 · 2022年7月28日

【ICML2021】DNN概率表示:桥接互信息和泛化

专知会员服务

23+阅读 · 2021年6月22日

最新《大间隔学习》综述论文，清华大学张长水老师等

专知会员服务

19+阅读 · 2021年4月3日

到底什么是GNN？《图神经网络理论基础》这份DeepMind大牛Petar讲授，附96页ppt与视频

到底什么是GNN？《图神经网络理论基础》这份DeepMind大牛Petar讲授，附96页ppt与视频

专知会员服务

87+阅读 · 2021年2月26日

【KDD2020】可解释深度神经网络，200页ppt

专知会员服务

171+阅读 · 2020年8月26日

最大均方差正则化贝叶斯神经网络，Bayesian Neural Networks With Maximum Mean Discrepancy Regularization

最大均方差正则化贝叶斯神经网络，Bayesian Neural Networks With Maximum Mean Discrepancy Regularization

专知会员服务

54+阅读 · 2020年3月5日

更透明的AI？MIT等最新《可解释AI: 深度神经网络内部结构解释》综述，17页pdf全面阐述DNN内部可解释性技术

更透明的AI？MIT等最新《可解释AI: 深度神经网络内部结构解释》综述，17页pdf全面阐述DNN内部可解释性技术

专知

13+阅读 · 2022年8月11日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

17+阅读 · 2020年6月7日

基于深度神经网络的关键词提取，Keywords extraction with DNN

基于深度神经网络的关键词提取，Keywords extraction with DNN

专知

10+阅读 · 2020年5月7日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

【荟萃】图神经网络论文列表，包含GNN理论及其在NLP和CV等领域的应用

【荟萃】图神经网络论文列表，包含GNN理论及其在NLP和CV等领域的应用

专知

45+阅读 · 2019年3月26日

7个实用的深度学习技巧

7个实用的深度学习技巧

机器学习算法与Python学习

16+阅读 · 2019年3月6日

深度学习中的五大正则化方法和七大优化策略

深度学习中的五大正则化方法和七大优化策略

全球人工智能

11+阅读 · 2017年12月25日

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

6+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

随机广义纳什均衡问题的研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

数据内在结构和稀疏保持的大间隔分类方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

信息论学习中的正则化及相关高维数据分析方法的数学理论

国家自然科学基金

12+阅读 · 2014年12月31日

多尺度NED/DEM生成的数字综合理论和关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

Inference for Deep Neural Network Estimators in Generalized Nonparametric Models

Arxiv

0+阅读 · 3月17日

Variational Deep Learning via Implicit Regularization

Arxiv

0+阅读 · 3月13日

Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

Arxiv

0+阅读 · 3月11日

SigmaQuant: Hardware-Aware Heterogeneous Quantization Method for Edge DNN Inference

Arxiv

0+阅读 · 3月3日

Conjugate Learning Theory: Uncovering the Mechanisms of Trainability and Generalization in Deep Neural Networks

Arxiv

0+阅读 · 2月19日

Benchmarking Stochastic Approximation Algorithms for Fairness-Constrained Training of Deep Neural Networks

Arxiv

0+阅读 · 2月18日

A unified theory of feature learning in RNNs and DNNs

Arxiv

0+阅读 · 2月17日

Explainability-Inspired Layer-Wise Pruning of Deep Neural Networks for Efficient Object Detection

Arxiv

0+阅读 · 2月15日

Position: Many generalization measures for deep learning are fragile

Arxiv

0+阅读 · 2月11日

Regularisation in neural networks: a survey and empirical analysis of approaches

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

深度神经网络

最新内容

美国当前高超音速导弹发展概述

美国当前高超音速导弹发展概述

专知会员服务

4+阅读 · 4月19日

《高超音速武器：一项再度兴起的技术》120页slides

《高超音速武器：一项再度兴起的技术》120页slides

专知会员服务

8+阅读 · 4月19日

无人机蜂群建模与仿真方法

无人机蜂群建模与仿真方法

专知会员服务

6+阅读 · 4月19日

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

专知会员服务

3+阅读 · 4月19日

《量化反无人机系统对抗无人机蜂群效能的创新方法》

《量化反无人机系统对抗无人机蜂群效能的创新方法》

专知会员服务

6+阅读 · 4月19日

澳大利亚发布《国防战略（2026年）》

澳大利亚发布《国防战略（2026年）》

专知会员服务

2+阅读 · 4月19日

【CMU博士论文】迈向基于基础先验的 4D 感知研究

【CMU博士论文】迈向基于基础先验的 4D 感知研究

专知会员服务

2+阅读 · 4月19日

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

大语言模型智能体中的外显化机制：记忆、技能、协议与评测基准工程综述

专知会员服务

3+阅读 · 4月19日

全球高超音速武器最新发展趋势

全球高超音速武器最新发展趋势

专知会员服务

2+阅读 · 4月19日

《利用大语言模型增强多域作战兵棋推演》（报告）

《利用大语言模型增强多域作战兵棋推演》（报告）

专知会员服务

12+阅读 · 4月18日

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

《增强准备状态与战备水平：态势感知与数据驱动决策》报告

专知会员服务

11+阅读 · 4月18日

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

中文版《可靠定位、导航与授时 (APNT)：美军相关研发项目》报告

专知会员服务

9+阅读 · 4月18日

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

《自主武器系统人类-AI指挥控制中的动态管理》（2026最新450页）

专知会员服务

17+阅读 · 4月18日

美智库《实现空军战斗出动架次生成能力：对目标、差距、障碍与解决方案的审视》（报告）

美智库《实现空军战斗出动架次生成能力：对目标、差距、障碍与解决方案的审视》（报告）

专知会员服务

8+阅读 · 4月18日

《大规模作战行动中争夺情报优势：情报与电子战营-下一代角色探析》（报告）

《大规模作战行动中争夺情报优势：情报与电子战营-下一代角色探析》（报告）

专知会员服务

10+阅读 · 4月18日

相关VIP内容

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

专知会员服务

27+阅读 · 2025年2月4日

【博士论文】从噪声数据中深度学习的信息特征和示例的优先排序，94页pdf

【博士论文】从噪声数据中深度学习的信息特征和示例的优先排序，94页pdf

专知会员服务

32+阅读 · 2024年3月11日

GNN如何处理表格？NCKU等最新《图神经网络表格数据学习》综述，详述其技术体系和方向

GNN如何处理表格？NCKU等最新《图神经网络表格数据学习》综述，详述其技术体系和方向

专知会员服务

37+阅读 · 2024年1月6日

更透明的AI？MIT等最新《可解释AI: 深度神经网络内部结构解释》综述，17页pdf全面阐述DNN内部可解释性技术

更透明的AI？MIT等最新《可解释AI: 深度神经网络内部结构解释》综述，17页pdf全面阐述DNN内部可解释性技术

专知会员服务

87+阅读 · 2022年8月11日

GNN如何可解释？悉尼科大最新《可解释图神经网络研究》综述，全面阐述可解释GNN的方法与评价指标

GNN如何可解释？悉尼科大最新《可解释图神经网络研究》综述，全面阐述可解释GNN的方法与评价指标

专知会员服务

112+阅读 · 2022年7月28日

【ICML2021】DNN概率表示:桥接互信息和泛化

专知会员服务

23+阅读 · 2021年6月22日

最新《大间隔学习》综述论文，清华大学张长水老师等

专知会员服务

19+阅读 · 2021年4月3日

到底什么是GNN？《图神经网络理论基础》这份DeepMind大牛Petar讲授，附96页ppt与视频

到底什么是GNN？《图神经网络理论基础》这份DeepMind大牛Petar讲授，附96页ppt与视频

专知会员服务

87+阅读 · 2021年2月26日

【KDD2020】可解释深度神经网络，200页ppt

专知会员服务

171+阅读 · 2020年8月26日

最大均方差正则化贝叶斯神经网络，Bayesian Neural Networks With Maximum Mean Discrepancy Regularization

最大均方差正则化贝叶斯神经网络，Bayesian Neural Networks With Maximum Mean Discrepancy Regularization

专知会员服务

54+阅读 · 2020年3月5日

热门VIP内容

开通专知VIP会员享更多权益服务

《高超音速武器：一项再度兴起的技术》120页slides

《重建美国空中力量：为应对同级冲突平衡空军战斗力量》美智库报告

美国当前高超音速导弹发展概述

无人机蜂群建模与仿真方法

相关资讯

更透明的AI？MIT等最新《可解释AI: 深度神经网络内部结构解释》综述，17页pdf全面阐述DNN内部可解释性技术

更透明的AI？MIT等最新《可解释AI: 深度神经网络内部结构解释》综述，17页pdf全面阐述DNN内部可解释性技术

专知

13+阅读 · 2022年8月11日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

17+阅读 · 2020年6月7日

基于深度神经网络的关键词提取，Keywords extraction with DNN

基于深度神经网络的关键词提取，Keywords extraction with DNN

专知

10+阅读 · 2020年5月7日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

【荟萃】图神经网络论文列表，包含GNN理论及其在NLP和CV等领域的应用

【荟萃】图神经网络论文列表，包含GNN理论及其在NLP和CV等领域的应用

专知

45+阅读 · 2019年3月26日

7个实用的深度学习技巧

7个实用的深度学习技巧

机器学习算法与Python学习

16+阅读 · 2019年3月6日

深度学习中的五大正则化方法和七大优化策略

深度学习中的五大正则化方法和七大优化策略

全球人工智能

11+阅读 · 2017年12月25日

相关论文

Inference for Deep Neural Network Estimators in Generalized Nonparametric Models

Arxiv

0+阅读 · 3月17日

Variational Deep Learning via Implicit Regularization

Arxiv

0+阅读 · 3月13日

Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

Arxiv

0+阅读 · 3月11日

SigmaQuant: Hardware-Aware Heterogeneous Quantization Method for Edge DNN Inference

Arxiv

0+阅读 · 3月3日

Conjugate Learning Theory: Uncovering the Mechanisms of Trainability and Generalization in Deep Neural Networks

Arxiv

0+阅读 · 2月19日

Benchmarking Stochastic Approximation Algorithms for Fairness-Constrained Training of Deep Neural Networks

Arxiv

0+阅读 · 2月18日

A unified theory of feature learning in RNNs and DNNs

Arxiv

0+阅读 · 2月17日

Explainability-Inspired Layer-Wise Pruning of Deep Neural Networks for Efficient Object Detection

Arxiv

0+阅读 · 2月15日

Position: Many generalization measures for deep learning are fragile

Arxiv

0+阅读 · 2月11日

Regularisation in neural networks: a survey and empirical analysis of approaches

Arxiv

0+阅读 · 1月30日

相关基金

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

6+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

随机广义纳什均衡问题的研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

数据内在结构和稀疏保持的大间隔分类方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

信息论学习中的正则化及相关高维数据分析方法的数学理论

国家自然科学基金

12+阅读 · 2014年12月31日

多尺度NED/DEM生成的数字综合理论和关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员