Empirical studies have revealed low dimensional structures in the eigenspectra of weights, Hessians, gradients, and feature vectors of deep networks, consistently observed across datasets and architectures in the overparameterized regime. In this work, we analyze deep unconstrained feature models (UFMs) to provide an analytic explanation of how these structures emerge at the layerwise level, including the bulk outlier Hessian spectrum and the alignment of gradient descent with the outlier eigenspace. We show that deep neural collapse underlies these phenomena, deriving explicit expressions for eigenvalues and eigenvectors of many deep learning matrices in terms of class feature means. Furthermore, we demonstrate that the full Hessian inherits its low dimensional structure from the layerwise Hessians, and empirically validate our theory in both UFMs and deep networks.


翻译:实证研究揭示了深度网络权重、海森矩阵、梯度及特征向量特征谱中的低维结构,这些结构在过参数化机制下跨数据集和架构持续被观测到。本文通过分析深度无约束特征模型,为这些结构在逐层水平上的涌现提供了理论解释,包括海森矩阵谱的主体-异常值分布以及梯度下降与异常值特征空间的对齐机制。我们证明深度神经坍缩是这些现象的内在基础,并推导出多个深度学习矩阵特征值与特征向量关于类别特征均值的显式表达式。此外,我们论证了整体海森矩阵的低维结构继承自逐层海森矩阵,并通过无约束特征模型和深度网络进行了实证验证。

0
下载
关闭预览

相关内容

大模型训练与适配中的低秩结构研究综述
专知会员服务
19+阅读 · 2025年3月27日
几何观点下的深度学习
专知会员服务
35+阅读 · 2022年12月13日
最新《 深度学习时代的低光图像增强》综述论文,
专知会员服务
38+阅读 · 2021年4月30日
基于虚拟现实环境的深度学习模型构建
MOOC
24+阅读 · 2019年9月28日
深度学习时代的图模型,清华发文综述图网络
GAN生成式对抗网络
13+阅读 · 2018年12月23日
入门 | 深度学习模型的简单优化技巧
机器之心
10+阅读 · 2018年6月10日
深度学习在CTR预估中的应用 | CTR深度模型大盘点
PaperWeekly
15+阅读 · 2018年4月11日
【干货】​深度学习中的线性代数
专知
21+阅读 · 2018年3月30日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
Arxiv
32+阅读 · 2021年3月8日
VIP会员
相关VIP内容
大模型训练与适配中的低秩结构研究综述
专知会员服务
19+阅读 · 2025年3月27日
几何观点下的深度学习
专知会员服务
35+阅读 · 2022年12月13日
最新《 深度学习时代的低光图像增强》综述论文,
专知会员服务
38+阅读 · 2021年4月30日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员