Free Decompression with Algebraic Spectral Curves - 专知论文

会员服务 ·

0

ML · 工具 · 随机矩阵 · 矩阵理论 · 深度学习理论 ·

Free Decompression with Algebraic Spectral Curves

翻译：基于代数谱曲线的自由解压

Siavash Ameli,Chris van der Heide,Liam Hodgkinson,Michael W. Mahoney

Tools from random matrix theory have become central to deep learning theory, using spectral information to provide mechanisms for modeling generalization, robustness, scaling, and failure modes. While often capable of modeling empirical behavior, practical computations are limited by matrix size, often imposing a restriction to models that are too small to be realistic. This motivates the inference of properties of larger models from the behavior of smaller ones. Free decompression (FD) is a recently proposed method for extrapolating spectral information across matrix sizes, but its utility is currently limited by strong assumptions that preclude its implementation on more realistic machine learning (ML) models. We use algebraic spectral curve theory to provide a general FD methodology for spectral densities whose Stieltjes transform satisfies an algebraic relation, a modeling assumption that is more likely to hold in practice. This recasts FD as an evolution along spectral curves which can be readily integrated. Our framework enables the expansion of spectral densities that have multiple or multi-modal bulks, that exist at multiple scales, and that contain atoms, all characteristic of real-world data and popular ML models. We demonstrate the efficacy of our framework on models of interest in modern ML, including Hessian and activation matrices associated with neural networks and large-scale diffusion models.

翻译：随机矩阵理论中的工具已成为深度学习理论的核心，利用谱信息为建模泛化性、鲁棒性、扩展性和失效模式提供机制。尽管这些工具通常能够建模经验行为，但其实际计算受限于矩阵规模，常导致只能应用于规模过小而不切实际的模型。这推动了从较小模型的行为推断较大模型属性的研究。自由解压（FD）是近期提出的一种跨矩阵规模外推谱信息的方法，但其效用目前受到强假设的限制，使得该方法无法应用于更真实的机器学习（ML）模型。我们利用代数谱曲线理论，提出了一种通用的FD方法论，适用于其Stieltjes变换满足代数关系的谱密度——这一建模假设在实践中更可能成立。该方法将FD重新表述为沿谱曲线的演化，使其能够方便地进行积分。我们的框架能够扩展具有多峰或多模态主体、跨多重尺度分布、且包含原子的谱密度，这些特征正是真实世界数据与主流ML模型的特点。我们在现代ML领域的关键模型上演示了该框架的有效性，包括与神经网络及大规模扩散模型相关联的Hessian矩阵与激活矩阵。

0

相关内容

【斯坦福博士论文】时序平滑性假设下的深度神经网络自适应与正则化方法

【斯坦福博士论文】时序平滑性假设下的深度神经网络自适应与正则化方法

专知会员服务

15+阅读 · 2025年3月25日

【MIT博士论文】非线性优化在机器学习应用中的平滑性与自适应性

【MIT博士论文】非线性优化在机器学习应用中的平滑性与自适应性

专知会员服务

27+阅读 · 2024年8月27日

【牛津大学博士论文】深度概率模型的最优传输仿真方法，172页pdf

【牛津大学博士论文】深度概率模型的最优传输仿真方法，172页pdf

专知会员服务

39+阅读 · 2024年6月22日

【NeurIPS2023】矩阵压缩通过随机低秩和低精度分解

【NeurIPS2023】矩阵压缩通过随机低秩和低精度分解

专知会员服务

31+阅读 · 2023年10月22日

【牛津大学博士论文】变分自编码器: 监督、校准和多模态学习的变分自编码器，179页pdf

【牛津大学博士论文】变分自编码器: 监督、校准和多模态学习的变分自编码器，179页pdf

专知会员服务

38+阅读 · 2023年6月21日

【经典书】随机矩阵理论与无线网络，186和pdf

【经典书】随机矩阵理论与无线网络，186和pdf

专知会员服务

52+阅读 · 2021年12月21日

【硬核书】机器学习随机矩阵理论，472页pdf

专知会员服务

148+阅读 · 2021年8月12日

【ICML2021】随机矩阵理论与机器学习，255页pdf

专知会员服务

121+阅读 · 2021年7月24日

「学习几何结构」，Ron Kimmel讲述新半监督学习方法，附PPT与视频

「学习几何结构」，Ron Kimmel讲述新半监督学习方法，附PPT与视频

专知会员服务

24+阅读 · 2021年3月15日

2840页博士论文！《矩阵理论:优化、集中和算法》，德州大学奥斯汀Zhao Song

2840页博士论文！《矩阵理论:优化、集中和算法》，德州大学奥斯汀Zhao Song

专知会员服务

49+阅读 · 2021年1月25日

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

专知

10+阅读 · 2023年4月6日

【MIT博士论文】深度学习几何表示，138页pdf

【MIT博士论文】深度学习几何表示，138页pdf

专知

18+阅读 · 2022年9月4日

【论文笔记】自注意力图池化

【论文笔记】自注意力图池化

专知

82+阅读 · 2019年11月18日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

那些值得推荐和收藏的线性代数学习资源

那些值得推荐和收藏的线性代数学习资源

AINLP

25+阅读 · 2019年3月6日

线性代数与张量？这本开放书籍帮你扫清通往ML的数学绊脚石

线性代数与张量？这本开放书籍帮你扫清通往ML的数学绊脚石

机器之心

29+阅读 · 2018年10月28日

资源 | 用Python和NumPy学习《深度学习》中的线性代数基础

资源 | 用Python和NumPy学习《深度学习》中的线性代数基础

机器之心

18+阅读 · 2018年5月14日

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

CreateAMind

12+阅读 · 2018年4月7日

入门 | 这是一份文科生都能看懂的线性代数简介

入门 | 这是一份文科生都能看懂的线性代数简介

机器之心

14+阅读 · 2018年3月31日

【干货】深度学习中的线性代数

【干货】深度学习中的线性代数

专知

21+阅读 · 2018年3月30日

分布无关的概率图模型结构学习方法的研究

国家自然科学基金

4+阅读 · 2015年12月31日

有限域上的代数曲线在纠错码构造中的几点应用

国家自然科学基金

0+阅读 · 2015年12月31日

随机微分方程解的稳定性和矩有界性

国家自然科学基金

0+阅读 · 2015年12月31日

求解一类大规模稀疏线性矩阵方程的高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于L21范数约束的非负矩阵分解模型及其拓展

国家自然科学基金

1+阅读 · 2014年12月31日

代数整数的性质研究和无理测度的计算

国家自然科学基金

0+阅读 · 2014年12月31日

部分特征值统计量的中心极限定理及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

矩阵分解问题的优化算法与理论

国家自然科学基金

8+阅读 · 2014年12月31日

线性算子的谱结构及其扰动分析

国家自然科学基金

0+阅读 · 2014年12月31日

一般型代数曲面的自同构和模空间

国家自然科学基金

0+阅读 · 2014年12月31日

Eigen-Spike Emergence and Quadratic Equivalents for Conjugate Kernels on Nonlinearly Separable Data

Arxiv

0+阅读 · 6月16日

The Data Manifold under the Microscope

Arxiv

0+阅读 · 6月14日

Linear algebra at exponential scale via tensor network dimension reduction

Arxiv

0+阅读 · 6月13日

Data Compression with Stochastic Codes

Arxiv

0+阅读 · 6月8日

A prism hierarchy of learning regimes in large linear autoencoders

Arxiv

0+阅读 · 6月3日

Inversion-Free Natural Gradient Descent on Riemannian Manifolds

Arxiv

0+阅读 · 5月29日

Supervised Learning as Lossy Compression: Characterizing Generalization and Sample Complexity via Finite Blocklength Analysis

Arxiv

0+阅读 · 5月29日

Near-optimal Rank Adaptive Inference of High Dimensional Matrices

Arxiv

0+阅读 · 5月11日

Discovery of Nonlinear Dynamics with Automated Basis Function Generation

Arxiv

0+阅读 · 5月10日

Derandomizing Matrix Concentration Inequalities from Free Probability

Arxiv

0+阅读 · 4月30日

VIP会员

文章信息

相关主题

深度学习理论

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

2+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

4+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

7+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

4+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

7+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

5+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

3+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

8+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

6+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

9+阅读 · 6月22日

相关VIP内容

【斯坦福博士论文】时序平滑性假设下的深度神经网络自适应与正则化方法

【斯坦福博士论文】时序平滑性假设下的深度神经网络自适应与正则化方法

专知会员服务

15+阅读 · 2025年3月25日

【MIT博士论文】非线性优化在机器学习应用中的平滑性与自适应性

【MIT博士论文】非线性优化在机器学习应用中的平滑性与自适应性

专知会员服务

27+阅读 · 2024年8月27日

【牛津大学博士论文】深度概率模型的最优传输仿真方法，172页pdf

【牛津大学博士论文】深度概率模型的最优传输仿真方法，172页pdf

专知会员服务

39+阅读 · 2024年6月22日

【NeurIPS2023】矩阵压缩通过随机低秩和低精度分解

【NeurIPS2023】矩阵压缩通过随机低秩和低精度分解

专知会员服务

31+阅读 · 2023年10月22日

【牛津大学博士论文】变分自编码器: 监督、校准和多模态学习的变分自编码器，179页pdf

【牛津大学博士论文】变分自编码器: 监督、校准和多模态学习的变分自编码器，179页pdf

专知会员服务

38+阅读 · 2023年6月21日

【经典书】随机矩阵理论与无线网络，186和pdf

【经典书】随机矩阵理论与无线网络，186和pdf

专知会员服务

52+阅读 · 2021年12月21日

【硬核书】机器学习随机矩阵理论，472页pdf

专知会员服务

148+阅读 · 2021年8月12日

【ICML2021】随机矩阵理论与机器学习，255页pdf

专知会员服务

121+阅读 · 2021年7月24日

「学习几何结构」，Ron Kimmel讲述新半监督学习方法，附PPT与视频

「学习几何结构」，Ron Kimmel讲述新半监督学习方法，附PPT与视频

专知会员服务

24+阅读 · 2021年3月15日

2840页博士论文！《矩阵理论:优化、集中和算法》，德州大学奥斯汀Zhao Song

2840页博士论文！《矩阵理论:优化、集中和算法》，德州大学奥斯汀Zhao Song

专知会员服务

49+阅读 · 2021年1月25日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

专知

10+阅读 · 2023年4月6日

【MIT博士论文】深度学习几何表示，138页pdf

【MIT博士论文】深度学习几何表示，138页pdf

专知

18+阅读 · 2022年9月4日

【论文笔记】自注意力图池化

【论文笔记】自注意力图池化

专知

82+阅读 · 2019年11月18日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

那些值得推荐和收藏的线性代数学习资源

那些值得推荐和收藏的线性代数学习资源

AINLP

25+阅读 · 2019年3月6日

线性代数与张量？这本开放书籍帮你扫清通往ML的数学绊脚石

线性代数与张量？这本开放书籍帮你扫清通往ML的数学绊脚石

机器之心

29+阅读 · 2018年10月28日

资源 | 用Python和NumPy学习《深度学习》中的线性代数基础

资源 | 用Python和NumPy学习《深度学习》中的线性代数基础

机器之心

18+阅读 · 2018年5月14日

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

CreateAMind

12+阅读 · 2018年4月7日

入门 | 这是一份文科生都能看懂的线性代数简介

入门 | 这是一份文科生都能看懂的线性代数简介

机器之心

14+阅读 · 2018年3月31日

【干货】深度学习中的线性代数

【干货】深度学习中的线性代数

专知

21+阅读 · 2018年3月30日

相关论文

Eigen-Spike Emergence and Quadratic Equivalents for Conjugate Kernels on Nonlinearly Separable Data

Arxiv

0+阅读 · 6月16日

The Data Manifold under the Microscope

Arxiv

0+阅读 · 6月14日

Linear algebra at exponential scale via tensor network dimension reduction

Arxiv

0+阅读 · 6月13日

Data Compression with Stochastic Codes

Arxiv

0+阅读 · 6月8日

A prism hierarchy of learning regimes in large linear autoencoders

Arxiv

0+阅读 · 6月3日

Inversion-Free Natural Gradient Descent on Riemannian Manifolds

Arxiv

0+阅读 · 5月29日

Supervised Learning as Lossy Compression: Characterizing Generalization and Sample Complexity via Finite Blocklength Analysis

Arxiv

0+阅读 · 5月29日

Near-optimal Rank Adaptive Inference of High Dimensional Matrices

Arxiv

0+阅读 · 5月11日

Discovery of Nonlinear Dynamics with Automated Basis Function Generation

Arxiv

0+阅读 · 5月10日

Derandomizing Matrix Concentration Inequalities from Free Probability

Arxiv

0+阅读 · 4月30日

相关基金

分布无关的概率图模型结构学习方法的研究

国家自然科学基金

4+阅读 · 2015年12月31日

有限域上的代数曲线在纠错码构造中的几点应用

国家自然科学基金

0+阅读 · 2015年12月31日

随机微分方程解的稳定性和矩有界性

国家自然科学基金

0+阅读 · 2015年12月31日

求解一类大规模稀疏线性矩阵方程的高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于L21范数约束的非负矩阵分解模型及其拓展

国家自然科学基金

1+阅读 · 2014年12月31日

代数整数的性质研究和无理测度的计算

国家自然科学基金

0+阅读 · 2014年12月31日

部分特征值统计量的中心极限定理及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

矩阵分解问题的优化算法与理论

国家自然科学基金

8+阅读 · 2014年12月31日

线性算子的谱结构及其扰动分析

国家自然科学基金

0+阅读 · 2014年12月31日

一般型代数曲面的自同构和模空间

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员