Precise Dynamics of Diagonal Linear Networks: A Unifying Analysis by Dynamical Mean-Field Theory - 专知论文

会员服务 ·

0

分析 · 平均场 · 平均场理论 · 梯度 · 高维 ·

Precise Dynamics of Diagonal Linear Networks: A Unifying Analysis by Dynamical Mean-Field Theory

翻译：对角线性网络的精确动力学：基于动力学平均场理论的统一分析

Sota Nishiyama,Masaaki Imaizumi

from arxiv, 48 pages, accepted at AISTATS 2026 (Spotlight)

Diagonal linear networks (DLNs) are a tractable model that captures several nontrivial behaviors in neural network training, such as initialization-dependent solutions and incremental learning. These phenomena are typically studied in isolation, leaving the overall dynamics insufficiently understood. In this work, we present a unified analysis of various phenomena in the gradient flow dynamics of DLNs. Using Dynamical Mean-Field Theory (DMFT), we derive a low-dimensional effective process that captures the asymptotic gradient flow dynamics in high dimensions. Analyzing this effective process yields new insights into DLN dynamics, including loss convergence rates and their trade-off with generalization, and systematically reproduces many of the previously observed phenomena. These findings deepen our understanding of DLNs and demonstrate the effectiveness of the DMFT approach in analyzing high-dimensional learning dynamics of neural networks.

翻译：对角线性网络（DLNs）是一种可解析处理的模型，它捕捉了神经网络训练中若干非平凡行为，例如初始化依赖的解和增量学习。这些现象通常被孤立研究，导致对其整体动力学的理解尚不充分。本工作对DLNs梯度流动力学中的多种现象进行了统一分析。通过运用动力学平均场理论（DMFT），我们推导出一个低维有效过程，该过程能够捕捉高维情形下的渐近梯度流动力学。对此有效过程的分析为DLN动力学提供了新的见解，包括损失收敛速率及其与泛化性能的权衡，并系统性地复现了先前观测到的多种现象。这些发现深化了我们对DLNs的理解，并证明了DMFT方法在分析神经网络高维学习动力学中的有效性。

0

相关内容

深度线性神经网络的梯度流方程：一项基于网络视角的综述

深度线性神经网络的梯度流方程：一项基于网络视角的综述

专知会员服务

8+阅读 · 2025年11月14日

【博士论文】数据与任务的物理学：深度学习中的局部性与组合性理论

【博士论文】数据与任务的物理学：深度学习中的局部性与组合性理论

专知会员服务

23+阅读 · 2025年10月10日

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

专知会员服务

27+阅读 · 2025年2月4日

【NeurIPS2022】解析动力学系统中物理信息图神经网络的性能

【NeurIPS2022】解析动力学系统中物理信息图神经网络的性能

专知会员服务

19+阅读 · 2022年11月12日

Lehigh大学最新《图数据对抗攻击与防御》最新综述，阐述100篇图对抗工作

Lehigh大学最新《图数据对抗攻击与防御》最新综述，阐述100篇图对抗工作

专知会员服务

32+阅读 · 2022年11月7日

Nature. Mach. Intell. |基于梯度的学习通过平衡压缩和扩展来驱动循环神经网络中的鲁棒表示

Nature. Mach. Intell. |基于梯度的学习通过平衡压缩和扩展来驱动循环神经网络中的鲁棒表示

专知会员服务

10+阅读 · 2022年6月23日

神经网络的基础数学

神经网络的基础数学

专知会员服务

208+阅读 · 2022年1月23日

清华大学等首篇「动态神经网络」最新综述论文，20页pdf236篇文献

清华大学等首篇「动态神经网络」最新综述论文，20页pdf236篇文献

专知会员服务

80+阅读 · 2021年2月21日

生成性对抗网络:理论模型、评估指标和最近发展的概述，Generative Adversarial Networks (GANs): An Overview of Theoretical Model, Evaluation Metrics, and Recent Developments

生成性对抗网络:理论模型、评估指标和最近发展的概述，Generative Adversarial Networks (GANs): An Overview of Theoretical Model, Evaluation Metrics, and Recent Developments

专知会员服务

42+阅读 · 2020年5月30日

【论文推荐】几何图形卷积网络，GEOM-GCN: GEOMETRIC GRAPH CONVOLUTIONAL NETWORKS

【论文推荐】几何图形卷积网络，GEOM-GCN: GEOMETRIC GRAPH CONVOLUTIONAL NETWORKS

专知会员服务

77+阅读 · 2020年2月5日

神经网络的基础数学，95页pdf

神经网络的基础数学，95页pdf

专知

29+阅读 · 2022年1月23日

图神经网络及其在电力系统中的应用综述，12页pdf

图神经网络及其在电力系统中的应用综述，12页pdf

专知

29+阅读 · 2021年1月28日

论文浅尝 | GEOM-GCN: Geometric Graph Convolutional Networks

论文浅尝 | GEOM-GCN: Geometric Graph Convolutional Networks

开放知识图谱

14+阅读 · 2020年4月8日

南京大学吴建鑫教授「卷积神经网络CNN」笔记，35页pdf初学者学习指南理解CNN数学原理

南京大学吴建鑫教授「卷积神经网络CNN」笔记，35页pdf初学者学习指南理解CNN数学原理

专知

11+阅读 · 2020年2月23日

【论文笔记】通过自注意力网络的动态图表示学习

【论文笔记】通过自注意力网络的动态图表示学习

专知

90+阅读 · 2019年12月2日

【牛津大学|DeepMind】论深度学习中的统计思维，附49页ppt

【牛津大学|DeepMind】论深度学习中的统计思维，附49页ppt

专知

14+阅读 · 2019年11月25日

【南洋理工大学】图神经网络，Graph Neural Networks，附121页ppt

【南洋理工大学】图神经网络，Graph Neural Networks，附121页ppt

专知

40+阅读 · 2019年10月28日

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

深度学习与NLP

12+阅读 · 2018年9月13日

Coursera吴恩达《卷积神经网络》课程笔记（1）-- 卷积神经网络基础

Coursera吴恩达《卷积神经网络》课程笔记（1）-- 卷积神经网络基础

机器学习研究会

29+阅读 · 2018年1月29日

【深度学习基础】4. Recurrent Neural Networks

【深度学习基础】4. Recurrent Neural Networks

微信AI

16+阅读 · 2017年7月19日

动态社会网络中异质交互观点演化动力学建模及分析研究

国家自然科学基金

1+阅读 · 2016年12月31日

多层动态网络的建模、群体动力学分析与控制

国家自然科学基金

3+阅读 · 2015年12月31日

基于事件驱动的不完整信息耦合复杂网络群集动力学研究

国家自然科学基金

1+阅读 · 2015年12月31日

相互依存网络上耦合动力学研究

国家自然科学基金

0+阅读 · 2015年12月31日

奇异耦合网络的动力学分析与控制

国家自然科学基金

0+阅读 · 2015年12月31日

非线性分析方法与奇异摄动理论在力学中的若干应用

国家自然科学基金

0+阅读 · 2015年12月31日

神经元网络系统的斑图动力学行为分析及控制

国家自然科学基金

0+阅读 · 2014年12月31日

反馈神经网络统一模型临界动力学研究及其在类脑计算机研制中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

非线性动力系统的最简正规形及其相关问题的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于非线性动力学的复杂网络结构识别及其在力学系统中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

Flexible Deep Neural Networks for Partially Linear Survival Data: Estimation and Survival Inference

Arxiv

0+阅读 · 4月27日

Bayesian Neural Networks: An Introduction and Survey

Arxiv

1+阅读 · 4月18日

The Riemannian Geometry Associated to Gradient Flows of Linear Convolutional Networks

Arxiv

0+阅读 · 4月5日

An Analytical Theory of Spectral Bias in the Learning Dynamics of Diffusion Models

Arxiv

0+阅读 · 4月5日

Integer-State Dynamics of Quantized Spiking Neural Networks for Efficient Hardware Acceleration

Arxiv

0+阅读 · 4月1日

Domain decomposition of large neural network surrogate models

Arxiv

0+阅读 · 3月27日

Regularization Implies balancedness in the deep linear network

Arxiv

0+阅读 · 3月23日

Diagonal Linear Networks and the Lasso Regularization Path

Arxiv

0+阅读 · 3月18日

Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

Arxiv

0+阅读 · 3月11日

Aligned explanations in neural networks

Arxiv

0+阅读 · 2月28日

VIP会员

文章信息

相关主题

平均场理论

最新内容

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

2+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

4+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

4+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

4+阅读 · 7月20日

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

3+阅读 · 7月20日

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

5+阅读 · 7月20日

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

专知会员服务

4+阅读 · 7月20日

深入Project Maven：为何人工智能在战场上依然失灵

深入Project Maven：为何人工智能在战场上依然失灵

专知会员服务

14+阅读 · 7月19日

锻造未来士兵：外骨骼、基因工程与赛博格

锻造未来士兵：外骨骼、基因工程与赛博格

专知会员服务

7+阅读 · 7月19日

《无人机系统（UAS）通信网状网络试验性部署》50页报告

《无人机系统（UAS）通信网状网络试验性部署》50页报告

专知会员服务

7+阅读 · 7月19日

《无人机蜂群通信技术研究》50页

《无人机蜂群通信技术研究》50页

专知会员服务

8+阅读 · 7月19日

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

专知会员服务

11+阅读 · 7月18日

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

专知会员服务

8+阅读 · 7月18日

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

专知会员服务

13+阅读 · 7月18日

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

专知会员服务

9+阅读 · 7月18日

相关VIP内容

深度线性神经网络的梯度流方程：一项基于网络视角的综述

深度线性神经网络的梯度流方程：一项基于网络视角的综述

专知会员服务

8+阅读 · 2025年11月14日

【博士论文】数据与任务的物理学：深度学习中的局部性与组合性理论

【博士论文】数据与任务的物理学：深度学习中的局部性与组合性理论

专知会员服务

23+阅读 · 2025年10月10日

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

专知会员服务

27+阅读 · 2025年2月4日

【NeurIPS2022】解析动力学系统中物理信息图神经网络的性能

【NeurIPS2022】解析动力学系统中物理信息图神经网络的性能

专知会员服务

19+阅读 · 2022年11月12日

Lehigh大学最新《图数据对抗攻击与防御》最新综述，阐述100篇图对抗工作

Lehigh大学最新《图数据对抗攻击与防御》最新综述，阐述100篇图对抗工作

专知会员服务

32+阅读 · 2022年11月7日

Nature. Mach. Intell. |基于梯度的学习通过平衡压缩和扩展来驱动循环神经网络中的鲁棒表示

Nature. Mach. Intell. |基于梯度的学习通过平衡压缩和扩展来驱动循环神经网络中的鲁棒表示

专知会员服务

10+阅读 · 2022年6月23日

神经网络的基础数学

神经网络的基础数学

专知会员服务

208+阅读 · 2022年1月23日

清华大学等首篇「动态神经网络」最新综述论文，20页pdf236篇文献

清华大学等首篇「动态神经网络」最新综述论文，20页pdf236篇文献

专知会员服务

80+阅读 · 2021年2月21日

生成性对抗网络:理论模型、评估指标和最近发展的概述，Generative Adversarial Networks (GANs): An Overview of Theoretical Model, Evaluation Metrics, and Recent Developments

生成性对抗网络:理论模型、评估指标和最近发展的概述，Generative Adversarial Networks (GANs): An Overview of Theoretical Model, Evaluation Metrics, and Recent Developments

专知会员服务

42+阅读 · 2020年5月30日

【论文推荐】几何图形卷积网络，GEOM-GCN: GEOMETRIC GRAPH CONVOLUTIONAL NETWORKS

【论文推荐】几何图形卷积网络，GEOM-GCN: GEOMETRIC GRAPH CONVOLUTIONAL NETWORKS

专知会员服务

77+阅读 · 2020年2月5日

热门VIP内容

开通专知VIP会员享更多权益服务

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

印度精确打击与指挥架构的断层

美空军AI完成F-16战斗机自主空战历史性试飞

相关资讯

神经网络的基础数学，95页pdf

神经网络的基础数学，95页pdf

专知

29+阅读 · 2022年1月23日

图神经网络及其在电力系统中的应用综述，12页pdf

图神经网络及其在电力系统中的应用综述，12页pdf

专知

29+阅读 · 2021年1月28日

论文浅尝 | GEOM-GCN: Geometric Graph Convolutional Networks

论文浅尝 | GEOM-GCN: Geometric Graph Convolutional Networks

开放知识图谱

14+阅读 · 2020年4月8日

南京大学吴建鑫教授「卷积神经网络CNN」笔记，35页pdf初学者学习指南理解CNN数学原理

南京大学吴建鑫教授「卷积神经网络CNN」笔记，35页pdf初学者学习指南理解CNN数学原理

专知

11+阅读 · 2020年2月23日

【论文笔记】通过自注意力网络的动态图表示学习

【论文笔记】通过自注意力网络的动态图表示学习

专知

90+阅读 · 2019年12月2日

【牛津大学|DeepMind】论深度学习中的统计思维，附49页ppt

【牛津大学|DeepMind】论深度学习中的统计思维，附49页ppt

专知

14+阅读 · 2019年11月25日

【南洋理工大学】图神经网络，Graph Neural Networks，附121页ppt

【南洋理工大学】图神经网络，Graph Neural Networks，附121页ppt

专知

40+阅读 · 2019年10月28日

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

深度学习与NLP

12+阅读 · 2018年9月13日

Coursera吴恩达《卷积神经网络》课程笔记（1）-- 卷积神经网络基础

Coursera吴恩达《卷积神经网络》课程笔记（1）-- 卷积神经网络基础

机器学习研究会

29+阅读 · 2018年1月29日

【深度学习基础】4. Recurrent Neural Networks

【深度学习基础】4. Recurrent Neural Networks

微信AI

16+阅读 · 2017年7月19日

相关论文

Flexible Deep Neural Networks for Partially Linear Survival Data: Estimation and Survival Inference

Arxiv

0+阅读 · 4月27日

Bayesian Neural Networks: An Introduction and Survey

Arxiv

1+阅读 · 4月18日

The Riemannian Geometry Associated to Gradient Flows of Linear Convolutional Networks

Arxiv

0+阅读 · 4月5日

An Analytical Theory of Spectral Bias in the Learning Dynamics of Diffusion Models

Arxiv

0+阅读 · 4月5日

Integer-State Dynamics of Quantized Spiking Neural Networks for Efficient Hardware Acceleration

Arxiv

0+阅读 · 4月1日

Domain decomposition of large neural network surrogate models

Arxiv

0+阅读 · 3月27日

Regularization Implies balancedness in the deep linear network

Arxiv

0+阅读 · 3月23日

Diagonal Linear Networks and the Lasso Regularization Path

Arxiv

0+阅读 · 3月18日

Beyond Accuracy: Reliability and Uncertainty Estimation in Convolutional Neural Networks

Arxiv

0+阅读 · 3月11日

Aligned explanations in neural networks

Arxiv

0+阅读 · 2月28日

相关基金

动态社会网络中异质交互观点演化动力学建模及分析研究

国家自然科学基金

1+阅读 · 2016年12月31日

多层动态网络的建模、群体动力学分析与控制

国家自然科学基金

3+阅读 · 2015年12月31日

基于事件驱动的不完整信息耦合复杂网络群集动力学研究

国家自然科学基金

1+阅读 · 2015年12月31日

相互依存网络上耦合动力学研究

国家自然科学基金

0+阅读 · 2015年12月31日

奇异耦合网络的动力学分析与控制

国家自然科学基金

0+阅读 · 2015年12月31日

非线性分析方法与奇异摄动理论在力学中的若干应用

国家自然科学基金

0+阅读 · 2015年12月31日

神经元网络系统的斑图动力学行为分析及控制

国家自然科学基金

0+阅读 · 2014年12月31日

反馈神经网络统一模型临界动力学研究及其在类脑计算机研制中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

非线性动力系统的最简正规形及其相关问题的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于非线性动力学的复杂网络结构识别及其在力学系统中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员