Quantitative convergence of trained single layer neural networks to Gaussian processes - 专知论文

会员服务 ·

0

宽度 · 收敛性 · 定量 · 高斯过程 · 近似 ·

Quantitative convergence of trained single layer neural networks to Gaussian processes

翻译：训练单层神经网络到高斯过程的定量收敛性

Eloy Mosig,Andrea Agazzi,Dario Trevisan

from arxiv, Submitted and accepted at NeurIPS 2025, main body of 10 pages, 3 figures, 28 pages of supplementary material. Corrected an issue in the proof of Proposition 3.7

In this paper, we study the quantitative convergence of shallow neural networks trained via gradient descent to their associated Gaussian processes in the infinite-width limit. While previous work has established qualitative convergence under broad settings, precise, finite-width estimates remain limited, particularly during training. We provide explicit upper bounds on the quadratic Wasserstein distance between the network output and its Gaussian approximation at any training time $t \ge 0$, demonstrating polynomial decay with network width. Our results quantify how architectural parameters, such as width and input dimension, influence convergence, and how training dynamics affect the approximation error.

翻译：本文研究了浅层神经网络在无限宽度极限下通过梯度下降训练到其关联高斯过程的定量收敛性。尽管先前的研究已在广泛设定下建立了定性收敛，但精确的有限宽度估计仍然有限，特别是在训练过程中。我们给出了网络输出与其高斯近似之间在任何训练时间$t \ge 0$时的二次Wasserstein距离的显式上界，证明了其随网络宽度呈多项式衰减。我们的结果量化了架构参数（如宽度和输入维度）如何影响收敛性，以及训练动态如何影响近似误差。

0

相关内容

深度线性神经网络的梯度流方程：一项基于网络视角的综述

深度线性神经网络的梯度流方程：一项基于网络视角的综述

专知会员服务

8+阅读 · 2025年11月14日

美陆军研究报告《基于熵引导的深度神经网络加速收敛与性能提升方法》最新26页

美陆军研究报告《基于熵引导的深度神经网络加速收敛与性能提升方法》最新26页

专知会员服务

16+阅读 · 2025年7月3日

【斯坦福博士论文】神经网络中的特征学习及其他随机探索，238页pdf

【斯坦福博士论文】神经网络中的特征学习及其他随机探索，238页pdf

专知会员服务

38+阅读 · 2024年7月12日

【牛津大学博士论文】深度学习算法的渐近分析，186页pdf

【牛津大学博士论文】深度学习算法的渐近分析，186页pdf

专知会员服务

29+阅读 · 2024年6月27日

【NeurIPS2023】宽度神经网络作为高斯过程:深度均衡模型的经验教训

【NeurIPS2023】宽度神经网络作为高斯过程:深度均衡模型的经验教训

专知会员服务

26+阅读 · 2023年10月18日

【ETH博士论文】维数灾难与神经网络的基于梯度训练：缩小理论与应用之间的鸿沟，123页pdf

【ETH博士论文】维数灾难与神经网络的基于梯度训练：缩小理论与应用之间的鸿沟，123页pdf

专知会员服务

35+阅读 · 2023年5月31日

Nature. Mach. Intell. |基于梯度的学习通过平衡压缩和扩展来驱动循环神经网络中的鲁棒表示

Nature. Mach. Intell. |基于梯度的学习通过平衡压缩和扩展来驱动循环神经网络中的鲁棒表示

专知会员服务

10+阅读 · 2022年6月23日

【论文推荐】 Bidirectional Self-Normalizing Neural Networks：双向自归一化神经网络

【论文推荐】 Bidirectional Self-Normalizing Neural Networks：双向自归一化神经网络

专知会员服务

17+阅读 · 2020年6月22日

神经网络的拓扑结构，TOPOLOGY OF DEEP NEURAL NETWORKS

神经网络的拓扑结构，TOPOLOGY OF DEEP NEURAL NETWORKS

专知会员服务

35+阅读 · 2020年4月15日

【Facebook AI-ICLR2020】神经网络训练早期阶段探究，Early Phase of NN Training

【Facebook AI-ICLR2020】神经网络训练早期阶段探究，Early Phase of NN Training

专知会员服务

18+阅读 · 2020年3月3日

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

专知

41+阅读 · 2020年3月25日

深度神经网络可解释性方法汇总，附Tensorflow代码实现

深度神经网络可解释性方法汇总，附Tensorflow代码实现

新智元

34+阅读 · 2019年11月7日

吴恩达团队：神经网络如何正确初始化？

吴恩达团队：神经网络如何正确初始化？

AI100

11+阅读 · 2019年5月15日

资源 | 复旦大学邱锡鹏教授发布《神经网络与深度学习》教材，配备代码和章节练习

资源 | 复旦大学邱锡鹏教授发布《神经网络与深度学习》教材，配备代码和章节练习

AI科技评论

12+阅读 · 2019年4月12日

下载 | 512页教程《神经网络与深度学习》，2018最新著作

下载 | 512页教程《神经网络与深度学习》，2018最新著作

机器学习算法与Python学习

50+阅读 · 2019年1月6日

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

专知

49+阅读 · 2018年12月23日

如何得出神经网络需要多少隐藏层、每层需要多少神经元？

如何得出神经网络需要多少隐藏层、每层需要多少神经元？

论智

10+阅读 · 2018年10月22日

每日论文 | 深度卷积高斯过程；用多任务弱监督训练复杂模型；在时序数据中发现新连接类型

每日论文 | 深度卷积高斯过程；用多任务弱监督训练复杂模型；在时序数据中发现新连接类型

论智

12+阅读 · 2018年10月10日

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

深度学习与NLP

12+阅读 · 2018年9月13日

【论文读书笔记】重新考虑用简单神经网络进行知识表示学习（附代码）

【论文读书笔记】重新考虑用简单神经网络进行知识表示学习（附代码）

专知

14+阅读 · 2018年2月4日

忆阻递归神经网络的多重稳定性理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

14+阅读 · 2015年12月31日

模糊收敛群及其在粗糙集中的应用

国家自然科学基金

2+阅读 · 2015年12月31日

张量分析及其在高维信息处理中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

非线性双曲方程的间断有限元超收敛分析和应用

国家自然科学基金

1+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

高斯序列与过程的极值理论

国家自然科学基金

2+阅读 · 2015年12月31日

基于张量网络算法研究低维量子系统中的非局域关联和量子相变的标度行为

国家自然科学基金

0+阅读 · 2015年12月31日

统计收敛的测度理论与超滤子收敛

国家自然科学基金

0+阅读 · 2014年12月31日

基于quantaloid-加载范畴的quantale值收敛理论

国家自然科学基金

1+阅读 · 2014年12月31日

Finite-Dimensional Gaussian Approximation for Deep Neural Networks: Universality in Random Weights

Arxiv

0+阅读 · 3月4日

Beyond NNGP: Large Deviations and Feature Learning in Bayesian Neural Networks

Arxiv

0+阅读 · 2月26日

Convergence of the generalization error for deep gradient flow methods for PDEs

Arxiv

0+阅读 · 2月25日

Training Deep Normalization-Free Spiking Neural Networks with Lateral Inhibition

Arxiv

0+阅读 · 2月25日

Convergence Analysis of Two-Layer Neural Networks under Gaussian Input Masking

Arxiv

0+阅读 · 2月19日

Conjugate Learning Theory: Uncovering the Mechanisms of Trainability and Generalization in Deep Neural Networks

Arxiv

0+阅读 · 2月19日

Conjugate Learning Theory: Uncovering the Mechanisms of Trainability and Generalization in Deep Neural Networks

Arxiv

0+阅读 · 2月18日

Directional Convergence, Benign Overfitting of Gradient Descent in leaky ReLU two-layer Neural Networks

Arxiv

0+阅读 · 2月10日

Training in reverse: How iteration order influences convergence and stability in deep learning

Arxiv

0+阅读 · 2月6日

How Controlling the Variance can Improve Training Stability of Sparsely Activated DNNs and CNNs

Arxiv

0+阅读 · 2月5日

VIP会员

文章信息

相关主题

最新内容

ACL 2026 综述：从事后解释到内生解释，大模型内生可解释性的前沿进展

ACL 2026 综述：从事后解释到内生解释，大模型内生可解释性的前沿进展

专知会员服务

2+阅读 · 今天14:31

【斯坦福博士论文】驾驭上下文内记忆与学习的质量—效率权衡

【斯坦福博士论文】驾驭上下文内记忆与学习的质量—效率权衡

专知会员服务

1+阅读 · 今天14:29

面向具身智能与机器人仿真的三维生成：综述

面向具身智能与机器人仿真的三维生成：综述

专知会员服务

1+阅读 · 今天14:22

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

专知会员服务

13+阅读 · 今天6:39

《人工智能在全球军事与武器工业中的应用、方法论与影响》

《人工智能在全球军事与武器工业中的应用、方法论与影响》

专知会员服务

6+阅读 · 今天6:36

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

专知会员服务

10+阅读 · 今天6:28

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

专知会员服务

7+阅读 · 今天0:51

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

专知会员服务

6+阅读 · 4月29日

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

专知会员服务

7+阅读 · 4月29日

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

专知会员服务

6+阅读 · 4月29日

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

专知会员服务

6+阅读 · 4月29日

《化繁为简：军事模拟器配置的对话式方法》报告

《化繁为简：军事模拟器配置的对话式方法》报告

专知会员服务

11+阅读 · 4月29日

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

专知会员服务

12+阅读 · 4月29日

《新兴技术武器化及其对全球风险的影响》

《新兴技术武器化及其对全球风险的影响》

专知会员服务

8+阅读 · 4月29日

《帕兰泰尔平台介绍：信息分析平台》

《帕兰泰尔平台介绍：信息分析平台》

专知会员服务

21+阅读 · 4月29日

相关VIP内容

深度线性神经网络的梯度流方程：一项基于网络视角的综述

深度线性神经网络的梯度流方程：一项基于网络视角的综述

专知会员服务

8+阅读 · 2025年11月14日

美陆军研究报告《基于熵引导的深度神经网络加速收敛与性能提升方法》最新26页

美陆军研究报告《基于熵引导的深度神经网络加速收敛与性能提升方法》最新26页

专知会员服务

16+阅读 · 2025年7月3日

【斯坦福博士论文】神经网络中的特征学习及其他随机探索，238页pdf

【斯坦福博士论文】神经网络中的特征学习及其他随机探索，238页pdf

专知会员服务

38+阅读 · 2024年7月12日

【牛津大学博士论文】深度学习算法的渐近分析，186页pdf

【牛津大学博士论文】深度学习算法的渐近分析，186页pdf

专知会员服务

29+阅读 · 2024年6月27日

【NeurIPS2023】宽度神经网络作为高斯过程:深度均衡模型的经验教训

【NeurIPS2023】宽度神经网络作为高斯过程:深度均衡模型的经验教训

专知会员服务

26+阅读 · 2023年10月18日

【ETH博士论文】维数灾难与神经网络的基于梯度训练：缩小理论与应用之间的鸿沟，123页pdf

【ETH博士论文】维数灾难与神经网络的基于梯度训练：缩小理论与应用之间的鸿沟，123页pdf

专知会员服务

35+阅读 · 2023年5月31日

Nature. Mach. Intell. |基于梯度的学习通过平衡压缩和扩展来驱动循环神经网络中的鲁棒表示

Nature. Mach. Intell. |基于梯度的学习通过平衡压缩和扩展来驱动循环神经网络中的鲁棒表示

专知会员服务

10+阅读 · 2022年6月23日

【论文推荐】 Bidirectional Self-Normalizing Neural Networks：双向自归一化神经网络

【论文推荐】 Bidirectional Self-Normalizing Neural Networks：双向自归一化神经网络

专知会员服务

17+阅读 · 2020年6月22日

神经网络的拓扑结构，TOPOLOGY OF DEEP NEURAL NETWORKS

神经网络的拓扑结构，TOPOLOGY OF DEEP NEURAL NETWORKS

专知会员服务

35+阅读 · 2020年4月15日

【Facebook AI-ICLR2020】神经网络训练早期阶段探究，Early Phase of NN Training

【Facebook AI-ICLR2020】神经网络训练早期阶段探究，Early Phase of NN Training

专知会员服务

18+阅读 · 2020年3月3日

热门VIP内容

开通专知VIP会员享更多权益服务

【斯坦福博士论文】驾驭上下文内记忆与学习的质量—效率权衡

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

ACL 2026 综述：从事后解释到内生解释，大模型内生可解释性的前沿进展

面向具身智能与机器人仿真的三维生成：综述

相关资讯

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

专知

41+阅读 · 2020年3月25日

深度神经网络可解释性方法汇总，附Tensorflow代码实现

深度神经网络可解释性方法汇总，附Tensorflow代码实现

新智元

34+阅读 · 2019年11月7日

吴恩达团队：神经网络如何正确初始化？

吴恩达团队：神经网络如何正确初始化？

AI100

11+阅读 · 2019年5月15日

资源 | 复旦大学邱锡鹏教授发布《神经网络与深度学习》教材，配备代码和章节练习

资源 | 复旦大学邱锡鹏教授发布《神经网络与深度学习》教材，配备代码和章节练习

AI科技评论

12+阅读 · 2019年4月12日

下载 | 512页教程《神经网络与深度学习》，2018最新著作

下载 | 512页教程《神经网络与深度学习》，2018最新著作

机器学习算法与Python学习

50+阅读 · 2019年1月6日

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

专知

49+阅读 · 2018年12月23日

如何得出神经网络需要多少隐藏层、每层需要多少神经元？

如何得出神经网络需要多少隐藏层、每层需要多少神经元？

论智

10+阅读 · 2018年10月22日

每日论文 | 深度卷积高斯过程；用多任务弱监督训练复杂模型；在时序数据中发现新连接类型

每日论文 | 深度卷积高斯过程；用多任务弱监督训练复杂模型；在时序数据中发现新连接类型

论智

12+阅读 · 2018年10月10日

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

深度学习与NLP

12+阅读 · 2018年9月13日

【论文读书笔记】重新考虑用简单神经网络进行知识表示学习（附代码）

【论文读书笔记】重新考虑用简单神经网络进行知识表示学习（附代码）

专知

14+阅读 · 2018年2月4日

相关论文

Finite-Dimensional Gaussian Approximation for Deep Neural Networks: Universality in Random Weights

Arxiv

0+阅读 · 3月4日

Beyond NNGP: Large Deviations and Feature Learning in Bayesian Neural Networks

Arxiv

0+阅读 · 2月26日

Convergence of the generalization error for deep gradient flow methods for PDEs

Arxiv

0+阅读 · 2月25日

Training Deep Normalization-Free Spiking Neural Networks with Lateral Inhibition

Arxiv

0+阅读 · 2月25日

Convergence Analysis of Two-Layer Neural Networks under Gaussian Input Masking

Arxiv

0+阅读 · 2月19日

Conjugate Learning Theory: Uncovering the Mechanisms of Trainability and Generalization in Deep Neural Networks

Arxiv

0+阅读 · 2月19日

Conjugate Learning Theory: Uncovering the Mechanisms of Trainability and Generalization in Deep Neural Networks

Arxiv

0+阅读 · 2月18日

Directional Convergence, Benign Overfitting of Gradient Descent in leaky ReLU two-layer Neural Networks

Arxiv

0+阅读 · 2月10日

Training in reverse: How iteration order influences convergence and stability in deep learning

Arxiv

0+阅读 · 2月6日

How Controlling the Variance can Improve Training Stability of Sparsely Activated DNNs and CNNs

Arxiv

0+阅读 · 2月5日

相关基金

忆阻递归神经网络的多重稳定性理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于高斯过程模型的多示例多标记学习算法研究

国家自然科学基金

14+阅读 · 2015年12月31日

模糊收敛群及其在粗糙集中的应用

国家自然科学基金

2+阅读 · 2015年12月31日

张量分析及其在高维信息处理中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

非线性双曲方程的间断有限元超收敛分析和应用

国家自然科学基金

1+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

高斯序列与过程的极值理论

国家自然科学基金

2+阅读 · 2015年12月31日

基于张量网络算法研究低维量子系统中的非局域关联和量子相变的标度行为

国家自然科学基金

0+阅读 · 2015年12月31日

统计收敛的测度理论与超滤子收敛

国家自然科学基金

0+阅读 · 2014年12月31日

基于quantaloid-加载范畴的quantale值收敛理论

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员