Large Deviations of Gaussian Neural Networks with ReLU activation - 专知论文

会员服务 ·

0

ReLU · 大偏差原理 · 偏差 · 激活函数 · 神经网络 ·

Large Deviations of Gaussian Neural Networks with ReLU activation

翻译：高斯ReLU激活神经网络的大偏差原理

from arxiv, typo corrected from a previous version

We prove a large deviation principle for deep neural networks with Gaussian weights and at most linearly growing activation functions, such as ReLU. This generalises earlier work, in which bounded and continuous activation functions were considered. In practice, linearly growing activation functions such as ReLU are most commonly used. We furthermore simplify previous expressions for the rate function and provide a power-series expansions for the ReLU case.

翻译：我们证明了具有高斯权重和至多线性增长激活函数（如ReLU）的深度神经网络的大偏差原理。这推广了早期考虑有界连续激活函数的研究工作。在实践中，线性增长的激活函数（如ReLU）最为常用。我们进一步简化了速率函数的先前表达式，并为ReLU情形提供了幂级数展开。

0

相关内容

ReLU

【斯坦福大学博士论文】神经网络的凸优化公式化：理论、应用与未来展望

【斯坦福大学博士论文】神经网络的凸优化公式化：理论、应用与未来展望

专知会员服务

23+阅读 · 2025年3月22日

【斯坦福博士论文】神经网络凸优化公式化：理论、应用与超越，371页pdf

【斯坦福博士论文】神经网络凸优化公式化：理论、应用与超越，371页pdf

专知会员服务

28+阅读 · 2025年3月16日

激活的三十年:神经网络400个激活函数的全面综述

激活的三十年:神经网络400个激活函数的全面综述

专知会员服务

71+阅读 · 2024年2月18日

【斯坦福博士论文】凸神经网络，Convex neural networks，228页pdf

【斯坦福博士论文】凸神经网络，Convex neural networks，228页pdf

专知会员服务

53+阅读 · 2023年11月19日

【NeurIPS2023】宽度神经网络作为高斯过程:深度均衡模型的经验教训

【NeurIPS2023】宽度神经网络作为高斯过程:深度均衡模型的经验教训

专知会员服务

26+阅读 · 2023年10月18日

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

专知会员服务

48+阅读 · 2022年11月4日

如何理解统计学习理论、优化与神经网络？伯克利Spencer Frei最新演讲报告，附58页ppt与视频

如何理解统计学习理论、优化与神经网络？伯克利Spencer Frei最新演讲报告，附58页ppt与视频

专知会员服务

45+阅读 · 2022年8月13日

【Google】具有秩-1因子的高效可扩展贝叶斯神经网络，Efficient and Scalable Bayesian Neural Nets with Rank-1 Factors

【Google】具有秩-1因子的高效可扩展贝叶斯神经网络，Efficient and Scalable Bayesian Neural Nets with Rank-1 Factors

专知会员服务

14+阅读 · 2020年5月19日

【Google大脑】进化正则激活层，Evolving Normalization-Activation Layers

【Google大脑】进化正则激活层，Evolving Normalization-Activation Layers

专知会员服务

19+阅读 · 2020年4月9日

最大均方差正则化贝叶斯神经网络，Bayesian Neural Networks With Maximum Mean Discrepancy Regularization

最大均方差正则化贝叶斯神经网络，Bayesian Neural Networks With Maximum Mean Discrepancy Regularization

专知会员服务

54+阅读 · 2020年3月5日

不可错过！图宾根大学《深度学习》课程，12讲述神经网络、GNN、GAN、序列模型等主题，附Slides与151页pdf笔记

不可错过！图宾根大学《深度学习》课程，12讲述神经网络、GNN、GAN、序列模型等主题，附Slides与151页pdf笔记

专知

18+阅读 · 2021年5月8日

【万字长文总结】如何解决"稀疏奖励(Sparse Reward)"下的强化学习问题？

【万字长文总结】如何解决"稀疏奖励(Sparse Reward)"下的强化学习问题？

深度强化学习实验室

43+阅读 · 2020年7月6日

【南洋理工大学】注意力神经网络，Attention Neural Networks，78页ppt

【南洋理工大学】注意力神经网络，Attention Neural Networks，78页ppt

专知

21+阅读 · 2019年11月9日

【南洋理工大学】图神经网络，Graph Neural Networks，附121页ppt

【南洋理工大学】图神经网络，Graph Neural Networks，附121页ppt

专知

40+阅读 · 2019年10月28日

激活函数还是有一点意思的！

激活函数还是有一点意思的！

计算机视觉战队

12+阅读 · 2019年6月28日

深入卷积神经网络背后的数学原理

深入卷积神经网络背后的数学原理

人工智能学家

10+阅读 · 2019年4月26日

干货 | 深入理解深度学习中的激活函数

干货 | 深入理解深度学习中的激活函数

计算机视觉life

16+阅读 · 2019年1月29日

手把手教你构建ResNet残差网络

手把手教你构建ResNet残差网络

专知

38+阅读 · 2018年4月27日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

Coursera吴恩达《卷积神经网络》课程笔记（1）-- 卷积神经网络基础

Coursera吴恩达《卷积神经网络》课程笔记（1）-- 卷积神经网络基础

机器学习研究会

29+阅读 · 2018年1月29日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

忆阻递归神经网络的多重稳定性理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

人类视空间分类的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

大型稀疏奇异复对称线性系统的高效迭代法研究

国家自然科学基金

0+阅读 · 2015年12月31日

T-S模糊神经网络的容错同步性分析

国家自然科学基金

0+阅读 · 2015年12月31日

扩散过程离散化形式下的若干统计问题的大偏差原理

国家自然科学基金

0+阅读 · 2014年12月31日

神经元网络系统的斑图动力学行为分析及控制

国家自然科学基金

0+阅读 · 2014年12月31日

反馈神经网络统一模型临界动力学研究及其在类脑计算机研制中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

高功率脉冲(10 MW)激光光纤偏振走离复合放大技术

国家自然科学基金

0+阅读 · 2014年12月31日

非凸非光滑优化的神经网络设计及其关键问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

Memorization capacity of deep ReLU neural networks characterized by width and depth

Arxiv

0+阅读 · 3月10日

Large deviation principles for convolutional Bayesian neural networks

Arxiv

0+阅读 · 3月6日

Finite-Dimensional Gaussian Approximation for Deep Neural Networks: Universality in Random Weights

Arxiv

0+阅读 · 3月4日

Beyond NNGP: Large Deviations and Feature Learning in Bayesian Neural Networks

Arxiv

0+阅读 · 2月26日

Path-conditioned training: a principled way to rescale ReLU neural networks

Arxiv

0+阅读 · 2月23日

Better Neural Network Expressivity: Subdividing the Simplex

Arxiv

0+阅读 · 2月19日

Optimal Initialization in Depth: Lyapunov Initialization and Limit Theorems for Deep Leaky ReLU Networks

Arxiv

0+阅读 · 2月11日

Why Rectified Power Unit Networks Fail and How to Improve It: An Effective Field Theory Perspective

Arxiv

0+阅读 · 2月8日

How Controlling the Variance can Improve Training Stability of Sparsely Activated DNNs and CNNs

Arxiv

0+阅读 · 2月5日

Agnostic Learning of Arbitrary ReLU Activation under Gaussian Marginals

Arxiv

0+阅读 · 2月3日

VIP会员

文章信息

相关主题

大偏差原理

最新内容

2025年大语言模型进展报告

2025年大语言模型进展报告

专知会员服务

10+阅读 · 4月25日

多智能体协作机制

多智能体协作机制

专知会员服务

10+阅读 · 4月25日

非对称优势：美海军开发低成本反无人机技术

非对称优势：美海军开发低成本反无人机技术

专知会员服务

9+阅读 · 4月25日

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

专知会员服务

19+阅读 · 4月25日

《美战争部小企业创新研究（SBIR）计划》

《美战争部小企业创新研究（SBIR）计划》

专知会员服务

8+阅读 · 4月25日

《军事模拟：将军事条令与目标融入AI智能体》

《军事模拟：将军事条令与目标融入AI智能体》

专知会员服务

12+阅读 · 4月25日

【NTU博士论文】3D人体动作生成

【NTU博士论文】3D人体动作生成

专知会员服务

9+阅读 · 4月24日

DeepSeek-V4：百万 Token 上下文背后，大模型正在进入“长程智能”时代（附中英文pdf版）

DeepSeek-V4：百万 Token 上下文背后，大模型正在进入“长程智能”时代（附中英文pdf版）

专知会员服务

13+阅读 · 4月24日

以色列军事技术对美国军力发展的持续性赋能

以色列军事技术对美国军力发展的持续性赋能

专知会员服务

9+阅读 · 4月24日

战场之外的较量：美伊冲突中的认知战与心理博弈

战场之外的较量：美伊冲突中的认知战与心理博弈

专知会员服务

7+阅读 · 4月24日

俄乌战争中乌克兰防空能力演变与见解（中文版）

俄乌战争中乌克兰防空能力演变与见解（中文版）

专知会员服务

8+阅读 · 4月24日

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

专知会员服务

11+阅读 · 4月24日

《深度强化学习在兵棋推演中的应用》40页报告

《深度强化学习在兵棋推演中的应用》40页报告

专知会员服务

16+阅读 · 4月24日

《多域作战面临复杂现实》

《多域作战面临复杂现实》

专知会员服务

13+阅读 · 4月24日

《印度的多域作战：条令与能力发展》报告

《印度的多域作战：条令与能力发展》报告

专知会员服务

6+阅读 · 4月24日

相关VIP内容

【斯坦福大学博士论文】神经网络的凸优化公式化：理论、应用与未来展望

【斯坦福大学博士论文】神经网络的凸优化公式化：理论、应用与未来展望

专知会员服务

23+阅读 · 2025年3月22日

【斯坦福博士论文】神经网络凸优化公式化：理论、应用与超越，371页pdf

【斯坦福博士论文】神经网络凸优化公式化：理论、应用与超越，371页pdf

专知会员服务

28+阅读 · 2025年3月16日

激活的三十年:神经网络400个激活函数的全面综述

激活的三十年:神经网络400个激活函数的全面综述

专知会员服务

71+阅读 · 2024年2月18日

【斯坦福博士论文】凸神经网络，Convex neural networks，228页pdf

【斯坦福博士论文】凸神经网络，Convex neural networks，228页pdf

专知会员服务

53+阅读 · 2023年11月19日

【NeurIPS2023】宽度神经网络作为高斯过程:深度均衡模型的经验教训

【NeurIPS2023】宽度神经网络作为高斯过程:深度均衡模型的经验教训

专知会员服务

26+阅读 · 2023年10月18日

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

【苏黎世联邦理工博士论文】深度神经网络的鲁棒性与正则化，233页pdf

专知会员服务

48+阅读 · 2022年11月4日

如何理解统计学习理论、优化与神经网络？伯克利Spencer Frei最新演讲报告，附58页ppt与视频

如何理解统计学习理论、优化与神经网络？伯克利Spencer Frei最新演讲报告，附58页ppt与视频

专知会员服务

45+阅读 · 2022年8月13日

【Google】具有秩-1因子的高效可扩展贝叶斯神经网络，Efficient and Scalable Bayesian Neural Nets with Rank-1 Factors

【Google】具有秩-1因子的高效可扩展贝叶斯神经网络，Efficient and Scalable Bayesian Neural Nets with Rank-1 Factors

专知会员服务

14+阅读 · 2020年5月19日

【Google大脑】进化正则激活层，Evolving Normalization-Activation Layers

【Google大脑】进化正则激活层，Evolving Normalization-Activation Layers

专知会员服务

19+阅读 · 2020年4月9日

最大均方差正则化贝叶斯神经网络，Bayesian Neural Networks With Maximum Mean Discrepancy Regularization

最大均方差正则化贝叶斯神经网络，Bayesian Neural Networks With Maximum Mean Discrepancy Regularization

专知会员服务

54+阅读 · 2020年3月5日

热门VIP内容

开通专知VIP会员享更多权益服务

多智能体协作机制

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

2025年大语言模型进展报告

非对称优势：美海军开发低成本反无人机技术

相关资讯

不可错过！图宾根大学《深度学习》课程，12讲述神经网络、GNN、GAN、序列模型等主题，附Slides与151页pdf笔记

不可错过！图宾根大学《深度学习》课程，12讲述神经网络、GNN、GAN、序列模型等主题，附Slides与151页pdf笔记

专知

18+阅读 · 2021年5月8日

【万字长文总结】如何解决"稀疏奖励(Sparse Reward)"下的强化学习问题？

【万字长文总结】如何解决"稀疏奖励(Sparse Reward)"下的强化学习问题？

深度强化学习实验室

43+阅读 · 2020年7月6日

【南洋理工大学】注意力神经网络，Attention Neural Networks，78页ppt

【南洋理工大学】注意力神经网络，Attention Neural Networks，78页ppt

专知

21+阅读 · 2019年11月9日

【南洋理工大学】图神经网络，Graph Neural Networks，附121页ppt

【南洋理工大学】图神经网络，Graph Neural Networks，附121页ppt

专知

40+阅读 · 2019年10月28日

激活函数还是有一点意思的！

激活函数还是有一点意思的！

计算机视觉战队

12+阅读 · 2019年6月28日

深入卷积神经网络背后的数学原理

深入卷积神经网络背后的数学原理

人工智能学家

10+阅读 · 2019年4月26日

干货 | 深入理解深度学习中的激活函数

干货 | 深入理解深度学习中的激活函数

计算机视觉life

16+阅读 · 2019年1月29日

手把手教你构建ResNet残差网络

手把手教你构建ResNet残差网络

专知

38+阅读 · 2018年4月27日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

Coursera吴恩达《卷积神经网络》课程笔记（1）-- 卷积神经网络基础

Coursera吴恩达《卷积神经网络》课程笔记（1）-- 卷积神经网络基础

机器学习研究会

29+阅读 · 2018年1月29日

相关论文

Memorization capacity of deep ReLU neural networks characterized by width and depth

Arxiv

0+阅读 · 3月10日

Large deviation principles for convolutional Bayesian neural networks

Arxiv

0+阅读 · 3月6日

Finite-Dimensional Gaussian Approximation for Deep Neural Networks: Universality in Random Weights

Arxiv

0+阅读 · 3月4日

Beyond NNGP: Large Deviations and Feature Learning in Bayesian Neural Networks

Arxiv

0+阅读 · 2月26日

Path-conditioned training: a principled way to rescale ReLU neural networks

Arxiv

0+阅读 · 2月23日

Better Neural Network Expressivity: Subdividing the Simplex

Arxiv

0+阅读 · 2月19日

Optimal Initialization in Depth: Lyapunov Initialization and Limit Theorems for Deep Leaky ReLU Networks

Arxiv

0+阅读 · 2月11日

Why Rectified Power Unit Networks Fail and How to Improve It: An Effective Field Theory Perspective

Arxiv

0+阅读 · 2月8日

How Controlling the Variance can Improve Training Stability of Sparsely Activated DNNs and CNNs

Arxiv

0+阅读 · 2月5日

Agnostic Learning of Arbitrary ReLU Activation under Gaussian Marginals

Arxiv

0+阅读 · 2月3日

相关基金

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

忆阻递归神经网络的多重稳定性理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

人类视空间分类的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

大型稀疏奇异复对称线性系统的高效迭代法研究

国家自然科学基金

0+阅读 · 2015年12月31日

T-S模糊神经网络的容错同步性分析

国家自然科学基金

0+阅读 · 2015年12月31日

扩散过程离散化形式下的若干统计问题的大偏差原理

国家自然科学基金

0+阅读 · 2014年12月31日

神经元网络系统的斑图动力学行为分析及控制

国家自然科学基金

0+阅读 · 2014年12月31日

反馈神经网络统一模型临界动力学研究及其在类脑计算机研制中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

高功率脉冲(10 MW)激光光纤偏振走离复合放大技术

国家自然科学基金

0+阅读 · 2014年12月31日

非凸非光滑优化的神经网络设计及其关键问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员