泊松超平面过程与修正线性单元 (Poisson Hyperplane Processes with Rectified Linear Units) - 专知论文

会员服务 ·

0

ReLU · 神经网络 · 超平面 · 单元 · PHP ·

Poisson Hyperplane Processes with Rectified Linear Units

翻译：泊松超平面过程与修正线性单元

Shufei Ge,Shijia Wang,Lloyd Elliott

Neural networks have shown state-of-the-art performances in various classification and regression tasks. Rectified linear units (ReLU) are often used as activation functions for the hidden layers in a neural network model. In this article, we establish the connection between the Poisson hyperplane processes (PHP) and two-layer ReLU neural networks. We show that the PHP with a Gaussian prior is an alternative probabilistic representation to a two-layer ReLU neural network. In addition, we show that a two-layer neural network constructed by PHP is scalable to large-scale problems via the decomposition propositions. Finally, we propose an annealed sequential Monte Carlo algorithm for Bayesian inference. Our numerical experiments demonstrate that our proposed method outperforms the classic two-layer ReLU neural network. The implementation of our proposed model is available at https://github.com/ShufeiGe/Pois_Relu.git.

翻译：神经网络在各类分类与回归任务中展现出最先进的性能。修正线性单元（ReLU）常被用作神经网络模型隐藏层的激活函数。本文建立了泊松超平面过程（PHP）与两层ReLU神经网络之间的联系。我们证明，具有高斯先验的PHP是两层ReLU神经网络的另一种概率表示。此外，通过分解命题，我们证明了由PHP构建的两层神经网络可扩展至大规模问题。最后，我们提出了一种用于贝叶斯推断的退火序贯蒙特卡罗算法。数值实验表明，我们提出的方法优于经典的两层ReLU神经网络。所提模型的实现代码可在 https://github.com/ShufeiGe/Pois_Relu.git 获取。

0

相关内容

ReLU

面向大语言模型对齐的机械解释性：进展、挑战与未来方向

面向大语言模型对齐的机械解释性：进展、挑战与未来方向

专知会员服务

14+阅读 · 2月14日

【斯坦福大学博士论文】神经网络的凸优化公式化：理论、应用与未来展望

【斯坦福大学博士论文】神经网络的凸优化公式化：理论、应用与未来展望

专知会员服务

23+阅读 · 2025年3月22日

【斯坦福博士论文】神经网络凸优化公式化：理论、应用与超越，371页pdf

【斯坦福博士论文】神经网络凸优化公式化：理论、应用与超越，371页pdf

专知会员服务

28+阅读 · 2025年3月16日

【剑桥大学博士论文】卷积条件神经过程，226页pdf

【剑桥大学博士论文】卷积条件神经过程，226页pdf

专知会员服务

25+阅读 · 2024年8月21日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

111+阅读 · 2023年12月19日

深度学习算法发展简述，从DNN到Transformer再到ChatGPT

深度学习算法发展简述，从DNN到Transformer再到ChatGPT

专知会员服务

153+阅读 · 2022年12月22日

【NeurIPS 2021-康奈尔大学Guandao Yang】基于神经场的几何处理，Geometry Processing with Neural Fields

【NeurIPS 2021-康奈尔大学Guandao Yang】基于神经场的几何处理，Geometry Processing with Neural Fields

专知会员服务

25+阅读 · 2022年3月27日

【香港中文大学&华为等】双曲图神经网络:方法与应用综述，Hyperbolic Graph Neural Networks: A Review of Methods and Applications

【香港中文大学&华为等】双曲图神经网络:方法与应用综述，Hyperbolic Graph Neural Networks: A Review of Methods and Applications

专知会员服务

21+阅读 · 2022年3月2日

【剑桥大学ICLR2020】卷积条件神经过程，Convolutional Conditional Neural Processes

【剑桥大学ICLR2020】卷积条件神经过程，Convolutional Conditional Neural Processes

专知会员服务

33+阅读 · 2020年1月19日

【AAAI2020-清华大学】高效的异构协同过滤推荐（Efficient Heterogeneous Collaborative Filtering without Negative Sampling for Recommendation），张敏，马少平等

【AAAI2020-清华大学】高效的异构协同过滤推荐（Efficient Heterogeneous Collaborative Filtering without Negative Sampling for Recommendation），张敏，马少平等

专知会员服务

61+阅读 · 2019年11月22日

【WWW2020】结构深度聚类网络， Structural Deep Clustering Network，北京邮电大学

【WWW2020】结构深度聚类网络， Structural Deep Clustering Network，北京邮电大学

专知

31+阅读 · 2020年2月19日

LeCun力荐，PyTorch官方权威教程书来了，意外的通俗易懂

LeCun力荐，PyTorch官方权威教程书来了，意外的通俗易懂

机器之心

22+阅读 · 2019年11月22日

一文读懂线性回归、岭回归和Lasso回归

一文读懂线性回归、岭回归和Lasso回归

CSDN

34+阅读 · 2019年10月13日

激活函数还是有一点意思的！

激活函数还是有一点意思的！

计算机视觉战队

12+阅读 · 2019年6月28日

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

专知

49+阅读 · 2018年12月23日

数据分析师应该知道的16种回归方法：泊松回归

数据分析师应该知道的16种回归方法：泊松回归

数萃大数据

35+阅读 · 2018年9月13日

线性回归：简单线性回归详解

线性回归：简单线性回归详解

专知

12+阅读 · 2018年3月10日

Coursera吴恩达《卷积神经网络》课程笔记（1）-- 卷积神经网络基础

Coursera吴恩达《卷积神经网络》课程笔记（1）-- 卷积神经网络基础

机器学习研究会

29+阅读 · 2018年1月29日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

学界 | 深度学习在单图像超分辨率上的应用：SRCNN、Perceptual loss、SRResNet

学界 | 深度学习在单图像超分辨率上的应用：SRCNN、Perceptual loss、SRResNet

机器之心

12+阅读 · 2017年11月7日

非独立泊松白噪声激励下随机非线性系统的响应研究

国家自然科学基金

0+阅读 · 2015年12月31日

由单负美特材料(metamaterials)组成的复合结构中电磁波的非线性传播与调控研究

国家自然科学基金

0+阅读 · 2015年12月31日

非线性双曲型随机偏微分方程及其相关研究

国家自然科学基金

0+阅读 · 2015年12月31日

非线性双曲方程的间断有限元超收敛分析和应用

国家自然科学基金

1+阅读 · 2015年12月31日

薛定谔泊松方程的动力学研究

国家自然科学基金

0+阅读 · 2015年12月31日

拟线性抛物方程及微机电系统新动力学模型的基础理论研究

国家自然科学基金

0+阅读 · 2014年12月31日

超线性增长条件下的混杂型随机时滞微分方程

国家自然科学基金

0+阅读 · 2014年12月31日

Poisson流形上的修正Hamilton方法

国家自然科学基金

0+阅读 · 2014年12月31日

变分法与非线性微分方程

国家自然科学基金

0+阅读 · 2014年12月31日

奇异线性方程组和具有特定结构的非线性问题的研究与应用

国家自然科学基金

0+阅读 · 2014年12月31日

Improving the Linearized Laplace Approximation via Quadratic Approximations

Arxiv

0+阅读 · 2月3日

Agnostic Learning of Arbitrary ReLU Activation under Gaussian Marginals

Arxiv

0+阅读 · 2月3日

Diagonal Linear Networks and the Lasso Regularization Path

Arxiv

0+阅读 · 1月28日

Order-Optimal Sample Complexity of Rectified Flows

Arxiv

0+阅读 · 1月28日

Hidden Monotonicity: Explaining Deep Neural Networks via their DC Decomposition

Arxiv

0+阅读 · 1月14日

A New Family of Poisson Non-negative Matrix Factorization Methods Using the Shifted Log Link

Arxiv

0+阅读 · 1月9日

Simplex Deep Linear Discriminant Analysis

Arxiv

0+阅读 · 1月4日

Relaxed Equivariance via Multitask Learning

Arxiv

0+阅读 · 1月4日

Two-hidden-layer ReLU neural networks and finite elements

Arxiv

0+阅读 · 1月4日

Proof-Carrying PWL Verification for ReLU Networks: Convex-Hull Semantics, Exact \SMT/\MILP Encodings, and Symbolic Certificate Checking

Arxiv

0+阅读 · 2025年12月30日

VIP会员

文章信息

相关主题

相关VIP内容

面向大语言模型对齐的机械解释性：进展、挑战与未来方向

面向大语言模型对齐的机械解释性：进展、挑战与未来方向

专知会员服务

14+阅读 · 2月14日

【斯坦福大学博士论文】神经网络的凸优化公式化：理论、应用与未来展望

【斯坦福大学博士论文】神经网络的凸优化公式化：理论、应用与未来展望

专知会员服务

23+阅读 · 2025年3月22日

【斯坦福博士论文】神经网络凸优化公式化：理论、应用与超越，371页pdf

【斯坦福博士论文】神经网络凸优化公式化：理论、应用与超越，371页pdf

专知会员服务

28+阅读 · 2025年3月16日

【剑桥大学博士论文】卷积条件神经过程，226页pdf

【剑桥大学博士论文】卷积条件神经过程，226页pdf

专知会员服务

25+阅读 · 2024年8月21日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

111+阅读 · 2023年12月19日

深度学习算法发展简述，从DNN到Transformer再到ChatGPT

深度学习算法发展简述，从DNN到Transformer再到ChatGPT

专知会员服务

153+阅读 · 2022年12月22日

【NeurIPS 2021-康奈尔大学Guandao Yang】基于神经场的几何处理，Geometry Processing with Neural Fields

【NeurIPS 2021-康奈尔大学Guandao Yang】基于神经场的几何处理，Geometry Processing with Neural Fields

专知会员服务

25+阅读 · 2022年3月27日

【香港中文大学&华为等】双曲图神经网络:方法与应用综述，Hyperbolic Graph Neural Networks: A Review of Methods and Applications

【香港中文大学&华为等】双曲图神经网络:方法与应用综述，Hyperbolic Graph Neural Networks: A Review of Methods and Applications

专知会员服务

21+阅读 · 2022年3月2日

【剑桥大学ICLR2020】卷积条件神经过程，Convolutional Conditional Neural Processes

【剑桥大学ICLR2020】卷积条件神经过程，Convolutional Conditional Neural Processes

专知会员服务

33+阅读 · 2020年1月19日

【AAAI2020-清华大学】高效的异构协同过滤推荐（Efficient Heterogeneous Collaborative Filtering without Negative Sampling for Recommendation），张敏，马少平等

【AAAI2020-清华大学】高效的异构协同过滤推荐（Efficient Heterogeneous Collaborative Filtering without Negative Sampling for Recommendation），张敏，马少平等

专知会员服务

61+阅读 · 2019年11月22日

热门VIP内容

开通专知VIP会员享更多权益服务

论学习、公平性与复杂度

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

2025中国人工智能学会系列白皮书⸺棋盘上的人工智能|附下载

通用智能体评估的逻辑架构

相关资讯

【WWW2020】结构深度聚类网络， Structural Deep Clustering Network，北京邮电大学

【WWW2020】结构深度聚类网络， Structural Deep Clustering Network，北京邮电大学

专知

31+阅读 · 2020年2月19日

LeCun力荐，PyTorch官方权威教程书来了，意外的通俗易懂

LeCun力荐，PyTorch官方权威教程书来了，意外的通俗易懂

机器之心

22+阅读 · 2019年11月22日

一文读懂线性回归、岭回归和Lasso回归

一文读懂线性回归、岭回归和Lasso回归

CSDN

34+阅读 · 2019年10月13日

激活函数还是有一点意思的！

激活函数还是有一点意思的！

计算机视觉战队

12+阅读 · 2019年6月28日

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

专知

49+阅读 · 2018年12月23日

数据分析师应该知道的16种回归方法：泊松回归

数据分析师应该知道的16种回归方法：泊松回归

数萃大数据

35+阅读 · 2018年9月13日

线性回归：简单线性回归详解

线性回归：简单线性回归详解

专知

12+阅读 · 2018年3月10日

Coursera吴恩达《卷积神经网络》课程笔记（1）-- 卷积神经网络基础

Coursera吴恩达《卷积神经网络》课程笔记（1）-- 卷积神经网络基础

机器学习研究会

29+阅读 · 2018年1月29日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

学界 | 深度学习在单图像超分辨率上的应用：SRCNN、Perceptual loss、SRResNet

学界 | 深度学习在单图像超分辨率上的应用：SRCNN、Perceptual loss、SRResNet

机器之心

12+阅读 · 2017年11月7日

相关论文

Improving the Linearized Laplace Approximation via Quadratic Approximations

Arxiv

0+阅读 · 2月3日

Agnostic Learning of Arbitrary ReLU Activation under Gaussian Marginals

Arxiv

0+阅读 · 2月3日

Diagonal Linear Networks and the Lasso Regularization Path

Arxiv

0+阅读 · 1月28日

Order-Optimal Sample Complexity of Rectified Flows

Arxiv

0+阅读 · 1月28日

Hidden Monotonicity: Explaining Deep Neural Networks via their DC Decomposition

Arxiv

0+阅读 · 1月14日

A New Family of Poisson Non-negative Matrix Factorization Methods Using the Shifted Log Link

Arxiv

0+阅读 · 1月9日

Simplex Deep Linear Discriminant Analysis

Arxiv

0+阅读 · 1月4日

Relaxed Equivariance via Multitask Learning

Arxiv

0+阅读 · 1月4日

Two-hidden-layer ReLU neural networks and finite elements

Arxiv

0+阅读 · 1月4日

Proof-Carrying PWL Verification for ReLU Networks: Convex-Hull Semantics, Exact \SMT/\MILP Encodings, and Symbolic Certificate Checking

Arxiv

0+阅读 · 2025年12月30日

相关基金

非独立泊松白噪声激励下随机非线性系统的响应研究

国家自然科学基金

0+阅读 · 2015年12月31日

由单负美特材料(metamaterials)组成的复合结构中电磁波的非线性传播与调控研究

国家自然科学基金

0+阅读 · 2015年12月31日

非线性双曲型随机偏微分方程及其相关研究

国家自然科学基金

0+阅读 · 2015年12月31日

非线性双曲方程的间断有限元超收敛分析和应用

国家自然科学基金

1+阅读 · 2015年12月31日

薛定谔泊松方程的动力学研究

国家自然科学基金

0+阅读 · 2015年12月31日

拟线性抛物方程及微机电系统新动力学模型的基础理论研究

国家自然科学基金

0+阅读 · 2014年12月31日

超线性增长条件下的混杂型随机时滞微分方程

国家自然科学基金

0+阅读 · 2014年12月31日

Poisson流形上的修正Hamilton方法

国家自然科学基金

0+阅读 · 2014年12月31日

变分法与非线性微分方程

国家自然科学基金

0+阅读 · 2014年12月31日

奇异线性方程组和具有特定结构的非线性问题的研究与应用

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员