On the Role of Depth in the Expressivity of RNNs - 专知论文

会员服务 ·

0

RNN · 变换 · 交互 · 循环神经网络 · 神经网络 ·

On the Role of Depth in the Expressivity of RNNs

翻译：深度在循环神经网络表达能力中的作用

Maude Lizaire,Michael Rizvi-Martel,Éric Dupuis,Guillaume Rabusseau

The benefits of depth in feedforward neural networks are well known: composing multiple layers of linear transformations with nonlinear activations enables complex computations. While similar effects are expected in recurrent neural networks (RNNs), it remains unclear how depth interacts with recurrence to shape expressive power. Here, we formally show that depth increases RNNs' memory capacity efficiently with respect to the number of parameters, thus enhancing expressivity both by enabling more complex input transformations and improving the retention of past information. We broaden our analysis to 2RNNs, a generalization of RNNs with multiplicative interactions between inputs and hidden states. Unlike RNNs, which remain linear without nonlinear activations, 2RNNs perform polynomial transformations whose maximal degree grows with depth. We further show that multiplicative interactions cannot, in general, be replaced by layerwise nonlinearities. Finally, we validate these insights empirically on synthetic and real-world tasks.

翻译：前馈神经网络中深度的优势众所周知：通过将多层线性变换与非线性激活函数组合，可实现复杂计算。尽管循环神经网络（RNN）中预期存在类似效应，但深度如何与循环交互以塑造表达能力仍不清晰。本文严格证明，深度可高效提升RNN在参数数量上的记忆容量，从而通过实现更复杂的输入变换和改善历史信息保留来增强表达能力。我们将分析拓展至2RNN——一种输入与隐藏状态间存在乘法交互的RNN泛化形式。不同于缺乏非线性激活时仍保持线性的标准RNN，2RNN执行最大阶数随深度增长的多项式变换。我们进一步证明，乘法交互通常无法被逐层非线性替代。最后，我们在合成任务和真实世界任务中实证验证了这些见解。

0

相关内容

RNN

RNN:循环神经网络，是深度学习的一种模型。

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

专知会员服务

27+阅读 · 2025年2月4日

神经网络宽度是什么？EPFL博士论文《有限宽度神经网络的理论：泛化、缩放定律和损失观》，197页pdf

神经网络宽度是什么？EPFL博士论文《有限宽度神经网络的理论：泛化、缩放定律和损失观》，197页pdf

专知会员服务

35+阅读 · 2023年8月24日

深度学习算法发展简述，从DNN到Transformer再到ChatGPT

深度学习算法发展简述，从DNN到Transformer再到ChatGPT

专知会员服务

153+阅读 · 2022年12月22日

Nature. Mach. Intell. |基于梯度的学习通过平衡压缩和扩展来驱动循环神经网络中的鲁棒表示

Nature. Mach. Intell. |基于梯度的学习通过平衡压缩和扩展来驱动循环神经网络中的鲁棒表示

专知会员服务

10+阅读 · 2022年6月23日

借助几何先验知识促进深度神经网络：综述 | Boosting Deep Neural Networks with Geometrical Prior Knowledge: A Survey

借助几何先验知识促进深度神经网络：综述 | Boosting Deep Neural Networks with Geometrical Prior Knowledge: A Survey

专知会员服务

29+阅读 · 2020年7月10日

【剑桥大学博士论文】深层神经网络结构的复兴，147页pdf，The resurgence of structure in deep neural networks

【剑桥大学博士论文】深层神经网络结构的复兴，147页pdf，The resurgence of structure in deep neural networks

专知会员服务

20+阅读 · 2020年5月14日

深度卷积神经网络的最新架构综述，A Survey of the Recent Architectures of Deep Convolutional Neural Networks

深度卷积神经网络的最新架构综述，A Survey of the Recent Architectures of Deep Convolutional Neural Networks

专知会员服务

49+阅读 · 2020年2月15日

深度神经网络模型的个体差异，Individual differences among deep neural network models

深度神经网络模型的个体差异，Individual differences among deep neural network models

专知会员服务

10+阅读 · 2020年1月11日

【论文】将符号知识嵌入到深层网络中（Embedding Symbolic Knowledge into Deep Networks）

【论文】将符号知识嵌入到深层网络中（Embedding Symbolic Knowledge into Deep Networks）

专知会员服务

33+阅读 · 2019年12月30日

【图机器学习论文】图神经网络的逻辑表达性（Logical Expressiveness of Graph Neural Networks）

【图机器学习论文】图神经网络的逻辑表达性（Logical Expressiveness of Graph Neural Networks）

专知会员服务

41+阅读 · 2019年12月30日

干货 | 循环神经网络（RNN）和LSTM初学者指南

干货 | 循环神经网络（RNN）和LSTM初学者指南

THU数据派

15+阅读 · 2019年1月25日

博客 | Tensorflow系列专题（九）：一文综述RNN循环神经网络

博客 | Tensorflow系列专题（九）：一文综述RNN循环神经网络

AI研习社

13+阅读 · 2018年12月3日

深度学习循环神经网络详解

深度学习循环神经网络详解

七月在线实验室

16+阅读 · 2018年5月28日

CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)概念区分理解

CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)概念区分理解

数据挖掘入门与实战

33+阅读 · 2018年2月12日

深度学习之CNN简介

深度学习之CNN简介

Python技术博文

20+阅读 · 2018年1月10日

深度学习中的五大正则化方法和七大优化策略

深度学习中的五大正则化方法和七大优化策略

全球人工智能

11+阅读 · 2017年12月25日

CNN、RNN在自动特征提取中的应用

CNN、RNN在自动特征提取中的应用

乌镇智库

14+阅读 · 2017年8月4日

[学习] CNN（卷积神经网络）、RNN（循环神经网络）、DNN（深度神经网络）的内部网络结构有什么区别？

[学习] CNN（卷积神经网络）、RNN（循环神经网络）、DNN（深度神经网络）的内部网络结构有什么区别？

菜鸟的机器学习

38+阅读 · 2017年7月26日

【深度学习基础】4. Recurrent Neural Networks

【深度学习基础】4. Recurrent Neural Networks

微信AI

16+阅读 · 2017年7月19日

LSTM、GRU与神经图灵机：详解深度学习最热门的循环神经网络

LSTM、GRU与神经图灵机：详解深度学习最热门的循环神经网络

机器之心

11+阅读 · 2017年7月8日

基于深度学习技术的视神经系统研究

国家自然科学基金

7+阅读 · 2017年12月31日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

忆阻递归神经网络的多重稳定性理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度卷积神经网络的多源遥感图像时空融合方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向人类工作记忆改善的脑电复杂网络信息反馈非线性计算模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

临界态对生物神经网络学习、记忆以及模式识别能力的影响

国家自然科学基金

0+阅读 · 2015年12月31日

基于高阶信息和深度表示的图像复原研究

国家自然科学基金

1+阅读 · 2015年12月31日

极限学习机拓展研究及其在近红外光谱分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

反馈神经网络统一模型临界动力学研究及其在类脑计算机研制中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

ParaRNN: An Interpretable and Parallelizable Recurrent Neural Network for Time-Dependent Data

Arxiv

0+阅读 · 5月4日

NeuroRing: Scaling Spiking Neural Networks via Multi-FPGA Bidirectional Ring Topologies and Stream-Dataflow Architectures

Arxiv

0+阅读 · 4月30日

Understanding DNNs in Feature Interaction Models: A Dimensional Collapse Perspective

Arxiv

0+阅读 · 4月29日

HiPreNets: High-Precision Neural Networks through Progressive Training

Arxiv

0+阅读 · 4月17日

Introducing Echo Networks for Computational Neuroevolution

Arxiv

0+阅读 · 4月9日

Deep Neural Networks: A Formulation Via Non-Archimedean Analysis

Arxiv

0+阅读 · 3月30日

From Reachability to Learnability: Geometric Design Principles for Quantum Neural Networks

Arxiv

0+阅读 · 3月25日

Unveiling Hidden Convexity in Deep Learning: a Sparse Signal Processing Perspective

Arxiv

0+阅读 · 3月25日

Universality of shallow and deep neural networks on non-Euclidean spaces

Arxiv

0+阅读 · 3月21日

The Expressive Power of Graph Neural Networks: A Survey

Arxiv

10+阅读 · 2023年8月16日

VIP会员

文章信息

相关主题

循环神经网络

最新内容

对抗环境下超视距目标打击的情报支援

对抗环境下超视距目标打击的情报支援

专知会员服务

3+阅读 · 57分钟前

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

专知会员服务

1+阅读 · 今天14:25

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

专知会员服务

1+阅读 · 今天13:57

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

专知会员服务

1+阅读 · 今天13:27

《无人机对海面作战影响评估》

《无人机对海面作战影响评估》

专知会员服务

11+阅读 · 7月21日

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

专知会员服务

10+阅读 · 7月21日

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

专知会员服务

4+阅读 · 7月21日

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

专知会员服务

6+阅读 · 7月21日

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

专知会员服务

8+阅读 · 7月21日

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

6+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

8+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

6+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

9+阅读 · 7月20日

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

8+阅读 · 7月20日

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

10+阅读 · 7月20日

相关VIP内容

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

专知会员服务

27+阅读 · 2025年2月4日

神经网络宽度是什么？EPFL博士论文《有限宽度神经网络的理论：泛化、缩放定律和损失观》，197页pdf

神经网络宽度是什么？EPFL博士论文《有限宽度神经网络的理论：泛化、缩放定律和损失观》，197页pdf

专知会员服务

35+阅读 · 2023年8月24日

深度学习算法发展简述，从DNN到Transformer再到ChatGPT

深度学习算法发展简述，从DNN到Transformer再到ChatGPT

专知会员服务

153+阅读 · 2022年12月22日

Nature. Mach. Intell. |基于梯度的学习通过平衡压缩和扩展来驱动循环神经网络中的鲁棒表示

Nature. Mach. Intell. |基于梯度的学习通过平衡压缩和扩展来驱动循环神经网络中的鲁棒表示

专知会员服务

10+阅读 · 2022年6月23日

借助几何先验知识促进深度神经网络：综述 | Boosting Deep Neural Networks with Geometrical Prior Knowledge: A Survey

借助几何先验知识促进深度神经网络：综述 | Boosting Deep Neural Networks with Geometrical Prior Knowledge: A Survey

专知会员服务

29+阅读 · 2020年7月10日

【剑桥大学博士论文】深层神经网络结构的复兴，147页pdf，The resurgence of structure in deep neural networks

【剑桥大学博士论文】深层神经网络结构的复兴，147页pdf，The resurgence of structure in deep neural networks

专知会员服务

20+阅读 · 2020年5月14日

深度卷积神经网络的最新架构综述，A Survey of the Recent Architectures of Deep Convolutional Neural Networks

深度卷积神经网络的最新架构综述，A Survey of the Recent Architectures of Deep Convolutional Neural Networks

专知会员服务

49+阅读 · 2020年2月15日

深度神经网络模型的个体差异，Individual differences among deep neural network models

深度神经网络模型的个体差异，Individual differences among deep neural network models

专知会员服务

10+阅读 · 2020年1月11日

【论文】将符号知识嵌入到深层网络中（Embedding Symbolic Knowledge into Deep Networks）

【论文】将符号知识嵌入到深层网络中（Embedding Symbolic Knowledge into Deep Networks）

专知会员服务

33+阅读 · 2019年12月30日

【图机器学习论文】图神经网络的逻辑表达性（Logical Expressiveness of Graph Neural Networks）

【图机器学习论文】图神经网络的逻辑表达性（Logical Expressiveness of Graph Neural Networks）

专知会员服务

41+阅读 · 2019年12月30日

热门VIP内容

开通专知VIP会员享更多权益服务

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

对抗环境下超视距目标打击的情报支援

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

相关资讯

干货 | 循环神经网络（RNN）和LSTM初学者指南

干货 | 循环神经网络（RNN）和LSTM初学者指南

THU数据派

15+阅读 · 2019年1月25日

博客 | Tensorflow系列专题（九）：一文综述RNN循环神经网络

博客 | Tensorflow系列专题（九）：一文综述RNN循环神经网络

AI研习社

13+阅读 · 2018年12月3日

深度学习循环神经网络详解

深度学习循环神经网络详解

七月在线实验室

16+阅读 · 2018年5月28日

CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)概念区分理解

CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)概念区分理解

数据挖掘入门与实战

33+阅读 · 2018年2月12日

深度学习之CNN简介

深度学习之CNN简介

Python技术博文

20+阅读 · 2018年1月10日

深度学习中的五大正则化方法和七大优化策略

深度学习中的五大正则化方法和七大优化策略

全球人工智能

11+阅读 · 2017年12月25日

CNN、RNN在自动特征提取中的应用

CNN、RNN在自动特征提取中的应用

乌镇智库

14+阅读 · 2017年8月4日

[学习] CNN（卷积神经网络）、RNN（循环神经网络）、DNN（深度神经网络）的内部网络结构有什么区别？

[学习] CNN（卷积神经网络）、RNN（循环神经网络）、DNN（深度神经网络）的内部网络结构有什么区别？

菜鸟的机器学习

38+阅读 · 2017年7月26日

【深度学习基础】4. Recurrent Neural Networks

【深度学习基础】4. Recurrent Neural Networks

微信AI

16+阅读 · 2017年7月19日

LSTM、GRU与神经图灵机：详解深度学习最热门的循环神经网络

LSTM、GRU与神经图灵机：详解深度学习最热门的循环神经网络

机器之心

11+阅读 · 2017年7月8日

相关论文

ParaRNN: An Interpretable and Parallelizable Recurrent Neural Network for Time-Dependent Data

Arxiv

0+阅读 · 5月4日

NeuroRing: Scaling Spiking Neural Networks via Multi-FPGA Bidirectional Ring Topologies and Stream-Dataflow Architectures

Arxiv

0+阅读 · 4月30日

Understanding DNNs in Feature Interaction Models: A Dimensional Collapse Perspective

Arxiv

0+阅读 · 4月29日

HiPreNets: High-Precision Neural Networks through Progressive Training

Arxiv

0+阅读 · 4月17日

Introducing Echo Networks for Computational Neuroevolution

Arxiv

0+阅读 · 4月9日

Deep Neural Networks: A Formulation Via Non-Archimedean Analysis

Arxiv

0+阅读 · 3月30日

From Reachability to Learnability: Geometric Design Principles for Quantum Neural Networks

Arxiv

0+阅读 · 3月25日

Unveiling Hidden Convexity in Deep Learning: a Sparse Signal Processing Perspective

Arxiv

0+阅读 · 3月25日

Universality of shallow and deep neural networks on non-Euclidean spaces

Arxiv

0+阅读 · 3月21日

The Expressive Power of Graph Neural Networks: A Survey

Arxiv

10+阅读 · 2023年8月16日

相关基金

基于深度学习技术的视神经系统研究

国家自然科学基金

7+阅读 · 2017年12月31日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

忆阻递归神经网络的多重稳定性理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度卷积神经网络的多源遥感图像时空融合方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向人类工作记忆改善的脑电复杂网络信息反馈非线性计算模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

临界态对生物神经网络学习、记忆以及模式识别能力的影响

国家自然科学基金

0+阅读 · 2015年12月31日

基于高阶信息和深度表示的图像复原研究

国家自然科学基金

1+阅读 · 2015年12月31日

极限学习机拓展研究及其在近红外光谱分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

反馈神经网络统一模型临界动力学研究及其在类脑计算机研制中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员