Advancing Direct Training for Spiking Neural Networks with Circulate-Firing Neurons and Learnable Gradients - 专知论文

会员服务 ·

0

梯度 · 神经元 · 膜电位 · 神经网络 · 信息表示 ·

Advancing Direct Training for Spiking Neural Networks with Circulate-Firing Neurons and Learnable Gradients

翻译：推进尖峰神经网络直接训练：基于循环发放神经元与可学习梯度的方法

Feifan Zhou,Xiang Wei,Yang Liu,Qiang Yu

Spiking Neural Networks (SNNs) have emerged with promising energy-efficient property, yet a substantial performance gap persists compared to Artificial Neural Networks (ANNs). This gap stems from at least two key limitations: first, conventional spiking neurons offer limited information representation capacity, underutilizing the rich dynamics of membrane potentials; second, fixed surrogate gradient (SG) functions across time steps leads to imprecise gradient propagation, impeding effective direct training. To address these two challenges, we propose a new direct training algorithm with three core innovations: first, a circulate-firing spiking neuron model that enhances information representation capacity by leveraging membrane potentials more effectively; second, a time-step-wise learnable surrogate gradient function, enabling accurate gradient estimation during backpropagation; third, a positive-negative balanced loss function to achieve equilibrium between positive and negative membrane potentials and further boost SNN performance. Extensive experiments demonstrate that our methods achieve competitive performance across multiple datasets. Our methods can generalize seamlessly to advanced architectures of Transformer, consistently outperforming existing methods. Our work highlights the effectiveness of further harnessing intrinsic membrane dynamics of SNNs for performance improvement, and thus open a new avenue for advancing high-performance spiking neural architectures.

翻译：尖峰神经网络（SNNs）凭借其低能耗特性而备受关注，但与人工神经网络（ANNs）之间仍存在显著性能差距。这一差距源于至少两个关键限制：第一，传统尖峰神经元的信息表示能力有限，未能充分利用膜电位的丰富动态特性；第二，跨时间步长使用固定替代梯度（SG）函数会导致梯度传播不精确，阻碍有效直接训练。为解决这两个挑战，我们提出一种新型直接训练算法，包含三项核心创新：第一，提出循环发放尖峰神经元模型，通过更有效利用膜电位增强信息表示能力；第二，设计时间步级可学习替代梯度函数，实现反向传播中精确梯度估计；第三，构建正负平衡损失函数，实现正负膜电位之间的均衡，进一步提升SNN性能。大量实验表明，我们的方法在多个数据集上均取得具有竞争力的性能。该方法可无缝泛化至Transformer等先进架构，持续优于现有方法。本研究凸显了进一步利用SNN内在膜动力学特性提升性能的有效性，为推进高性能尖峰神经架构开辟了新途径。

0

相关内容

梯度的本意是一个向量（矢量），表示某一函数在该点处的方向导数沿着该方向取得最大值，即函数在该点处沿着该方向（此梯度的方向）变化最快，变化率最大（为该梯度的模）。

脉冲神经网络在普适计算中的潜力：综述与新视角

脉冲神经网络在普适计算中的潜力：综述与新视角

专知会员服务

16+阅读 · 2025年6月4日

【CVPR2025】STAA-SNN：用于脉冲神经网络的时空注意力聚合器

【CVPR2025】STAA-SNN：用于脉冲神经网络的时空注意力聚合器

专知会员服务

10+阅读 · 2025年3月5日

脉冲神经网络的架构原理、数据集和训练方法

脉冲神经网络的架构原理、数据集和训练方法

专知会员服务

23+阅读 · 2024年8月13日

【ETH博士论文】维数灾难与神经网络的基于梯度训练：缩小理论与应用之间的鸿沟，123页pdf

【ETH博士论文】维数灾难与神经网络的基于梯度训练：缩小理论与应用之间的鸿沟，123页pdf

专知会员服务

35+阅读 · 2023年5月31日

【MIT-Stefanie Jegelka】图神经网络理论:表示与学习，48页ppt，附视频与Slides

【MIT-Stefanie Jegelka】图神经网络理论:表示与学习，48页ppt，附视频与Slides

专知会员服务

30+阅读 · 2022年11月7日

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

专知会员服务

53+阅读 · 2022年11月2日

如何构建可信GNN？Monash团队最新《可信图神经网络：维度、方法，趋势》综述！36页pdf涵盖阐述可信GNN”六大维度

如何构建可信GNN？Monash团队最新《可信图神经网络：维度、方法，趋势》综述！36页pdf涵盖阐述可信GNN”六大维度

专知会员服务

40+阅读 · 2022年5月25日

脉冲神经网络研究现状及展望

专知会员服务

63+阅读 · 2021年9月20日

借助几何先验知识促进深度神经网络：综述 | Boosting Deep Neural Networks with Geometrical Prior Knowledge: A Survey

借助几何先验知识促进深度神经网络：综述 | Boosting Deep Neural Networks with Geometrical Prior Knowledge: A Survey

专知会员服务

29+阅读 · 2020年7月10日

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

专知会员服务

99+阅读 · 2020年7月3日

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知

17+阅读 · 2021年1月24日

深入浅出「图神经网络GNN」的原理、应用以及前景 (附赠GNN新书鼠年春节福利)

深入浅出「图神经网络GNN」的原理、应用以及前景 (附赠GNN新书鼠年春节福利)

专知

65+阅读 · 2020年1月17日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

【学界】基于GNN，强于GNN：胶囊图神经网络的PyTorch实现 | ICLR 2019

【学界】基于GNN，强于GNN：胶囊图神经网络的PyTorch实现 | ICLR 2019

GAN生成式对抗网络

31+阅读 · 2019年3月26日

掌握图神经网络GNN基本，看这篇文章就够了

掌握图神经网络GNN基本，看这篇文章就够了

新智元

164+阅读 · 2019年2月14日

脉冲神经网络与小样本学习【附PPT】

脉冲神经网络与小样本学习【附PPT】

人工智能前沿讲习班

48+阅读 · 2019年2月1日

SNN，像你的大脑一样工作

SNN，像你的大脑一样工作

中国科学院自动化研究所

80+阅读 · 2018年11月7日

脉冲神经网络，下一代机器学习？

脉冲神经网络，下一代机器学习？

专知

13+阅读 · 2018年1月13日

前沿 | 简述脉冲神经网络SNN：下一代神经网络

前沿 | 简述脉冲神经网络SNN：下一代神经网络

机器之心

39+阅读 · 2018年1月13日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

基于脉冲神经膜系统的细胞核输出信号识别方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向海量高维数据的可深度结合的贝叶斯网学习与推理新方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

脉冲神经网络敏感性及其应用研究

国家自然科学基金

10+阅读 · 2015年12月31日

一对多联想记忆中的细胞神经网络建模及参数获取方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

神经反馈康复训练的反馈策略和控制方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

光刺激实现神经纤维选择性刺激的方法研究及理论模拟

国家自然科学基金

0+阅读 · 2015年12月31日

反馈神经网络统一模型临界动力学研究及其在类脑计算机研制中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

Direct/adaptive-mixture phase-gradient learning for neural-network quantum states with complex phase structure

Arxiv

0+阅读 · 6月11日

A2SG:Adaptive and Asymmetric Surrogate Gradients for Training Deep Spiking Neural Networks

Arxiv

0+阅读 · 5月29日

NeuroRing: Scaling Spiking Neural Networks via Multi-FPGA Bidirectional Ring Topologies and Stream-Dataflow Architectures

Arxiv

0+阅读 · 5月26日

XOResNet: Exclusive-OR Meta-Residuals Facilitate Deep Spiking Neural Networks Learning

Arxiv

0+阅读 · 5月15日

NeuroTrain: Surveying Local Learning Rules for Spiking Neural Networks with an Open Benchmarking Framework

Arxiv

0+阅读 · 5月14日

Gradient-Free Training of Spiking Neural Networks via Low-Rank Evolution Strategies

Arxiv

0+阅读 · 5月14日

FiTS: Interpretable Spiking Neurons via Frequency Selectivity and Temporal Shaping

Arxiv

0+阅读 · 5月13日

Multi-Timescale Conductance Spiking Networks: A Sparse, Gradient-Trainable Framework with Rich Firing Dynamics for Enhanced Temporal Processing

Arxiv

0+阅读 · 5月12日

Breaking Global Self-Attention Bottlenecks in Transformer-based Spiking Neural Networks with Local Structure-Aware Self-Attention

Arxiv

0+阅读 · 5月12日

Globally Optimal Training of Spiking Neural Networks via Parameter Reconstruction

Arxiv

0+阅读 · 5月8日

VIP会员

文章信息

相关主题

最新内容

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

5+阅读 · 今天4:35

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

3+阅读 · 今天4:24

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

3+阅读 · 今天4:18

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 今天4:15

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 今天4:08

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

7+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

7+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

7+阅读 · 7月31日

“史诗怒火”行动：现代多域作战的重要节点

“史诗怒火”行动：现代多域作战的重要节点

专知会员服务

8+阅读 · 7月30日

《下一代无线网络中的多无人机通信资源管理》

《下一代无线网络中的多无人机通信资源管理》

专知会员服务

8+阅读 · 7月30日

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

专知会员服务

9+阅读 · 7月30日

《人机协同在安全关键型操作决策中的应用》120页

《人机协同在安全关键型操作决策中的应用》120页

专知会员服务

8+阅读 · 7月30日

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

专知会员服务

6+阅读 · 7月30日

相关VIP内容

脉冲神经网络在普适计算中的潜力：综述与新视角

脉冲神经网络在普适计算中的潜力：综述与新视角

专知会员服务

16+阅读 · 2025年6月4日

【CVPR2025】STAA-SNN：用于脉冲神经网络的时空注意力聚合器

【CVPR2025】STAA-SNN：用于脉冲神经网络的时空注意力聚合器

专知会员服务

10+阅读 · 2025年3月5日

脉冲神经网络的架构原理、数据集和训练方法

脉冲神经网络的架构原理、数据集和训练方法

专知会员服务

23+阅读 · 2024年8月13日

【ETH博士论文】维数灾难与神经网络的基于梯度训练：缩小理论与应用之间的鸿沟，123页pdf

【ETH博士论文】维数灾难与神经网络的基于梯度训练：缩小理论与应用之间的鸿沟，123页pdf

专知会员服务

35+阅读 · 2023年5月31日

【MIT-Stefanie Jegelka】图神经网络理论:表示与学习，48页ppt，附视频与Slides

【MIT-Stefanie Jegelka】图神经网络理论:表示与学习，48页ppt，附视频与Slides

专知会员服务

30+阅读 · 2022年11月7日

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

专知会员服务

53+阅读 · 2022年11月2日

如何构建可信GNN？Monash团队最新《可信图神经网络：维度、方法，趋势》综述！36页pdf涵盖阐述可信GNN”六大维度

如何构建可信GNN？Monash团队最新《可信图神经网络：维度、方法，趋势》综述！36页pdf涵盖阐述可信GNN”六大维度

专知会员服务

40+阅读 · 2022年5月25日

脉冲神经网络研究现状及展望

专知会员服务

63+阅读 · 2021年9月20日

借助几何先验知识促进深度神经网络：综述 | Boosting Deep Neural Networks with Geometrical Prior Knowledge: A Survey

借助几何先验知识促进深度神经网络：综述 | Boosting Deep Neural Networks with Geometrical Prior Knowledge: A Survey

专知会员服务

29+阅读 · 2020年7月10日

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

专知会员服务

99+阅读 · 2020年7月3日

热门VIP内容

开通专知VIP会员享更多权益服务

隐身技术前沿综述：物理机理、工程实践与战略展望

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

相关资讯

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知

17+阅读 · 2021年1月24日

深入浅出「图神经网络GNN」的原理、应用以及前景 (附赠GNN新书鼠年春节福利)

深入浅出「图神经网络GNN」的原理、应用以及前景 (附赠GNN新书鼠年春节福利)

专知

65+阅读 · 2020年1月17日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

【学界】基于GNN，强于GNN：胶囊图神经网络的PyTorch实现 | ICLR 2019

【学界】基于GNN，强于GNN：胶囊图神经网络的PyTorch实现 | ICLR 2019

GAN生成式对抗网络

31+阅读 · 2019年3月26日

掌握图神经网络GNN基本，看这篇文章就够了

掌握图神经网络GNN基本，看这篇文章就够了

新智元

164+阅读 · 2019年2月14日

脉冲神经网络与小样本学习【附PPT】

脉冲神经网络与小样本学习【附PPT】

人工智能前沿讲习班

48+阅读 · 2019年2月1日

SNN，像你的大脑一样工作

SNN，像你的大脑一样工作

中国科学院自动化研究所

80+阅读 · 2018年11月7日

脉冲神经网络，下一代机器学习？

脉冲神经网络，下一代机器学习？

专知

13+阅读 · 2018年1月13日

前沿 | 简述脉冲神经网络SNN：下一代神经网络

前沿 | 简述脉冲神经网络SNN：下一代神经网络

机器之心

39+阅读 · 2018年1月13日

相关论文

Direct/adaptive-mixture phase-gradient learning for neural-network quantum states with complex phase structure

Arxiv

0+阅读 · 6月11日

A2SG:Adaptive and Asymmetric Surrogate Gradients for Training Deep Spiking Neural Networks

Arxiv

0+阅读 · 5月29日

NeuroRing: Scaling Spiking Neural Networks via Multi-FPGA Bidirectional Ring Topologies and Stream-Dataflow Architectures

Arxiv

0+阅读 · 5月26日

XOResNet: Exclusive-OR Meta-Residuals Facilitate Deep Spiking Neural Networks Learning

Arxiv

0+阅读 · 5月15日

NeuroTrain: Surveying Local Learning Rules for Spiking Neural Networks with an Open Benchmarking Framework

Arxiv

0+阅读 · 5月14日

Gradient-Free Training of Spiking Neural Networks via Low-Rank Evolution Strategies

Arxiv

0+阅读 · 5月14日

FiTS: Interpretable Spiking Neurons via Frequency Selectivity and Temporal Shaping

Arxiv

0+阅读 · 5月13日

Multi-Timescale Conductance Spiking Networks: A Sparse, Gradient-Trainable Framework with Rich Firing Dynamics for Enhanced Temporal Processing

Arxiv

0+阅读 · 5月12日

Breaking Global Self-Attention Bottlenecks in Transformer-based Spiking Neural Networks with Local Structure-Aware Self-Attention

Arxiv

0+阅读 · 5月12日

Globally Optimal Training of Spiking Neural Networks via Parameter Reconstruction

Arxiv

0+阅读 · 5月8日

相关基金

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

基于脉冲神经膜系统的细胞核输出信号识别方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向海量高维数据的可深度结合的贝叶斯网学习与推理新方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

脉冲神经网络敏感性及其应用研究

国家自然科学基金

10+阅读 · 2015年12月31日

一对多联想记忆中的细胞神经网络建模及参数获取方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

神经反馈康复训练的反馈策略和控制方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

光刺激实现神经纤维选择性刺激的方法研究及理论模拟

国家自然科学基金

0+阅读 · 2015年12月31日

反馈神经网络统一模型临界动力学研究及其在类脑计算机研制中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员