Spiking Brain Compression: Post-Training Second-order Compression for Spiking Neural Networks - 专知论文

会员服务 ·

0

脉冲 · 脉冲神经网络 · 神经网络 · 剪枝 · 目标函数 ·

Spiking Brain Compression: Post-Training Second-order Compression for Spiking Neural Networks

翻译：脉冲神经网络后训练二阶压缩：脉冲神经网络的训练后二阶压缩方法

Lianfeng Shi,Ao Li,Benjamin Ward-Cherrier

from arxiv, Preliminary work accepted at non-archival OPT-ML workshop at NeurIPS 2025. The workshop version is available in an earlier version of this arXiv paper

Spiking Neural Networks (SNNs) have emerged as a new generation of energy-efficient neural networks suitable for implementation on neuromorphic hardware. As neuromorphic hardware has limited memory and computational resources, parameter pruning and quantization have recently been explored to improve the efficiency of SNNs. State-of-the-art SNN pruning/quantization methods employ multiple compression and training iterations, increasing the cost for pre-trained or very large SNNs. In this paper, we propose a novel one-shot post-training compression framework, Spiking Brain Compression (SBC), that extends the classical Optimal Brain Surgeon method to SNNs. SBC replaces the current-based objective found in the common layer-wise compression method with a spike-train-based objective whose Hessian is cheaply computable, allowing a single backward pass to compress parameters and analytically rescale the rest. Applying SBC to SNN pruning and quantization across event-based and static datasets (up to ImageNet), including SEW-ResNet152 and spike-driven Transformers, we achieve state-of-the-art one-shot post-training compression for SNNs, with single- to double-digit accuracy gains over ANN compression baselines ported to SNNs. We further report a synaptic-operation-based energy proxy and a calibration-size ablation, demonstrating robust performance under sub-one-sample-per-class calibration.

翻译：脉冲神经网络（SNNs）已成为适用于神经形态硬件实现的新一代高能效神经网络。由于神经形态硬件的内存和计算资源有限，近年来参数剪枝和量化技术被探索用于提升SNNs的效率。当前最先进的SNN剪枝/量化方法采用多轮压缩与训练迭代，增加了预训练或超大规模SNNs的应用成本。本文提出一种新颖的单次训练后压缩框架——脉冲大脑压缩（SBC），该方法将经典的最优脑外科医生算法扩展至SNNs。SBC将常见逐层压缩方法中基于电流的目标函数替换为基于脉冲序列的目标函数，其海森矩阵可高效计算，仅需单次反向传播即可完成参数压缩并解析式重缩放其余参数。将SBC应用于事件驱动与静态数据集（最高至ImageNet规模）的SNN剪枝与量化任务，包括SEW-ResNet152及脉冲驱动Transformer模型，我们在SNN单次训练后压缩领域实现了最先进的性能，相较于移植至SNNs的人工神经网络压缩基线方法获得了从个位数到两位数的精度提升。此外，我们通过基于突触操作的能耗代理指标及校准规模消融实验，证明了该方法在每类样本数不足一的校准条件下仍具有鲁棒性能。

0

相关内容

脉冲神经网络在普适计算中的潜力：综述与新视角

脉冲神经网络在普适计算中的潜力：综述与新视角

专知会员服务

16+阅读 · 2025年6月4日

【CVPR2025】STAA-SNN：用于脉冲神经网络的时空注意力聚合器

【CVPR2025】STAA-SNN：用于脉冲神经网络的时空注意力聚合器

专知会员服务

10+阅读 · 2025年3月5日

脉冲神经网络的架构原理、数据集和训练方法

脉冲神经网络的架构原理、数据集和训练方法

专知会员服务

23+阅读 · 2024年8月13日

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

专知会员服务

41+阅读 · 2022年11月14日

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

专知会员服务

53+阅读 · 2022年11月2日

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

专知会员服务

11+阅读 · 2022年6月5日

脉冲神经网络研究现状及展望

专知会员服务

63+阅读 · 2021年9月20日

深度神经网络模型压缩综述

专知会员服务

118+阅读 · 2020年8月22日

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

专知会员服务

99+阅读 · 2020年7月3日

【AAAI2020论文】小样本网络压缩，Few Shot Network Compression via Cross Distillation (附pdf）

专知会员服务

26+阅读 · 2019年11月23日

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知

17+阅读 · 2021年1月24日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

脉冲神经网络（SNN）概述

脉冲神经网络（SNN）概述

人工智能前沿讲习班

62+阅读 · 2019年5月30日

Google DeepMind最新报告—深度神经网络压缩进展（附PPT下载）

Google DeepMind最新报告—深度神经网络压缩进展（附PPT下载）

专知

28+阅读 · 2019年4月16日

掌握图神经网络GNN基本，看这篇文章就够了

掌握图神经网络GNN基本，看这篇文章就够了

新智元

164+阅读 · 2019年2月14日

明早10点大讲堂 | 训练深度脉冲神经网络

明早10点大讲堂 | 训练深度脉冲神经网络

AI研习社

12+阅读 · 2019年1月24日

【优青论文】深度神经网络压缩与加速综述

【优青论文】深度神经网络压缩与加速综述

计算机研究与发展

17+阅读 · 2018年9月20日

【干货】Batch Normalization: 如何更快地训练深度神经网络

【干货】Batch Normalization: 如何更快地训练深度神经网络

专知

13+阅读 · 2018年3月6日

脉冲神经网络，下一代机器学习？

脉冲神经网络，下一代机器学习？

专知

13+阅读 · 2018年1月13日

前沿 | 简述脉冲神经网络SNN：下一代神经网络

前沿 | 简述脉冲神经网络SNN：下一代神经网络

机器之心

39+阅读 · 2018年1月13日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

基于脉冲神经膜系统的细胞核输出信号识别方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

脉冲神经网络敏感性及其应用研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于压缩感知的网络层析成像技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于不完全测量信息的随机忆阻神经网络的参数与状态估计问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

神经反馈康复训练的反馈策略和控制方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

两类典型脉冲延时神经网络的Hopf分岔研究

国家自然科学基金

0+阅读 · 2015年12月31日

光刺激实现神经纤维选择性刺激的方法研究及理论模拟

国家自然科学基金

0+阅读 · 2015年12月31日

压缩感知与稀疏信号恢复

国家自然科学基金

2+阅读 · 2014年12月31日

Energy-Aware Spike Budgeting for Continual Learning in Spiking Neural Networks for Neuromorphic Vision

Arxiv

0+阅读 · 2月12日

Three factor delay learning rules for spiking neural networks

Arxiv

0+阅读 · 2月12日

From Lightweight CNNs to SpikeNets: Benchmarking Accuracy-Energy Tradeoffs with Pruned Spiking SqueezeNet

Arxiv

0+阅读 · 2月10日

PC-SNN: Predictive Coding-based Local Hebbian Plasticity Learning in Spiking Neural Networks

Arxiv

0+阅读 · 2月7日

SpikingGamma: Surrogate-Gradient Free and Temporally Precise Online Training of Spiking Neural Networks with Smoothed Delays

Arxiv

0+阅读 · 2月2日

Proxy Target: Bridging the Gap Between Discrete Spiking Neural Networks and Continuous Control

Arxiv

0+阅读 · 2月2日

FireFly-S: Exploiting Dual-Side Sparsity for Spiking Neural Networks Acceleration with Reconfigurable Spatial Architecture

Arxiv

0+阅读 · 1月29日

STEMS: Spatial-Temporal Mapping For Spiking Neural Networks

Arxiv

0+阅读 · 1月28日

Reliable Brain Tumor Segmentation Based on Spiking Neural Networks with Efficient Training

Arxiv

0+阅读 · 1月23日

ADMM-Based Training for Spiking Neural Networks

Arxiv

0+阅读 · 1月18日

VIP会员

文章信息

相关主题

脉冲神经网络

最新内容

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

专知会员服务

7+阅读 · 5月31日

比利时发布用于实时战场军事装备识别的离线人工智能系统

比利时发布用于实时战场军事装备识别的离线人工智能系统

专知会员服务

5+阅读 · 5月31日

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

专知会员服务

4+阅读 · 5月31日

超越网格：作战环境对炮兵的影响

超越网格：作战环境对炮兵的影响

专知会员服务

2+阅读 · 5月31日

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

专知会员服务

8+阅读 · 5月31日

综述 | 推理时控制：可信大语言模型的运行时治理全景

综述 | 推理时控制：可信大语言模型的运行时治理全景

专知会员服务

4+阅读 · 5月31日

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

6+阅读 · 5月30日

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

7+阅读 · 5月30日

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

7+阅读 · 5月30日

美以伊战争：首次人工智能战争——军事自主性困境

美以伊战争：首次人工智能战争——军事自主性困境

专知会员服务

7+阅读 · 5月30日

《Palantir任务保障性软件安全标准（MA-S2）》

《Palantir任务保障性软件安全标准（MA-S2）》

专知会员服务

19+阅读 · 5月30日

《美海军利用扩展现实增强知识流动研究》300页报告

《美海军利用扩展现实增强知识流动研究》300页报告

专知会员服务

10+阅读 · 5月30日

基于声学的无人机检测技术综述

基于声学的无人机检测技术综述

专知会员服务

11+阅读 · 5月30日

《当代混合战争分析框架：俄乌战争经验教训》

《当代混合战争分析框架：俄乌战争经验教训》

专知会员服务

10+阅读 · 5月30日

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

专知会员服务

14+阅读 · 5月29日

相关VIP内容

脉冲神经网络在普适计算中的潜力：综述与新视角

脉冲神经网络在普适计算中的潜力：综述与新视角

专知会员服务

16+阅读 · 2025年6月4日

【CVPR2025】STAA-SNN：用于脉冲神经网络的时空注意力聚合器

【CVPR2025】STAA-SNN：用于脉冲神经网络的时空注意力聚合器

专知会员服务

10+阅读 · 2025年3月5日

脉冲神经网络的架构原理、数据集和训练方法

脉冲神经网络的架构原理、数据集和训练方法

专知会员服务

23+阅读 · 2024年8月13日

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

专知会员服务

41+阅读 · 2022年11月14日

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

专知会员服务

53+阅读 · 2022年11月2日

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

专知会员服务

11+阅读 · 2022年6月5日

脉冲神经网络研究现状及展望

专知会员服务

63+阅读 · 2021年9月20日

深度神经网络模型压缩综述

专知会员服务

118+阅读 · 2020年8月22日

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

专知会员服务

99+阅读 · 2020年7月3日

【AAAI2020论文】小样本网络压缩，Few Shot Network Compression via Cross Distillation (附pdf）

专知会员服务

26+阅读 · 2019年11月23日

热门VIP内容

开通专知VIP会员享更多权益服务

比利时发布用于实时战场军事装备识别的离线人工智能系统

超越网格：作战环境对炮兵的影响

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

相关资讯

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知

17+阅读 · 2021年1月24日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

脉冲神经网络（SNN）概述

脉冲神经网络（SNN）概述

人工智能前沿讲习班

62+阅读 · 2019年5月30日

Google DeepMind最新报告—深度神经网络压缩进展（附PPT下载）

Google DeepMind最新报告—深度神经网络压缩进展（附PPT下载）

专知

28+阅读 · 2019年4月16日

掌握图神经网络GNN基本，看这篇文章就够了

掌握图神经网络GNN基本，看这篇文章就够了

新智元

164+阅读 · 2019年2月14日

明早10点大讲堂 | 训练深度脉冲神经网络

明早10点大讲堂 | 训练深度脉冲神经网络

AI研习社

12+阅读 · 2019年1月24日

【优青论文】深度神经网络压缩与加速综述

【优青论文】深度神经网络压缩与加速综述

计算机研究与发展

17+阅读 · 2018年9月20日

【干货】Batch Normalization: 如何更快地训练深度神经网络

【干货】Batch Normalization: 如何更快地训练深度神经网络

专知

13+阅读 · 2018年3月6日

脉冲神经网络，下一代机器学习？

脉冲神经网络，下一代机器学习？

专知

13+阅读 · 2018年1月13日

前沿 | 简述脉冲神经网络SNN：下一代神经网络

前沿 | 简述脉冲神经网络SNN：下一代神经网络

机器之心

39+阅读 · 2018年1月13日

相关论文

Energy-Aware Spike Budgeting for Continual Learning in Spiking Neural Networks for Neuromorphic Vision

Arxiv

0+阅读 · 2月12日

Three factor delay learning rules for spiking neural networks

Arxiv

0+阅读 · 2月12日

From Lightweight CNNs to SpikeNets: Benchmarking Accuracy-Energy Tradeoffs with Pruned Spiking SqueezeNet

Arxiv

0+阅读 · 2月10日

PC-SNN: Predictive Coding-based Local Hebbian Plasticity Learning in Spiking Neural Networks

Arxiv

0+阅读 · 2月7日

SpikingGamma: Surrogate-Gradient Free and Temporally Precise Online Training of Spiking Neural Networks with Smoothed Delays

Arxiv

0+阅读 · 2月2日

Proxy Target: Bridging the Gap Between Discrete Spiking Neural Networks and Continuous Control

Arxiv

0+阅读 · 2月2日

FireFly-S: Exploiting Dual-Side Sparsity for Spiking Neural Networks Acceleration with Reconfigurable Spatial Architecture

Arxiv

0+阅读 · 1月29日

STEMS: Spatial-Temporal Mapping For Spiking Neural Networks

Arxiv

0+阅读 · 1月28日

Reliable Brain Tumor Segmentation Based on Spiking Neural Networks with Efficient Training

Arxiv

0+阅读 · 1月23日

ADMM-Based Training for Spiking Neural Networks

Arxiv

0+阅读 · 1月18日

相关基金

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

基于脉冲神经膜系统的细胞核输出信号识别方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

脉冲神经网络敏感性及其应用研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于压缩感知的网络层析成像技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于不完全测量信息的随机忆阻神经网络的参数与状态估计问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

神经反馈康复训练的反馈策略和控制方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

两类典型脉冲延时神经网络的Hopf分岔研究

国家自然科学基金

0+阅读 · 2015年12月31日

光刺激实现神经纤维选择性刺激的方法研究及理论模拟

国家自然科学基金

0+阅读 · 2015年12月31日

压缩感知与稀疏信号恢复

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员