脉冲神经网络在连续控制中的误差放大限制：人工神经网络转换的瓶颈 (Error Amplification Limits ANN-to-SNN Conversion in Continuous Control)

Spiking Neural Networks (SNNs) can achieve competitive performance by converting already existing well-trained Artificial Neural Networks (ANNs), avoiding further costly training. This property is particularly attractive in Reinforcement Learning (RL), where training through environment interaction is expensive and potentially unsafe. However, existing conversion methods perform poorly in continuous control, where suitable baselines are largely absent. We identify error amplification as the key cause: small action approximation errors become temporally correlated across decision steps, inducing cumulative state distribution shift and severe performance degradation. To address this issue, we propose Cross-Step Residual Potential Initialization (CRPI), a lightweight training-free mechanism that carries over residual membrane potentials across decision steps to suppress temporally correlated errors. Experiments on continuous control benchmarks with both vector and visual observations demonstrate that CRPI can be integrated into existing conversion pipelines and substantially recovers lost performance. Our results highlight continuous control as a critical and challenging benchmark for ANN-to-SNN conversion, where small errors can be strongly amplified and impact performance.

翻译：脉冲神经网络（SNNs）可通过转换已训练成熟的人工神经网络（ANNs）实现具有竞争力的性能，从而避免进一步的高成本训练。这一特性在强化学习（RL）中尤为吸引人，因为通过环境交互进行训练不仅成本高昂，且存在潜在安全风险。然而，现有转换方法在连续控制任务中表现不佳，且该领域目前基本缺乏合适的性能基准。我们发现误差放大是导致此问题的关键原因：微小的动作近似误差会在决策步骤间产生时间相关性，进而引发累积性状态分布偏移与严重的性能衰退。为解决该问题，我们提出跨步残差膜电位初始化（CRPI）——一种轻量级免训练机制，通过在决策步骤间传递残差膜电位来抑制时间相关误差。在包含向量观测与视觉观测的连续控制基准测试中，实验表明CRPI能够融入现有转换流程，并显著恢复损失的模型性能。我们的研究结果凸显了连续控制作为ANN-to-SNN转换关键挑战基准的重要性，其中微小误差可能被急剧放大并严重影响最终性能。

相关内容

神经网络

关注 5916

人工神经网络（Artificial Neural Network，即ANN ），是20世纪80 年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象，建立某种简单模型，按不同的连接方式组成不同的网络。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型，由大量的节点（或称神经元）之间相互联接构成。每个节点代表一种特定的输出函数，称为激励函数（activation function）。每两个节点间的连接都代表一个对于通过该连接信号的加权值，称之为权重，这相当于人工神经网络的记忆。网络的输出则依网络的连接方式，权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近，也可能是对一种逻辑策略的表达。最近十多年来，人工神经网络的研究工作不断深入，已经取得了很大的进展，其在模式识别、智能机器人、自动控制、预测估计、生物、医学、经济等领域已成功地解决了许多现代计算机难以解决的实际问题，表现出了良好的智能特性。

脉冲神经网络在普适计算中的潜力：综述与新视角

专知会员服务

16+阅读 · 2025年6月4日

【CVPR2025】STAA-SNN：用于脉冲神经网络的时空注意力聚合器

专知会员服务

10+阅读 · 2025年3月5日

基于脉冲神经网络的机器人智能控制研究进展

专知会员服务

25+阅读 · 2024年9月15日

脉冲神经网络的架构原理、数据集和训练方法

专知会员服务

23+阅读 · 2024年8月13日