Neuromorphic accelerators promise unparalleled energy efficiency and computational density for spiking neural networks, especially in wearable biomedical devices and neural prosthetics where power constraints are stringent. However, most existing platforms exhibit rigid architectures with limited configurability, restricting their adaptability to heterogeneous biological signals and diverse design objectives. To address these limitations, we present Flexi-NeurA--a flexible neuromorphic accelerator that unifies configurability and efficiency. Flexi-NeurA allows users to customize neuron models, network structures, and precision settings at design time. By pairing these design-time configurability features with a time-multiplexed and event-driven processing approach, Flexi-NeurA reduces the required hardware resources and total power while preserving high efficiency and low inference latency. Complementing this, we introduce Flex-plorer, a design-space exploration tool that determines cost-effective fixed-point precisions for critical parameters--such as decay factors, synaptic weights, and membrane potentials--based on user-defined trade-offs between accuracy and resource usage. Based on the configuration selected through the Flex-plorer process, RTL code is configured to match the specified design. Comprehensive evaluations across distinct domains--biomedical auditory processing, dynamic vision sensor gesture recognition, and standard vision classification--demonstrate that the hardware/software co-framework successfully balances accuracy and power budgets for diverse applications. A 3-layer 256-128-10 fully connected network with LIF neurons mapped onto two processing cores achieves 96.23% accuracy on MNIST with 1.1 ms inference latency, utilizing only 1,623 logic cells, 7 BRAMs, and 111 mW of total power--demonstrating superior resource efficiency compared to SoTA hardware baselines.


翻译:神经形态加速器在脉冲神经网络中展现出无与伦比的能效与计算密度,尤其适用于功耗约束严苛的可穿戴生物医学设备及神经假体。然而,现有平台大多结构僵化、可配置性有限,限制了其对异质生物信号和多样化设计目标的适应性。为突破上述局限,我们提出Flexi-NeurA——一种兼具可配置性与高效能的柔性神经形态加速器。该加速器支持用户在设计阶段自定义神经元模型、网络结构及精度设置。通过将设计时配置特性与时域复用、事件驱动处理方式相结合,Flexi-NeurA在保持高能效和低推理延迟的同时,显著减少了硬件资源占用和总功耗。作为配套方案,我们引入Flex-plorer设计空间探索工具,基于用户定义的精度与资源使用权衡,为衰减因子、突触权重、膜电位等关键参数确定经济高效的定点精度。根据Flex-plorer流程所选配置生成对应的RTL代码。跨领域综合评估(涵盖生物医学听觉处理、动态视觉传感器手势识别及标准视觉分类任务)表明,该硬件/软件协同框架能有效平衡不同应用场景的精度与功耗预算。采用LIF神经元的3层256-128-10全连接网络映射至两个处理核心后,在MNIST数据集上实现96.23%的准确率、1.1毫秒推理延迟,仅消耗1623个逻辑单元、7个BRAM及111毫瓦总功耗——相较现有前沿硬件基线展现出卓越的资源效率。

0
下载
关闭预览

相关内容

Processing 是一门开源编程语言和与之配套的集成开发环境(IDE)的名称。Processing 在电子艺术和视觉设计社区被用来教授编程基础,并运用于大量的新媒体和互动艺术作品中。
基于脉冲神经网络的边缘智能
专知会员服务
21+阅读 · 2025年7月23日
Nature综述:大规模神经形态计算
专知会员服务
22+阅读 · 2025年5月4日
神经形态器件的特性与发展
专知会员服务
22+阅读 · 2024年2月22日
神经网络加速器架构概述
专知会员服务
37+阅读 · 2022年4月23日
专知会员服务
18+阅读 · 2021年3月16日
【Google】利用AUTOML实现加速感知神经网络设计
专知会员服务
30+阅读 · 2020年3月5日
【NeurIPS 2020】核基渐进蒸馏加法器神经网络
专知
13+阅读 · 2020年10月19日
深度解读:小米AI实验室AutoML团队最新成果FairNAS
PaperWeekly
32+阅读 · 2019年7月11日
【边缘智能】边缘计算驱动的深度学习加速技术
产业智能官
20+阅读 · 2019年2月8日
硬件加速神经网络综述
计算机研究与发展
26+阅读 · 2019年2月1日
脉冲神经网络,下一代机器学习?
专知
13+阅读 · 2018年1月13日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
7+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
6+阅读 · 6月17日
相关VIP内容
相关资讯
相关基金
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员