Quantization Effects of Artificial Neural Networks for Embedded Edge-Computing Applications

Alperen Aksoy,Ilja Bekman,Vesselin Dimitrov,Qader Dorosti,Chimezie Eguzo,Sarah Fleitmann,Christian Grewing,Fabian Hader,Andre Zambanini,Stefan van Waasen

from arxiv, deRSE26 proceedings pre-print

This paper examines the use of Quantized Neural Networks (QNNs) for two resource-constrained scientific applications: automated calibration of semi-conductor quantum bits (qubits) and scientific particle detectors. We evaluate the trade-offs between Post-Training Quantization (PTQ), Quantization-Aware Training (QAT), and ultra-low-bit Binary Neural Networks (BNNs) with respect to latency and resource usage. Our results demonstrate that PTQ achieves a four-fold reduction in memory usage for U-shaped CNN (U-Net) architectures while maintaining or slightly enhancing segmentation accuracy (e.g. from 89% to 90% for a small U-Net with 447 parameters). For the training of non-differentiable custom BNNs , we propose a novel, hardware-constrained learning approach using Genetic Algorithms (GAs). We showcase a LUT-based BNN architecture suitable for direct conversion to VHDL via the HCL4BNN framework. This method achieves nanosecond-scale inference latencies (10-15 ns) without requiring specialized DSP or BRAM resources.

翻译：本文探讨了量化神经网络（QNNs）在两种资源受限的科学应用场景中的使用：半导体量子比特（qubits）的自动校准与科学粒子探测器。我们评估了训练后量化（PTQ）、量化感知训练（QAT）以及超低比特二元神经网络（BNNs）在延迟和资源使用方面的权衡。研究结果表明，PTQ在U型卷积神经网络（U-Net）架构中实现了四倍的内存占用降低，同时保持或略微提升分割精度（例如，对于含447个参数的小型U-Net，精度从89%提升至90%）。针对不可微的定制BNN训练，我们提出了一种基于遗传算法（GAs）的硬件约束新型学习方法。我们展示了一种基于查找表（LUT）的BNN架构，该架构可通过HCL4BNN框架直接转换为VHDL。该方法无需专用DSP或BRAM资源，即可实现纳秒级推理延迟（10-15纳秒）。

相关内容

神经网络

关注 5918

人工神经网络（Artificial Neural Network，即ANN ），是20世纪80 年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象，建立某种简单模型，按不同的连接方式组成不同的网络。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型，由大量的节点（或称神经元）之间相互联接构成。每个节点代表一种特定的输出函数，称为激励函数（activation function）。每两个节点间的连接都代表一个对于通过该连接信号的加权值，称之为权重，这相当于人工神经网络的记忆。网络的输出则依网络的连接方式，权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近，也可能是对一种逻辑策略的表达。最近十多年来，人工神经网络的研究工作不断深入，已经取得了很大的进展，其在模式识别、智能机器人、自动控制、预测估计、生物、医学、经济等领域已成功地解决了许多现代计算机难以解决的实际问题，表现出了良好的智能特性。

《量子隧穿认知神经网络在军民车辆识别与情感分析中的应用》最新论文

专知会员服务

21+阅读 · 2025年7月29日

基于脉冲神经网络的边缘智能

专知会员服务

21+阅读 · 2025年7月23日

图神经网络泛化理论研究综述

专知会员服务

24+阅读 · 2025年3月22日

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

专知会员服务

27+阅读 · 2025年2月4日