面向微控制器的神经网络量化：方法、平台与应用的全面综述 (Neural Network Quantization for Microcontrollers: A Comprehensive Survey of Methods, Platforms, and Applications) - 专知论文

会员服务 ·

0

控制器 · 网络量化 · 边缘 · 系统 · 边缘设备 ·

Neural Network Quantization for Microcontrollers: A Comprehensive Survey of Methods, Platforms, and Applications

翻译：面向微控制器的神经网络量化：方法、平台与应用的全面综述

Hamza A. Abushahla,Dara Varam,Ariel Justine N. Panopio,Mohamed I. AlHajri

from arxiv, 40 pages, 16 figures, 8 Tables

The deployment of Quantized Neural Networks (QNNs) on resource-constrained edge devices, such as microcontrollers (MCUs), introduces fundamental challenges in balancing model performance, computational complexity, and memory constraints. Tiny Machine Learning (TinyML) addresses these issues by jointly advancing machine learning algorithms, hardware architectures, and software optimization techniques to enable deep neural network inference on embedded systems. This survey provides a hardware-oriented perspective on neural network quantization, systematically reviewing the quantization methods most relevant to MCUs and extreme-edge devices. Particular emphasis is placed on the critical trade-offs between model performance and the capabilities of MCU-class hardware, including memory hierarchies, numerical representations, and accelerator support. The survey further reviews contemporary MCU hardware platforms, including ARM-based and RISC-V-based designs, as well as MCUs integrating neural processing units (NPUs) for low-precision inference, together with the supporting software stacks. In addition, we analyze real-world deployments of quantized models on MCUs and consolidate the application domains in which such systems are used. Finally, we discuss open challenges and outline promising future directions toward scalable, energy-efficient, and sustainable AI deployment on edge devices.

翻译：在资源受限的边缘设备（如微控制器）上部署量化神经网络，需要在模型性能、计算复杂度与内存限制之间取得平衡，这带来了根本性挑战。微型机器学习通过协同推进机器学习算法、硬件架构与软件优化技术，以实现在嵌入式系统上进行深度神经网络推理。本综述从硬件导向的视角探讨神经网络量化，系统性地回顾了与微控制器及极边缘设备最相关的量化方法。特别聚焦于模型性能与微控制器级硬件能力之间的关键权衡，包括内存层次结构、数值表示及加速器支持。本综述进一步评述了当代微控制器硬件平台，涵盖基于ARM和RISC-V的设计，以及集成神经处理单元以支持低精度推理的微控制器，并分析了其配套软件栈。此外，我们剖析了量化模型在微控制器上的实际部署案例，并归纳了此类系统的应用领域。最后，我们讨论了当前面临的开放挑战，并展望了在边缘设备上实现可扩展、高能效及可持续人工智能部署的未来研究方向。

0

相关内容

控制器

【CVPR2025教程】使用低精度数据类型与量化实现能效优化的神经网络

【CVPR2025教程】使用低精度数据类型与量化实现能效优化的神经网络

专知会员服务

12+阅读 · 2025年6月15日

【斯坦福博士论文】时序平滑性假设下的深度神经网络自适应与正则化方法

【斯坦福博士论文】时序平滑性假设下的深度神经网络自适应与正则化方法

专知会员服务

15+阅读 · 2025年3月25日

TinyML如何实现？法国Inria《用于微型机器学习的高效神经网络》综述，详述TinyML的神经网络设计与部署方法

TinyML如何实现？法国Inria《用于微型机器学习的高效神经网络》综述，详述TinyML的神经网络设计与部署方法

专知会员服务

40+阅读 · 2023年11月26日

能耗优化的神经网络轻量化方法研究进展

能耗优化的神经网络轻量化方法研究进展

专知会员服务

27+阅读 · 2023年1月29日

基于神经网络的偏微分方程求解方法研究综述

基于神经网络的偏微分方程求解方法研究综述

专知会员服务

72+阅读 · 2022年12月7日

轻量化神经网络卷积设计研究进展

轻量化神经网络卷积设计研究进展

专知会员服务

58+阅读 · 2021年10月24日

深度学习的轻量化神经网络结构研究综述

专知会员服务

57+阅读 · 2021年10月4日

简明《神经网络数学》手册，16页pdf带你入门，Mathematics of Neural Networks

简明《神经网络数学》手册，16页pdf带你入门，Mathematics of Neural Networks

专知会员服务

68+阅读 · 2020年5月9日

轻量级神经网络架构综述

轻量级神经网络架构综述

专知会员服务

97+阅读 · 2020年4月29日

【论文推荐】二值神经网络综述，Binary Neural Networks: A Survey

【论文推荐】二值神经网络综述，Binary Neural Networks: A Survey

专知会员服务

53+阅读 · 2020年4月8日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

最新《图卷积神经网络》中文综述论文，26页pdf，计算机学报-中科院计算所

最新《图卷积神经网络》中文综述论文，26页pdf，计算机学报-中科院计算所

专知

36+阅读 · 2020年5月19日

【2020必看书】TinyML-微型化机器学习，149页pdf，在超低功耗微控制器上用TensorFlow Lite实现机器学习

【2020必看书】TinyML-微型化机器学习，149页pdf，在超低功耗微控制器上用TensorFlow Lite实现机器学习

专知

45+阅读 · 2020年2月19日

深度神经网络可解释性方法汇总，附Tensorflow代码实现

深度神经网络可解释性方法汇总，附Tensorflow代码实现

新智元

34+阅读 · 2019年11月7日

【综述】IBM 自动机器学习网络架构搜索最新综述，附45页全文下载

【综述】IBM 自动机器学习网络架构搜索最新综述，附45页全文下载

专知

20+阅读 · 2019年5月8日

图神经网络综述：方法及应用 | Deep Reading

图神经网络综述：方法及应用 | Deep Reading

AI100

36+阅读 · 2019年3月17日

图神经网络综述：模型与应用

图神经网络综述：模型与应用

PaperWeekly

198+阅读 · 2018年12月26日

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

专知

49+阅读 · 2018年12月23日

超全总结：神经网络加速之量化模型 | 附带代码

超全总结：神经网络加速之量化模型 | 附带代码

PaperWeekly

12+阅读 · 2018年6月1日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

基于深度学习技术的视神经系统研究

国家自然科学基金

7+阅读 · 2017年12月31日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

面向传感网的软件定义测量技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向估计性能优化的网络化控制系统传感器调度

国家自然科学基金

0+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

多输入-多输出网络量化系统的分析与综合研究

国家自然科学基金

0+阅读 · 2015年12月31日

有向传感器网络量化跟踪技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

自组织递归二型小波模糊神经网络的研究及在微型飞行器姿态控制中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

网络化控制系统安全理论与关键技术

国家自然科学基金

1+阅读 · 2014年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

Quantization-Aware Regularizers for Deep Neural Networks Compression

Arxiv

0+阅读 · 2月3日

Spiking Neural Network Architecture Search: A Survey

Arxiv

0+阅读 · 2月3日

Regularisation in neural networks: a survey and empirical analysis of approaches

Arxiv

0+阅读 · 1月30日

Stochastic Modeling and Resource Dimensioning of Multi-Cellular Edge Intelligent Systems

Arxiv

0+阅读 · 1月23日

Neural Logic Networks for Interpretable Classification

Arxiv

0+阅读 · 1月22日

Graph Neural Networks, Deep Reinforcement Learning and Probabilistic Topic Modeling for Strategic Multiagent Settings

Arxiv

0+阅读 · 1月22日

Onboard Optimization and Learning: A Survey

Arxiv

0+阅读 · 1月21日

Precision Neural Networks: Joint Graph And Relational Learning

Arxiv

0+阅读 · 1月20日

On Expressive Power of Quantized Neural Networks under Fixed-Point Arithmetic

Arxiv

0+阅读 · 1月20日

Enhancing LUT-based Deep Neural Networks Inference through Architecture and Connectivity Optimization

Arxiv

0+阅读 · 1月14日

VIP会员

文章信息

相关主题

相关VIP内容

【CVPR2025教程】使用低精度数据类型与量化实现能效优化的神经网络

【CVPR2025教程】使用低精度数据类型与量化实现能效优化的神经网络

专知会员服务

12+阅读 · 2025年6月15日

【斯坦福博士论文】时序平滑性假设下的深度神经网络自适应与正则化方法

【斯坦福博士论文】时序平滑性假设下的深度神经网络自适应与正则化方法

专知会员服务

15+阅读 · 2025年3月25日

TinyML如何实现？法国Inria《用于微型机器学习的高效神经网络》综述，详述TinyML的神经网络设计与部署方法

TinyML如何实现？法国Inria《用于微型机器学习的高效神经网络》综述，详述TinyML的神经网络设计与部署方法

专知会员服务

40+阅读 · 2023年11月26日

能耗优化的神经网络轻量化方法研究进展

能耗优化的神经网络轻量化方法研究进展

专知会员服务

27+阅读 · 2023年1月29日

基于神经网络的偏微分方程求解方法研究综述

基于神经网络的偏微分方程求解方法研究综述

专知会员服务

72+阅读 · 2022年12月7日

轻量化神经网络卷积设计研究进展

轻量化神经网络卷积设计研究进展

专知会员服务

58+阅读 · 2021年10月24日

深度学习的轻量化神经网络结构研究综述

专知会员服务

57+阅读 · 2021年10月4日

简明《神经网络数学》手册，16页pdf带你入门，Mathematics of Neural Networks

简明《神经网络数学》手册，16页pdf带你入门，Mathematics of Neural Networks

专知会员服务

68+阅读 · 2020年5月9日

轻量级神经网络架构综述

轻量级神经网络架构综述

专知会员服务

97+阅读 · 2020年4月29日

【论文推荐】二值神经网络综述，Binary Neural Networks: A Survey

【论文推荐】二值神经网络综述，Binary Neural Networks: A Survey

专知会员服务

53+阅读 · 2020年4月8日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

最新《图卷积神经网络》中文综述论文，26页pdf，计算机学报-中科院计算所

最新《图卷积神经网络》中文综述论文，26页pdf，计算机学报-中科院计算所

专知

36+阅读 · 2020年5月19日

【2020必看书】TinyML-微型化机器学习，149页pdf，在超低功耗微控制器上用TensorFlow Lite实现机器学习

【2020必看书】TinyML-微型化机器学习，149页pdf，在超低功耗微控制器上用TensorFlow Lite实现机器学习

专知

45+阅读 · 2020年2月19日

深度神经网络可解释性方法汇总，附Tensorflow代码实现

深度神经网络可解释性方法汇总，附Tensorflow代码实现

新智元

34+阅读 · 2019年11月7日

【综述】IBM 自动机器学习网络架构搜索最新综述，附45页全文下载

【综述】IBM 自动机器学习网络架构搜索最新综述，附45页全文下载

专知

20+阅读 · 2019年5月8日

图神经网络综述：方法及应用 | Deep Reading

图神经网络综述：方法及应用 | Deep Reading

AI100

36+阅读 · 2019年3月17日

图神经网络综述：模型与应用

图神经网络综述：模型与应用

PaperWeekly

198+阅读 · 2018年12月26日

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

专知

49+阅读 · 2018年12月23日

超全总结：神经网络加速之量化模型 | 附带代码

超全总结：神经网络加速之量化模型 | 附带代码

PaperWeekly

12+阅读 · 2018年6月1日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

相关论文

Quantization-Aware Regularizers for Deep Neural Networks Compression

Arxiv

0+阅读 · 2月3日

Spiking Neural Network Architecture Search: A Survey

Arxiv

0+阅读 · 2月3日

Regularisation in neural networks: a survey and empirical analysis of approaches

Arxiv

0+阅读 · 1月30日

Stochastic Modeling and Resource Dimensioning of Multi-Cellular Edge Intelligent Systems

Arxiv

0+阅读 · 1月23日

Neural Logic Networks for Interpretable Classification

Arxiv

0+阅读 · 1月22日

Graph Neural Networks, Deep Reinforcement Learning and Probabilistic Topic Modeling for Strategic Multiagent Settings

Arxiv

0+阅读 · 1月22日

Onboard Optimization and Learning: A Survey

Arxiv

0+阅读 · 1月21日

Precision Neural Networks: Joint Graph And Relational Learning

Arxiv

0+阅读 · 1月20日

On Expressive Power of Quantized Neural Networks under Fixed-Point Arithmetic

Arxiv

0+阅读 · 1月20日

Enhancing LUT-based Deep Neural Networks Inference through Architecture and Connectivity Optimization

Arxiv

0+阅读 · 1月14日

相关基金

基于深度学习技术的视神经系统研究

国家自然科学基金

7+阅读 · 2017年12月31日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

面向传感网的软件定义测量技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向估计性能优化的网络化控制系统传感器调度

国家自然科学基金

0+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

多输入-多输出网络量化系统的分析与综合研究

国家自然科学基金

0+阅读 · 2015年12月31日

有向传感器网络量化跟踪技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

自组织递归二型小波模糊神经网络的研究及在微型飞行器姿态控制中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

网络化控制系统安全理论与关键技术

国家自然科学基金

1+阅读 · 2014年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员