Development of embedded target detection system based on FPGA and YOLOv3-Tiny - 专知论文

会员服务 ·

0

设计 · FPGA · 卷积 · 可约的 · MoDELS ·

Development of embedded target detection system based on FPGA and YOLOv3-Tiny

翻译：基于FPGA和YOLOv3-Tiny的嵌入式目标检测系统开发

Zihan Jiang,Fanghao Liu,Huawei Wang,Mamataziz Mattohti,Xiangquan Chen,Jingfu Guo,Xiaotian Wu,Yongjun Dong

Computational complexity and storage requirements are crucial factors influencing the performance and efficiency of convolutional neural networks (CNNs) in resource-constrained environments. This paper presents a high-performance embedded target detection system based on FPGA and YOLOv3-Tiny, specifically designed for embedded artificial intelligence applications. By integrating lightweight CNN optimization techniques with hardware accelerator design, significant improvements are made in both computational efficiency and resource utilization. Key optimizations, including low-bit quantization, batch normalization fusion, and table lookup mapping, reduce model parameters and computational complexity. Additionally, an FPGA hardware accelerator with a pipelined architecture is developed to enhance the efficiency of convolution operations while minimizing off-chip data transmission through modular design and on-chip cache optimization. On the ZYNQ-XC7Z035 platform, the system achieves an inference latency of 0.211 seconds, outperforming comparable designs by 75.58% in speed. The system achieves an power efficiency of 10.11 GOPS/W, surpassing comparable designs by at least 29.45%. Furthermore, hardware resource utilization is reduced by up to 51.94% compared to similar systems. This study offers innovative design methodologies and practical application examples for the efficient deployment of deep learning models on embedded platforms.

翻译：计算复杂度与存储需求是影响卷积神经网络（CNN）在资源受限环境中性能与效率的关键因素。本文提出一种基于FPGA和YOLOv3-Tiny的高性能嵌入式目标检测系统，专为嵌入式人工智能应用设计。通过将轻量化CNN优化技术与硬件加速器设计相结合，在计算效率与资源利用率方面均取得了显著提升。关键优化技术（包括低位量化、批归一化融合与查表映射）有效减少了模型参数与计算复杂度。此外，采用流水线架构的FPGA硬件加速器增强了卷积运算效率，并通过模块化设计与片上缓存优化减少了片外数据传输。在ZYNQ-XC7Z035平台上，该系统实现了0.211秒的推理延迟，速度较同类设计提升75.58%；能效达10.11 GOPS/W，较同类设计提升至少29.45%。此外，与同类系统相比，硬件资源利用率降低高达51.94%。本研究为深度学习模型在嵌入式平台上的高效部署提供了创新设计方法与实际应用范例。

0

相关内容

设计是对现有状的一种重新认识和打破重组的过程，设计让一切变得更美。

基于深度学习模型的图像军事目标检测

基于深度学习模型的图像军事目标检测

专知会员服务

27+阅读 · 2025年10月18日

《基于深度学习模型的图像军事目标检测》

《基于深度学习模型的图像军事目标检测》

专知会员服务

31+阅读 · 2025年6月28日

视觉-自动目标识别《深度学习算法在长波红外导弹导引头中的应用》346页

视觉-自动目标识别《深度学习算法在长波红外导弹导引头中的应用》346页

专知会员服务

64+阅读 · 2024年3月16日

基于深度学习及FPGA的装备目标检测研究

基于深度学习及FPGA的装备目标检测研究

专知会员服务

52+阅读 · 2023年4月18日

使用多层胶囊网络的国防军事目标检测

使用多层胶囊网络的国防军事目标检测

专知会员服务

46+阅读 · 2022年8月14日

深度神经网络 FPGA 设计进展、实现与展望

深度神经网络 FPGA 设计进展、实现与展望

专知会员服务

59+阅读 · 2022年3月26日

深度神经网络FPGA设计进展、实现与展望

深度神经网络FPGA设计进展、实现与展望

专知会员服务

36+阅读 · 2022年3月21日

基于弱监督学习的目标检测研究进展

专知会员服务

28+阅读 · 2021年8月24日

【文献综述】深度学习目标检测方法及其主流框架综述

【文献综述】深度学习目标检测方法及其主流框架综述

专知会员服务

119+阅读 · 2020年6月26日

【新书】高级应用深度学习，卷积神经网络和目标检测（Advanced Applied Deep Learning ，Convolutional Neural Networks and Object Detection），附294页pdf

【新书】高级应用深度学习，卷积神经网络和目标检测（Advanced Applied Deep Learning ，Convolutional Neural Networks and Object Detection），附294页pdf

专知会员服务

95+阅读 · 2020年1月9日

YOLOv5在建筑工地中安全帽佩戴检测的应用（已开源+数据集）

YOLOv5在建筑工地中安全帽佩戴检测的应用（已开源+数据集）

计算机视觉life

24+阅读 · 2020年11月10日

从锚点到关键点，最新的目标检测方法发展趋势

从锚点到关键点，最新的目标检测方法发展趋势

计算机视觉life

17+阅读 · 2019年8月20日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

YOLOv3目标检测有了TensorFlow实现，可用自己的数据来训练

YOLOv3目标检测有了TensorFlow实现，可用自己的数据来训练

量子位

19+阅读 · 2019年1月12日

基于视频的目标检测的发展【附PPT与视频资料】

基于视频的目标检测的发展【附PPT与视频资料】

人工智能前沿讲习班

19+阅读 · 2018年12月14日

从零开始PyTorch项目：YOLO v3目标检测实现

从零开始PyTorch项目：YOLO v3目标检测实现

机器之心

15+阅读 · 2018年4月23日

深度学习时代的目标检测算法

深度学习时代的目标检测算法

炼数成金订阅号

40+阅读 · 2018年3月19日

基于深度学习的图像目标检测(下)

基于深度学习的图像目标检测(下)

机器学习研究会

12+阅读 · 2018年1月1日

【下载】PyTorch 实现的YOLO v2目标检测算法

【下载】PyTorch 实现的YOLO v2目标检测算法

专知

15+阅读 · 2017年12月27日

深度学习目标检测模型全面综述：Faster R-CNN、R-FCN和SSD

深度学习目标检测模型全面综述：Faster R-CNN、R-FCN和SSD

深度学习世界

10+阅读 · 2017年9月18日

基于共性视觉特征与反馈机制的SAR图像目标检测方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于视觉特性的目标检测算法研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向传感网的软件定义测量技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向估计性能优化的网络化控制系统传感器调度

国家自然科学基金

0+阅读 · 2015年12月31日

基于生物视觉启发特征和遮挡模型的复杂道路环境目标检测方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于语义模型的高分辨率卫星遥感图像人造目标检测方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于CP-OFDM发射波形的目标检测算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

用于癫痫发作预测的脑电特征深度学习研究

国家自然科学基金

3+阅读 · 2015年12月31日

场景深度关系下的视频遮挡目标检测

国家自然科学基金

1+阅读 · 2015年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

PrototypeNAS: Rapid Design of Deep Neural Networks for Microcontroller Units

Arxiv

0+阅读 · 6月18日

An Improved CNN-LSTM Based Intrusion Detection System for IoT Networks

Arxiv

0+阅读 · 6月4日

BMCR: Adaptive Backbone Module Composition via Reinforcement Learning for Remote Sensing Object Detection

Arxiv

0+阅读 · 6月4日

Towards Intrusion Detection Systems for RPL-based IoT Networks using Foundation Models

Arxiv

0+阅读 · 6月2日

OpenEye: A Scalable Open-Source Hardware Accelerator for DNNs

Arxiv

0+阅读 · 5月31日

Precomputed 1D-CNNs for Atrial Fibrillation Detection on Tiny Smart Sensor Systems

Arxiv

0+阅读 · 5月29日

Precomputed 1D-CNNs for Atrial Fibrillation Detection on Tiny Smart Sensor Systems

Arxiv

0+阅读 · 5月28日

Hardware Utilization and Inference Performance of Edge Object Detection Under Fault Injection

Arxiv

0+阅读 · 5月15日

Heterogeneous SoC Integrating an Open-Source Recurrent SNN Accelerator for Neuromorphic Edge Computing on FPGA

Arxiv

0+阅读 · 5月12日

Design and Implementation of BNN-Based Object Detection on FPGA

Arxiv

0+阅读 · 5月5日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

3+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

4+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

9+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

8+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

5+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

7+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

6+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

10+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

4+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

6+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

7+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

6+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

5+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

相关VIP内容

基于深度学习模型的图像军事目标检测

基于深度学习模型的图像军事目标检测

专知会员服务

27+阅读 · 2025年10月18日

《基于深度学习模型的图像军事目标检测》

《基于深度学习模型的图像军事目标检测》

专知会员服务

31+阅读 · 2025年6月28日

视觉-自动目标识别《深度学习算法在长波红外导弹导引头中的应用》346页

视觉-自动目标识别《深度学习算法在长波红外导弹导引头中的应用》346页

专知会员服务

64+阅读 · 2024年3月16日

基于深度学习及FPGA的装备目标检测研究

基于深度学习及FPGA的装备目标检测研究

专知会员服务

52+阅读 · 2023年4月18日

使用多层胶囊网络的国防军事目标检测

使用多层胶囊网络的国防军事目标检测

专知会员服务

46+阅读 · 2022年8月14日

深度神经网络 FPGA 设计进展、实现与展望

深度神经网络 FPGA 设计进展、实现与展望

专知会员服务

59+阅读 · 2022年3月26日

深度神经网络FPGA设计进展、实现与展望

深度神经网络FPGA设计进展、实现与展望

专知会员服务

36+阅读 · 2022年3月21日

基于弱监督学习的目标检测研究进展

专知会员服务

28+阅读 · 2021年8月24日

【文献综述】深度学习目标检测方法及其主流框架综述

【文献综述】深度学习目标检测方法及其主流框架综述

专知会员服务

119+阅读 · 2020年6月26日

【新书】高级应用深度学习，卷积神经网络和目标检测（Advanced Applied Deep Learning ，Convolutional Neural Networks and Object Detection），附294页pdf

【新书】高级应用深度学习，卷积神经网络和目标检测（Advanced Applied Deep Learning ，Convolutional Neural Networks and Object Detection），附294页pdf

专知会员服务

95+阅读 · 2020年1月9日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

YOLOv5在建筑工地中安全帽佩戴检测的应用（已开源+数据集）

YOLOv5在建筑工地中安全帽佩戴检测的应用（已开源+数据集）

计算机视觉life

24+阅读 · 2020年11月10日

从锚点到关键点，最新的目标检测方法发展趋势

从锚点到关键点，最新的目标检测方法发展趋势

计算机视觉life

17+阅读 · 2019年8月20日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

YOLOv3目标检测有了TensorFlow实现，可用自己的数据来训练

YOLOv3目标检测有了TensorFlow实现，可用自己的数据来训练

量子位

19+阅读 · 2019年1月12日

基于视频的目标检测的发展【附PPT与视频资料】

基于视频的目标检测的发展【附PPT与视频资料】

人工智能前沿讲习班

19+阅读 · 2018年12月14日

从零开始PyTorch项目：YOLO v3目标检测实现

从零开始PyTorch项目：YOLO v3目标检测实现

机器之心

15+阅读 · 2018年4月23日

深度学习时代的目标检测算法

深度学习时代的目标检测算法

炼数成金订阅号

40+阅读 · 2018年3月19日

基于深度学习的图像目标检测(下)

基于深度学习的图像目标检测(下)

机器学习研究会

12+阅读 · 2018年1月1日

【下载】PyTorch 实现的YOLO v2目标检测算法

【下载】PyTorch 实现的YOLO v2目标检测算法

专知

15+阅读 · 2017年12月27日

深度学习目标检测模型全面综述：Faster R-CNN、R-FCN和SSD

深度学习目标检测模型全面综述：Faster R-CNN、R-FCN和SSD

深度学习世界

10+阅读 · 2017年9月18日

相关论文

PrototypeNAS: Rapid Design of Deep Neural Networks for Microcontroller Units

Arxiv

0+阅读 · 6月18日

An Improved CNN-LSTM Based Intrusion Detection System for IoT Networks

Arxiv

0+阅读 · 6月4日

BMCR: Adaptive Backbone Module Composition via Reinforcement Learning for Remote Sensing Object Detection

Arxiv

0+阅读 · 6月4日

Towards Intrusion Detection Systems for RPL-based IoT Networks using Foundation Models

Arxiv

0+阅读 · 6月2日

OpenEye: A Scalable Open-Source Hardware Accelerator for DNNs

Arxiv

0+阅读 · 5月31日

Precomputed 1D-CNNs for Atrial Fibrillation Detection on Tiny Smart Sensor Systems

Arxiv

0+阅读 · 5月29日

Precomputed 1D-CNNs for Atrial Fibrillation Detection on Tiny Smart Sensor Systems

Arxiv

0+阅读 · 5月28日

Hardware Utilization and Inference Performance of Edge Object Detection Under Fault Injection

Arxiv

0+阅读 · 5月15日

Heterogeneous SoC Integrating an Open-Source Recurrent SNN Accelerator for Neuromorphic Edge Computing on FPGA

Arxiv

0+阅读 · 5月12日

Design and Implementation of BNN-Based Object Detection on FPGA

Arxiv

0+阅读 · 5月5日

相关基金

基于共性视觉特征与反馈机制的SAR图像目标检测方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于视觉特性的目标检测算法研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向传感网的软件定义测量技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向估计性能优化的网络化控制系统传感器调度

国家自然科学基金

0+阅读 · 2015年12月31日

基于生物视觉启发特征和遮挡模型的复杂道路环境目标检测方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于语义模型的高分辨率卫星遥感图像人造目标检测方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于CP-OFDM发射波形的目标检测算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

用于癫痫发作预测的脑电特征深度学习研究

国家自然科学基金

3+阅读 · 2015年12月31日

场景深度关系下的视频遮挡目标检测

国家自然科学基金

1+阅读 · 2015年12月31日

物联网关键技术RFID系统安全测试的仿真架构.评估模型和受攻击模式的研究和实践

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员