This paper implements a Binary Neural Network (BNN) based YOLOv3-tiny-like object detector on a low-cost FPGA. The network takes 320*320*3 RGB images as input. Its main convolution layers use 1-bit weights and 8-bit activations, while Conv1 and the final detection head use fixed-point standard convolutions. From the trained ONNX model, weights, biases, and quantization parameters are extracted, converted to fixed point, packed into COE files, and stored in Vivado BRAM ROMs. The hardware is written fully in Verilog RTL and includes padding, line buffering, binary convolution, quantization post-processing, max pooling, and detection-head computation. For layers where Mul_prev is indexed by input channel and Div_current by output channel, Mul_prev is fused in-to the BNN PE so that channel-wise compensation is applied during accumulation. On VOC, the model obtains 39.6% mAP50 with 0.098 GFLOPs and 0.74 M parameters. RTL simulation shows that the final raw detection output reaches a correlation coefficient of 0.999964 and a mean absolute error of 0.020027 against the corresponding ONNX node.


翻译:本文在低成本FPGA上实现了一种基于二值神经网络(BNN)的类YOLOv3-tiny目标检测器。网络输入为320×320×3的RGB图像,其主要卷积层采用1比特权重与8比特激活,而Conv1及最终检测头则使用定点标准卷积。从训练好的ONNX模型中提取权重、偏置和量化参数,转换为定点数并打包为COE文件,存储于Vivado BRAM ROM中。硬件全部采用Verilog RTL编写,包含填充(padding)、行缓冲(line buffering)、二值卷积、量化后处理、最大池化以及检测头计算。对于按输入通道索引Mul_prev、按输出通道索引Div_current的层,将Mul_prev融合至BNN处理单元(PE),从而在累加过程中施加逐通道补偿。在VOC数据集上,该模型以0.098 GFLOPs和0.74M参数量达到了39.6%的mAP50。RTL仿真显示,最终原始检测输出与对应ONNX节点的相关系数达0.999964,平均绝对误差为0.020027。

0
下载
关闭预览

相关内容

FPGA:ACM/SIGDA International Symposium on Field-Programmable Gate Arrays。 Explanation:ACM/SIGDA现场可编程门阵列国际研讨会。 Publisher:ACM。 SIT: http://dblp.uni-trier.de/db/conf/fpga/
基于深度学习模型的图像军事目标检测
专知会员服务
27+阅读 · 2025年10月18日
《基于深度学习模型的图像军事目标检测》
专知会员服务
31+阅读 · 2025年6月28日
《利用深度学习进行目标姿态估计》2023最新63页论文
专知会员服务
48+阅读 · 2023年8月29日
基于深度学习及FPGA的装备目标检测研究
专知会员服务
52+阅读 · 2023年4月18日
基于深度学习的图像目标检测算法综述
专知会员服务
100+阅读 · 2022年4月15日
深度神经网络 FPGA 设计进展、实现与展望
专知会员服务
59+阅读 · 2022年3月26日
深度神经网络FPGA设计进展、实现与展望
专知会员服务
36+阅读 · 2022年3月21日
【文献综述】深度学习目标检测方法及其主流框架综述
专知会员服务
119+阅读 · 2020年6月26日
基于深度学习的目标检测算法剖析与实现【附PPT与视频资料】
人工智能前沿讲习班
12+阅读 · 2018年12月25日
博客 | 基于深度学习的目标检测算法综述(二)
AI研习社
11+阅读 · 2018年8月22日
深度学习时代的目标检测算法
炼数成金订阅号
40+阅读 · 2018年3月19日
基于深度学习的图像目标检测(下)
机器学习研究会
12+阅读 · 2018年1月1日
【下载】PyTorch 实现的YOLO v2目标检测算法
专知
15+阅读 · 2017年12月27日
深度学习目标检测模型全面综述:Faster R-CNN、R-FCN和SSD
深度学习世界
10+阅读 · 2017年9月18日
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
8+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
10+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
6+阅读 · 6月17日
相关VIP内容
基于深度学习模型的图像军事目标检测
专知会员服务
27+阅读 · 2025年10月18日
《基于深度学习模型的图像军事目标检测》
专知会员服务
31+阅读 · 2025年6月28日
《利用深度学习进行目标姿态估计》2023最新63页论文
专知会员服务
48+阅读 · 2023年8月29日
基于深度学习及FPGA的装备目标检测研究
专知会员服务
52+阅读 · 2023年4月18日
基于深度学习的图像目标检测算法综述
专知会员服务
100+阅读 · 2022年4月15日
深度神经网络 FPGA 设计进展、实现与展望
专知会员服务
59+阅读 · 2022年3月26日
深度神经网络FPGA设计进展、实现与展望
专知会员服务
36+阅读 · 2022年3月21日
【文献综述】深度学习目标检测方法及其主流框架综述
专知会员服务
119+阅读 · 2020年6月26日
相关基金
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员