Driven by the increasing demand for low-latency and real-time processing, machine learning applications are steadily migrating toward edge computing platforms, where Field-Programmable Gate Arrays (FPGAs) are widely adopted for their energy efficiency compared to CPUs and GPUs. To generate high-performance and low-power FPGA designs, several frameworks built upon High Level Synthesis (HLS) vendor tools have been proposed, among which MLIR-based frameworks are gaining significant traction due to their extensibility and ease of use. However, existing state-of-the-art frameworks often overlook the stringent resource constraints of edge devices. To address this limitation, we propose MING, an Multi-Level Intermediate Representation (MLIR)-based framework that abstracts and automates the HLS design process. Within this framework, we adopt a streaming architecture with carefully managed buffers, specifically designed to handle resource constraints while ensuring low-latency. In comparison with recent frameworks, our approach achieves on average 15x speedup for standard Convolutional Neural Network (CNN) kernels with up to four layers, and up to 200x for single-layer kernels. For kernels with larger input sizes, MING is capable of generating efficient designs that respect hardware resource constraints, whereas state-of-the-art frameworks struggle to meet.


翻译:随着对低延迟和实时处理需求的日益增长,机器学习应用正稳步向边缘计算平台迁移。在现场可编程门阵列(FPGA)因其相较于CPU和GPU的能效优势而被广泛采用的背景下,为生成高性能、低功耗的FPGA设计,已有多个基于高层次综合(HLS)厂商工具构建的框架被提出,其中基于MLIR的框架因其可扩展性和易用性正获得显著关注。然而,现有的先进框架往往忽视了边缘设备严格的资源限制。为应对这一局限,我们提出了MING,一个基于多级中间表示(MLIR)的框架,该框架对HLS设计过程进行了抽象化和自动化。在此框架内,我们采用了一种具有精心管理缓冲区的流式架构,专门设计用于在确保低延迟的同时处理资源约束。与近期框架相比,我们的方法在多达四层的标准卷积神经网络(CNN)内核上平均实现了15倍的加速,在单层内核上最高可实现200倍的加速。对于具有较大输入尺寸的内核,MING能够生成尊重硬件资源约束的高效设计,而现有先进框架则难以满足这些约束。

0
下载
关闭预览

相关内容

《面向边缘AI应用的高性能高能效架构探索》156页
专知会员服务
34+阅读 · 2025年4月12日
《为高度不确定环境中的边缘系统定义参考架构》
专知会员服务
30+阅读 · 2024年7月11日
基于机器学习的FPGA电子设计自动化技术研究综述
专知会员服务
21+阅读 · 2022年11月22日
深度神经网络 FPGA 设计进展、实现与展望
专知会员服务
59+阅读 · 2022年3月26日
深度神经网络FPGA设计进展、实现与展望
专知会员服务
36+阅读 · 2022年3月21日
《“边缘计算+”技术白皮书》,82页pdf
专知
11+阅读 · 2022年8月28日
清华大学《高级机器学习》课程
专知
40+阅读 · 2020年7月21日
深度学习时代的图模型,清华发文综述图网络
GAN生成式对抗网络
13+阅读 · 2018年12月23日
讲透RCNN, Fast-RCNN, Faster-RCNN,将CNN用于目标检测
数据挖掘入门与实战
18+阅读 · 2018年4月20日
NLP中自动生产文摘(auto text summarization)
机器学习研究会
14+阅读 · 2017年10月10日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员