Convolutional neural network (CNN) accelerators implemented on Field-Programmable Gate Arrays (FPGAs) are typically designed with a primary focus on maximizing performance, often measured in giga-operations per second (GOPS). However, real-life embedded deep learning (DL) applications impose multiple constraints related to latency, power consumption, area, and cost. This work presents a hardware-software (HW/SW) co-design methodology in which a CNN accelerator is described using high-level synthesis (HLS) tools that ease the parameterization of the design, facilitating more effective optimizations across multiple design constraints. Our experimental results demonstrate that the proposed design methodology is able to outperform non-parameterized design approaches, and it can be easily extended to other types of DL applications.


翻译:在可编程门阵列(FPGAs)上实现的卷积神经网络(CNN)加速器,其设计通常主要侧重于最大化性能,常以每秒千兆操作(GOPS)来衡量。然而,现实中的嵌入式深度学习(DL)应用在延迟、功耗、面积和成本方面存在多重约束。本文提出了一种硬件-软件(HW/SW)协同设计方法,其中使用高层次综合(HLS)工具来描述CNN加速器,这简化了设计的参数化过程,有助于在多个设计约束条件下实现更有效的优化。我们的实验结果表明,所提出的设计方法能够超越非参数化的设计方法,并且可以轻松扩展到其他类型的DL应用中。

0
下载
关闭预览

相关内容

设计是对现有状的一种重新认识和打破重组的过程,设计让一切变得更美。
深度学习中卷积的综述:应用、挑战和未来趋势
专知会员服务
38+阅读 · 2024年3月22日
【2023新书】卷积神经网络加速器,307页pdf
专知会员服务
87+阅读 · 2023年11月4日
专知会员服务
23+阅读 · 2021年7月15日
牛逼哄哄的图卷积神经网络将带来哪些机遇?
计算机视觉life
49+阅读 · 2019年3月25日
【边缘智能】边缘计算驱动的深度学习加速技术
产业智能官
20+阅读 · 2019年2月8日
硬件加速神经网络综述
计算机研究与发展
26+阅读 · 2019年2月1日
什么是深度学习的卷积?
论智
18+阅读 · 2018年8月14日
深度学习中的五大正则化方法和七大优化策略
全球人工智能
11+阅读 · 2017年12月25日
深度学习(可视化部分)-使用keras识别猫咪
北京思腾合力科技有限公司
10+阅读 · 2017年11月30日
CNN 模型压缩与加速算法综述
机器学习研究会
16+阅读 · 2017年8月25日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
VIP会员
相关VIP内容
深度学习中卷积的综述:应用、挑战和未来趋势
专知会员服务
38+阅读 · 2024年3月22日
【2023新书】卷积神经网络加速器,307页pdf
专知会员服务
87+阅读 · 2023年11月4日
专知会员服务
23+阅读 · 2021年7月15日
相关资讯
牛逼哄哄的图卷积神经网络将带来哪些机遇?
计算机视觉life
49+阅读 · 2019年3月25日
【边缘智能】边缘计算驱动的深度学习加速技术
产业智能官
20+阅读 · 2019年2月8日
硬件加速神经网络综述
计算机研究与发展
26+阅读 · 2019年2月1日
什么是深度学习的卷积?
论智
18+阅读 · 2018年8月14日
深度学习中的五大正则化方法和七大优化策略
全球人工智能
11+阅读 · 2017年12月25日
深度学习(可视化部分)-使用keras识别猫咪
北京思腾合力科技有限公司
10+阅读 · 2017年11月30日
CNN 模型压缩与加速算法综述
机器学习研究会
16+阅读 · 2017年8月25日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员