面向嵌入式深度学习应用的可参数化卷积加速器 (A Parameterizable Convolution Accelerator for Embedded Deep Learning Applications) - 专知论文

会员服务 ·

0

设计 · 参数化 · 嵌入 · 嵌入式 · 设计方法 ·

A Parameterizable Convolution Accelerator for Embedded Deep Learning Applications

翻译：面向嵌入式深度学习应用的可参数化卷积加速器

Panagiotis Mousouliotis,Georgios Keramidas

from arxiv, 6 pages, 4 figures. Published in the proceedings of the 2025 IEEE Computer Society Annual Symposium on VLSI (ISVLSI 2025), Kalamata, Greece, 6-9 July 2025

Convolutional neural network (CNN) accelerators implemented on Field-Programmable Gate Arrays (FPGAs) are typically designed with a primary focus on maximizing performance, often measured in giga-operations per second (GOPS). However, real-life embedded deep learning (DL) applications impose multiple constraints related to latency, power consumption, area, and cost. This work presents a hardware-software (HW/SW) co-design methodology in which a CNN accelerator is described using high-level synthesis (HLS) tools that ease the parameterization of the design, facilitating more effective optimizations across multiple design constraints. Our experimental results demonstrate that the proposed design methodology is able to outperform non-parameterized design approaches, and it can be easily extended to other types of DL applications.

翻译：在可编程门阵列（FPGAs）上实现的卷积神经网络（CNN）加速器，其设计通常主要侧重于最大化性能，常以每秒千兆操作（GOPS）来衡量。然而，现实中的嵌入式深度学习（DL）应用在延迟、功耗、面积和成本方面存在多重约束。本文提出了一种硬件-软件（HW/SW）协同设计方法，其中使用高层次综合（HLS）工具来描述CNN加速器，这简化了设计的参数化过程，有助于在多个设计约束条件下实现更有效的优化。我们的实验结果表明，所提出的设计方法能够超越非参数化的设计方法，并且可以轻松扩展到其他类型的DL应用中。

0

相关内容

设计是对现有状的一种重新认识和打破重组的过程，设计让一切变得更美。

【普林斯顿博士论文】深度学习加速器的编译器支持：端到端评估与数据访问优化

【普林斯顿博士论文】深度学习加速器的编译器支持：端到端评估与数据访问优化

专知会员服务

18+阅读 · 2025年1月7日

深度学习中卷积的综述：应用、挑战和未来趋势

深度学习中卷积的综述：应用、挑战和未来趋势

专知会员服务

38+阅读 · 2024年3月22日

【2023新书】卷积神经网络加速器，307页pdf

【2023新书】卷积神经网络加速器，307页pdf

专知会员服务

87+阅读 · 2023年11月4日

【干货书】深度学习系统: 大规模生产的算法、编译器和处理器，267页pdf

【干货书】深度学习系统: 大规模生产的算法、编译器和处理器，267页pdf

专知会员服务

91+阅读 · 2022年6月1日

南洋理工北大等首篇《GPU数据中心中深度学习工作负载调度》综述论文，35页pdf全面阐述DL训练与推理GPU调度技术进展

南洋理工北大等首篇《GPU数据中心中深度学习工作负载调度》综述论文，35页pdf全面阐述DL训练与推理GPU调度技术进展

专知会员服务

45+阅读 · 2022年5月27日

【深度神经网络加速器的硬件近似技术综述】Hardware Approximate Techniques for Deep Neural Network Accelerators: A Survey

【深度神经网络加速器的硬件近似技术综述】Hardware Approximate Techniques for Deep Neural Network Accelerators: A Survey

专知会员服务

16+阅读 · 2022年3月17日

基于粗粒度数据流架构的稀疏卷积神经网络加速

专知会员服务

23+阅读 · 2021年7月15日

深度学习理论与架构最新进展综述论文，66页pdf，333篇参考文献

深度学习理论与架构最新进展综述论文，66页pdf，333篇参考文献

专知会员服务

85+阅读 · 2020年8月28日

深度卷积神经网络的最新架构综述，A Survey of the Recent Architectures of Deep Convolutional Neural Networks

深度卷积神经网络的最新架构综述，A Survey of the Recent Architectures of Deep Convolutional Neural Networks

专知会员服务

49+阅读 · 2020年2月15日

【论文】评估可扩展贝叶斯深度学习强大的计算机视觉的方法（Evaluating Scalable Bayesian Deep LearningMethods for Robust Computer Vision）

【论文】评估可扩展贝叶斯深度学习强大的计算机视觉的方法（Evaluating Scalable Bayesian Deep LearningMethods for Robust Computer Vision）

专知会员服务

12+阅读 · 2020年1月13日

牛逼哄哄的图卷积神经网络将带来哪些机遇？

牛逼哄哄的图卷积神经网络将带来哪些机遇？

计算机视觉life

49+阅读 · 2019年3月25日

【边缘智能】边缘计算驱动的深度学习加速技术

【边缘智能】边缘计算驱动的深度学习加速技术

产业智能官

20+阅读 · 2019年2月8日

硬件加速神经网络综述

硬件加速神经网络综述

计算机研究与发展

26+阅读 · 2019年2月1日

【论文综述】深度卷积神经网络架构最新进展综述（附60页全文下载）

【论文综述】深度卷积神经网络架构最新进展综述（附60页全文下载）

专知

29+阅读 · 2019年1月23日

最新基于FPGA的深度学习加速器综述论文（附下载）

最新基于FPGA的深度学习加速器综述论文（附下载）

专知

23+阅读 · 2019年1月17日

什么是深度学习的卷积？

什么是深度学习的卷积？

论智

18+阅读 · 2018年8月14日

深度学习中的五大正则化方法和七大优化策略

深度学习中的五大正则化方法和七大优化策略

全球人工智能

11+阅读 · 2017年12月25日

深度学习（可视化部分）-使用keras识别猫咪

深度学习（可视化部分）-使用keras识别猫咪

北京思腾合力科技有限公司

10+阅读 · 2017年11月30日

学界 | 深度学习在单图像超分辨率上的应用：SRCNN、Perceptual loss、SRResNet

学界 | 深度学习在单图像超分辨率上的应用：SRCNN、Perceptual loss、SRResNet

机器之心

12+阅读 · 2017年11月7日

CNN 模型压缩与加速算法综述

CNN 模型压缩与加速算法综述

机器学习研究会

16+阅读 · 2017年8月25日

基于加速网的光电混合三维互连架构设计方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

6+阅读 · 2015年12月31日

光电混合型高速高精度数模转换器的关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模动态异构网络的支持多用户并发任务的物联网应用构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于强化学习的分布参数系统数据驱动控制

国家自然科学基金

7+阅读 · 2015年12月31日

基于动态匹配的高能量利用率多层堆叠结构静态随机存储器（SRAM）关键技术

国家自然科学基金

0+阅读 · 2015年12月31日

超低待机功耗快速唤醒的微控制器关键技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向大数据计算的高吞吐量众核处理器关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

SimulatorCoder: DNN Accelerator Simulator Code Generation and Optimization via Large Language Models

Arxiv

0+阅读 · 2月19日

Hardware-accelerated graph neural networks: an alternative approach for neuromorphic event-based audio classification and keyword spotting on SoC FPGA

Arxiv

0+阅读 · 2月18日

The Turbo-Charged Mapper: Fast and Optimal Mapping for Accelerator Modeling and Evaluation

Arxiv

0+阅读 · 2月16日

DPUConfig: Optimizing ML Inference in FPGAs Using Reinforcement Learning

Arxiv

0+阅读 · 2月13日

LAAFD: LLM-based Agents for Accelerated FPGA Design

Arxiv

0+阅读 · 2月4日

Dual-pronged deep learning preprocessing on heterogeneous platforms with CPU, Accelerator and CSD

Arxiv

0+阅读 · 1月29日

An Energy-Efficient RFET-Based Stochastic Computing Neural Network Accelerator

Arxiv

0+阅读 · 1月28日

A Reconfigurable Framework for AI-FPGA Agent Integration and Acceleration

Arxiv

0+阅读 · 1月27日

MetaML-Pro: Cross-Stage Design Flow Automation for Efficient Deep Learning Acceleration

Arxiv

0+阅读 · 1月24日

Continuous-Flow Data-Rate-Aware CNN Inference on FPGA

Arxiv

0+阅读 · 1月16日

VIP会员

文章信息

相关主题

相关VIP内容

【普林斯顿博士论文】深度学习加速器的编译器支持：端到端评估与数据访问优化

【普林斯顿博士论文】深度学习加速器的编译器支持：端到端评估与数据访问优化

专知会员服务

18+阅读 · 2025年1月7日

深度学习中卷积的综述：应用、挑战和未来趋势

深度学习中卷积的综述：应用、挑战和未来趋势

专知会员服务

38+阅读 · 2024年3月22日

【2023新书】卷积神经网络加速器，307页pdf

【2023新书】卷积神经网络加速器，307页pdf

专知会员服务

87+阅读 · 2023年11月4日

【干货书】深度学习系统: 大规模生产的算法、编译器和处理器，267页pdf

【干货书】深度学习系统: 大规模生产的算法、编译器和处理器，267页pdf

专知会员服务

91+阅读 · 2022年6月1日

南洋理工北大等首篇《GPU数据中心中深度学习工作负载调度》综述论文，35页pdf全面阐述DL训练与推理GPU调度技术进展

南洋理工北大等首篇《GPU数据中心中深度学习工作负载调度》综述论文，35页pdf全面阐述DL训练与推理GPU调度技术进展

专知会员服务

45+阅读 · 2022年5月27日

【深度神经网络加速器的硬件近似技术综述】Hardware Approximate Techniques for Deep Neural Network Accelerators: A Survey

【深度神经网络加速器的硬件近似技术综述】Hardware Approximate Techniques for Deep Neural Network Accelerators: A Survey

专知会员服务

16+阅读 · 2022年3月17日

基于粗粒度数据流架构的稀疏卷积神经网络加速

专知会员服务

23+阅读 · 2021年7月15日

深度学习理论与架构最新进展综述论文，66页pdf，333篇参考文献

深度学习理论与架构最新进展综述论文，66页pdf，333篇参考文献

专知会员服务

85+阅读 · 2020年8月28日

深度卷积神经网络的最新架构综述，A Survey of the Recent Architectures of Deep Convolutional Neural Networks

深度卷积神经网络的最新架构综述，A Survey of the Recent Architectures of Deep Convolutional Neural Networks

专知会员服务

49+阅读 · 2020年2月15日

【论文】评估可扩展贝叶斯深度学习强大的计算机视觉的方法（Evaluating Scalable Bayesian Deep LearningMethods for Robust Computer Vision）

【论文】评估可扩展贝叶斯深度学习强大的计算机视觉的方法（Evaluating Scalable Bayesian Deep LearningMethods for Robust Computer Vision）

专知会员服务

12+阅读 · 2020年1月13日

热门VIP内容

开通专知VIP会员享更多权益服务

《可信人工智能赋能系统的支柱》

《从经典神经网络到不确定性下的拓扑神经网络：军事应用》2026最新40页报告

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

《人工智能：对战略与力量的影响》slides

相关资讯

牛逼哄哄的图卷积神经网络将带来哪些机遇？

牛逼哄哄的图卷积神经网络将带来哪些机遇？

计算机视觉life

49+阅读 · 2019年3月25日

【边缘智能】边缘计算驱动的深度学习加速技术

【边缘智能】边缘计算驱动的深度学习加速技术

产业智能官

20+阅读 · 2019年2月8日

硬件加速神经网络综述

硬件加速神经网络综述

计算机研究与发展

26+阅读 · 2019年2月1日

【论文综述】深度卷积神经网络架构最新进展综述（附60页全文下载）

【论文综述】深度卷积神经网络架构最新进展综述（附60页全文下载）

专知

29+阅读 · 2019年1月23日

最新基于FPGA的深度学习加速器综述论文（附下载）

最新基于FPGA的深度学习加速器综述论文（附下载）

专知

23+阅读 · 2019年1月17日

什么是深度学习的卷积？

什么是深度学习的卷积？

论智

18+阅读 · 2018年8月14日

深度学习中的五大正则化方法和七大优化策略

深度学习中的五大正则化方法和七大优化策略

全球人工智能

11+阅读 · 2017年12月25日

深度学习（可视化部分）-使用keras识别猫咪

深度学习（可视化部分）-使用keras识别猫咪

北京思腾合力科技有限公司

10+阅读 · 2017年11月30日

学界 | 深度学习在单图像超分辨率上的应用：SRCNN、Perceptual loss、SRResNet

学界 | 深度学习在单图像超分辨率上的应用：SRCNN、Perceptual loss、SRResNet

机器之心

12+阅读 · 2017年11月7日

CNN 模型压缩与加速算法综述

CNN 模型压缩与加速算法综述

机器学习研究会

16+阅读 · 2017年8月25日

相关论文

SimulatorCoder: DNN Accelerator Simulator Code Generation and Optimization via Large Language Models

Arxiv

0+阅读 · 2月19日

Hardware-accelerated graph neural networks: an alternative approach for neuromorphic event-based audio classification and keyword spotting on SoC FPGA

Arxiv

0+阅读 · 2月18日

The Turbo-Charged Mapper: Fast and Optimal Mapping for Accelerator Modeling and Evaluation

Arxiv

0+阅读 · 2月16日

DPUConfig: Optimizing ML Inference in FPGAs Using Reinforcement Learning

Arxiv

0+阅读 · 2月13日

LAAFD: LLM-based Agents for Accelerated FPGA Design

Arxiv

0+阅读 · 2月4日

Dual-pronged deep learning preprocessing on heterogeneous platforms with CPU, Accelerator and CSD

Arxiv

0+阅读 · 1月29日

An Energy-Efficient RFET-Based Stochastic Computing Neural Network Accelerator

Arxiv

0+阅读 · 1月28日

A Reconfigurable Framework for AI-FPGA Agent Integration and Acceleration

Arxiv

0+阅读 · 1月27日

MetaML-Pro: Cross-Stage Design Flow Automation for Efficient Deep Learning Acceleration

Arxiv

0+阅读 · 1月24日

Continuous-Flow Data-Rate-Aware CNN Inference on FPGA

Arxiv

0+阅读 · 1月16日

相关基金

基于加速网的光电混合三维互连架构设计方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

6+阅读 · 2015年12月31日

光电混合型高速高精度数模转换器的关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模动态异构网络的支持多用户并发任务的物联网应用构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于强化学习的分布参数系统数据驱动控制

国家自然科学基金

7+阅读 · 2015年12月31日

基于动态匹配的高能量利用率多层堆叠结构静态随机存储器（SRAM）关键技术

国家自然科学基金

0+阅读 · 2015年12月31日

超低待机功耗快速唤醒的微控制器关键技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向大数据计算的高吞吐量众核处理器关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员