Hardware Efficient Approximate Convolution with Tunable Error Tolerance for CNNs - 专知论文

会员服务 ·

0

CNN · 卷积 · 激活函数 · 近似 · 稀疏 ·

Hardware Efficient Approximate Convolution with Tunable Error Tolerance for CNNs

翻译：面向CNN的高效硬件近似卷积与可调误差容错方法

Vishal Shashidhar,Anupam Kumari,Roy P Paily

from arxiv, Submitted to IEEE GCON 2026

Modern CNNs' high computational demands hinder edge deployment, as traditional ``hard'' sparsity (skipping mathematical zeros) loses effectiveness in deep layers or with smooth activations like Tanh. We propose a ``soft sparsity'' paradigm using a hardware efficient Most Significant Bit (MSB) proxy to skip negligible non-zero multiplications. Integrated as a custom RISC-V instruction and evaluated on LeNet-5 (MNIST), this method reduces ReLU MACs by 88.42% and Tanh MACs by 74.87% with zero accuracy loss--outperforming zero-skipping by 5x. By clock-gating inactive multipliers, we estimate power savings of 35.2% for ReLU and 29.96% for Tanh. While memory access makes power reduction sub-linear to operation savings, this approach significantly optimizes resource-constrained inference.

翻译：现代卷积神经网络（CNN）的高计算需求阻碍了其在边缘设备上的部署，因为传统的“硬稀疏性”（跳过数学零值）在深层网络或使用Tanh等平滑激活函数时效果不佳。本文提出一种“软稀疏性”范式，利用硬件高效的“最高有效位（MSB）代理”跳过可忽略的非零乘法运算。该方法集成于自定义RISC-V指令中，在LeNet-5（MNIST）上的评估结果表明：ReLU激活函数的乘累加（MAC）运算量减少88.42%，Tanh激活函数减少74.87%，且精度零损失——性能较零值跳过方法提升5倍。通过时钟门控非活跃乘法器，我们估计ReLU和Tanh的功耗分别降低35.2%和29.96%。尽管内存访问使功耗降低幅度呈亚线性关系于运算节省量，但该方法显著优化了资源受限场景下的推理过程。

0

相关内容

CNN

CNN如何剪枝？A*STAR最新《深度卷积神经网络结构化剪枝》综述，22页pdf阐述深度CNN结构化剪枝的最新进展

CNN如何剪枝？A*STAR最新《深度卷积神经网络结构化剪枝》综述，22页pdf阐述深度CNN结构化剪枝的最新进展

专知会员服务

34+阅读 · 2023年3月8日

CNN/MLP/Transformer, 究竟谁行？中科大&微软实证三大网络结构公平比较，各有可取之处

专知会员服务

34+阅读 · 2021年9月18日

基于粗粒度数据流架构的稀疏卷积神经网络加速

专知会员服务

23+阅读 · 2021年7月15日

动态滤波器卷积新高度！DDF：同时解决内容不可知与计算量两大缺陷｜CVPR2021

专知会员服务

21+阅读 · 2021年5月4日

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

专知会员服务

63+阅读 · 2020年7月12日

【上海交大】可解释CNN的对象分类，Interpretable CNNs for Object Classification

专知会员服务

54+阅读 · 2020年3月14日

【上海交通大学-张拳石】可解释CNN，Interpretable CNNs for Object Classification

【上海交通大学-张拳石】可解释CNN，Interpretable CNNs for Object Classification

专知会员服务

46+阅读 · 2020年3月13日

【ICLR-2020】网络反卷积，NETWORK DECONVOLUTION

【ICLR-2020】网络反卷积，NETWORK DECONVOLUTION

专知会员服务

39+阅读 · 2020年2月21日

【机器学习论文推荐】EfficientNet:卷积神经网络的再思考模型缩放（EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks）

【机器学习论文推荐】EfficientNet:卷积神经网络的再思考模型缩放（EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks）

专知会员服务

17+阅读 · 2019年12月24日

图卷积神经网络及其应用，中国科学院计算技术研究所沈华伟研究员，第八届全国社会媒体处理大会SMP2019

图卷积神经网络及其应用，中国科学院计算技术研究所沈华伟研究员，第八届全国社会媒体处理大会SMP2019

专知会员服务

67+阅读 · 2019年10月21日

比CNN表现更好，CV领域全新卷积操作OctConv厉害在哪里？

比CNN表现更好，CV领域全新卷积操作OctConv厉害在哪里？

大数据文摘

13+阅读 · 2019年4月23日

太值得收藏了！秒懂各种深度CNN操作

太值得收藏了！秒懂各种深度CNN操作

机器学习算法与Python学习

11+阅读 · 2019年3月18日

直白介绍卷积神经网络（CNN）

直白介绍卷积神经网络（CNN）

算法与数学之美

13+阅读 · 2019年1月23日

CNN五大经典模型:LeNet，AlexNet，GoogleNet，VGG，DRL

CNN五大经典模型:LeNet，AlexNet，GoogleNet，VGG，DRL

黑龙江大学自然语言处理实验室

14+阅读 · 2018年9月7日

误差反向传播——CNN

误差反向传播——CNN

统计学习与视觉计算组

31+阅读 · 2018年7月12日

基于注意力机制的图卷积网络

基于注意力机制的图卷积网络

科技创新与创业

74+阅读 · 2017年11月8日

【深度】Deep Visualization:可视化并理解CNN

【深度】Deep Visualization:可视化并理解CNN

专知

12+阅读 · 2017年9月30日

CNN 模型压缩与加速算法综述

CNN 模型压缩与加速算法综述

机器学习研究会

16+阅读 · 2017年8月25日

CNN、RNN在自动特征提取中的应用

CNN、RNN在自动特征提取中的应用

乌镇智库

14+阅读 · 2017年8月4日

卷积神经网络(CNN)学习笔记1：基础入门

卷积神经网络(CNN)学习笔记1：基础入门

黑龙江大学自然语言处理实验室

14+阅读 · 2016年6月16日

近似计算中基于概率图模型的软错误量化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度卷积神经网络的多源遥感图像时空融合方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

T-S模糊神经网络的容错同步性分析

国家自然科学基金

0+阅读 · 2015年12月31日

无线传感器网络中高效的虚假数据过滤方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

稀疏性多维联合优化在线视觉跟踪方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

求解一类大规模稀疏线性矩阵方程的高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

提高移动最小二乘近似无网格方法计算效率的技术和理论

国家自然科学基金

0+阅读 · 2014年12月31日

几类典型稀疏优化问题的算法、理论及应用

国家自然科学基金

3+阅读 · 2014年12月31日

基于超像素稀疏表示的图像超分辨率方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

无线传感器网络中带几何约束的几类组合优化问题的近似算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

Spira: Exploiting Voxel Data Structural Properties for Efficient Sparse Convolution in Point Cloud Networks

Arxiv

0+阅读 · 4月22日

Post-hoc Self-explanation of CNNs

Arxiv

0+阅读 · 3月30日

Surrogates, Spikes, and Sparsity: Performance Analysis and Characterization of SNN Hyperparameters on Hardware

Arxiv

0+阅读 · 3月26日

Convolutions Predictable Offloading to an Accelerator: Formalization and Optimization

Arxiv

0+阅读 · 3月23日

Beyond Convolution: A Taxonomy of Structured Operators for Learning-Based Image Processing

Arxiv

0+阅读 · 3月12日

CNNs in the Air via Reconfigurable Intelligent Surfaces

Arxiv

0+阅读 · 3月12日

Hardware Efficient Approximate Convolution with Tunable Error Tolerance for CNNs

Arxiv

0+阅读 · 3月10日

Continuous-Flow Data-Rate-Aware CNN Inference on FPGA

Arxiv

0+阅读 · 3月7日

Large deviation principles for convolutional Bayesian neural networks

Arxiv

0+阅读 · 3月6日

SigmaQuant: Hardware-Aware Heterogeneous Quantization Method for Edge DNN Inference

Arxiv

0+阅读 · 2月25日

VIP会员

文章信息

相关主题

最新内容

[ICML 2026] SOL：让大模型把算力花在关键Token上：自优化语言模型

[ICML 2026] SOL：让大模型把算力花在关键Token上：自优化语言模型

专知会员服务

0+阅读 · 今天14:22

人工智能解释公平性：统一框架、公理与负责任AI的未来方向

人工智能解释公平性：统一框架、公理与负责任AI的未来方向

专知会员服务

0+阅读 · 今天14:19

《美军软件工厂案例研究：空军数字人才的人员需求》

《美军软件工厂案例研究：空军数字人才的人员需求》

专知会员服务

7+阅读 · 今天7:50

《美国防部DevSecOps实践现状：软件工厂之现代战争的数字兵工厂》47页文件

《美国防部DevSecOps实践现状：软件工厂之现代战争的数字兵工厂》47页文件

专知会员服务

7+阅读 · 今天7:35

有意义的人类指挥：迈向军事人机交互新模型探析（中文版PDF下载，2.5万字，2026年）

有意义的人类指挥：迈向军事人机交互新模型探析（中文版PDF下载，2.5万字，2026年）

专知会员服务

17+阅读 · 今天7:24

《执行无人机蜂群任务：智能体增强大语言模型推理赋能无人机物联网》

《执行无人机蜂群任务：智能体增强大语言模型推理赋能无人机物联网》

专知会员服务

6+阅读 · 今天5:52

下一代软件定义无线电：锻造现代战场的数字支柱

下一代软件定义无线电：锻造现代战场的数字支柱

专知会员服务

7+阅读 · 今天3:48

综合压制敌方防空和网电活动：北约反一体化防空系统策略的多域方法（中英文版下载）

综合压制敌方防空和网电活动：北约反一体化防空系统策略的多域方法（中英文版下载）

专知会员服务

13+阅读 · 今天2:20

美军“软件工厂”：为作战指挥官赋能数字战场

美军“软件工厂”：为作战指挥官赋能数字战场

专知会员服务

14+阅读 · 今天2:03

《面向大规模决策的分布式优化架构》247页

《面向大规模决策的分布式优化架构》247页

专知会员服务

15+阅读 · 今天1:57

《概率分布增强战争迷雾场景下的导航与战略规划》88页

《概率分布增强战争迷雾场景下的导航与战略规划》88页

专知会员服务

13+阅读 · 今天1:50

《评估用于军事空军基地作战监控的视觉语言模型：卫星图像中的零样本飞机检测》

《评估用于军事空军基地作战监控的视觉语言模型：卫星图像中的零样本飞机检测》

专知会员服务

8+阅读 · 今天1:47

《量子传感及其在印度军事导航系统中的应用》2026最新50页报告

《量子传感及其在印度军事导航系统中的应用》2026最新50页报告

专知会员服务

7+阅读 · 今天1:40

【ICML2026】WeatherSyn：面向天气报告生成的指令微调多模态大语言模型

【ICML2026】WeatherSyn：面向天气报告生成的指令微调多模态大语言模型

专知会员服务

4+阅读 · 5月11日

智能体技能综合综述：分类、技术与应用

智能体技能综合综述：分类、技术与应用

专知会员服务

18+阅读 · 5月11日

相关VIP内容

CNN如何剪枝？A*STAR最新《深度卷积神经网络结构化剪枝》综述，22页pdf阐述深度CNN结构化剪枝的最新进展

CNN如何剪枝？A*STAR最新《深度卷积神经网络结构化剪枝》综述，22页pdf阐述深度CNN结构化剪枝的最新进展

专知会员服务

34+阅读 · 2023年3月8日

CNN/MLP/Transformer, 究竟谁行？中科大&微软实证三大网络结构公平比较，各有可取之处

专知会员服务

34+阅读 · 2021年9月18日

基于粗粒度数据流架构的稀疏卷积神经网络加速

专知会员服务

23+阅读 · 2021年7月15日

动态滤波器卷积新高度！DDF：同时解决内容不可知与计算量两大缺陷｜CVPR2021

专知会员服务

21+阅读 · 2021年5月4日

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

专知会员服务

63+阅读 · 2020年7月12日

【上海交大】可解释CNN的对象分类，Interpretable CNNs for Object Classification

专知会员服务

54+阅读 · 2020年3月14日

【上海交通大学-张拳石】可解释CNN，Interpretable CNNs for Object Classification

【上海交通大学-张拳石】可解释CNN，Interpretable CNNs for Object Classification

专知会员服务

46+阅读 · 2020年3月13日

【ICLR-2020】网络反卷积，NETWORK DECONVOLUTION

【ICLR-2020】网络反卷积，NETWORK DECONVOLUTION

专知会员服务

39+阅读 · 2020年2月21日

【机器学习论文推荐】EfficientNet:卷积神经网络的再思考模型缩放（EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks）

【机器学习论文推荐】EfficientNet:卷积神经网络的再思考模型缩放（EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks）

专知会员服务

17+阅读 · 2019年12月24日

图卷积神经网络及其应用，中国科学院计算技术研究所沈华伟研究员，第八届全国社会媒体处理大会SMP2019

图卷积神经网络及其应用，中国科学院计算技术研究所沈华伟研究员，第八届全国社会媒体处理大会SMP2019

专知会员服务

67+阅读 · 2019年10月21日

热门VIP内容

开通专知VIP会员享更多权益服务

人工智能解释公平性：统一框架、公理与负责任AI的未来方向

《美国防部DevSecOps实践现状：软件工厂之现代战争的数字兵工厂》47页文件

[ICML 2026] SOL：让大模型把算力花在关键Token上：自优化语言模型

《美军软件工厂案例研究：空军数字人才的人员需求》

相关资讯

比CNN表现更好，CV领域全新卷积操作OctConv厉害在哪里？

比CNN表现更好，CV领域全新卷积操作OctConv厉害在哪里？

大数据文摘

13+阅读 · 2019年4月23日

太值得收藏了！秒懂各种深度CNN操作

太值得收藏了！秒懂各种深度CNN操作

机器学习算法与Python学习

11+阅读 · 2019年3月18日

直白介绍卷积神经网络（CNN）

直白介绍卷积神经网络（CNN）

算法与数学之美

13+阅读 · 2019年1月23日

CNN五大经典模型:LeNet，AlexNet，GoogleNet，VGG，DRL

CNN五大经典模型:LeNet，AlexNet，GoogleNet，VGG，DRL

黑龙江大学自然语言处理实验室

14+阅读 · 2018年9月7日

误差反向传播——CNN

误差反向传播——CNN

统计学习与视觉计算组

31+阅读 · 2018年7月12日

基于注意力机制的图卷积网络

基于注意力机制的图卷积网络

科技创新与创业

74+阅读 · 2017年11月8日

【深度】Deep Visualization:可视化并理解CNN

【深度】Deep Visualization:可视化并理解CNN

专知

12+阅读 · 2017年9月30日

CNN 模型压缩与加速算法综述

CNN 模型压缩与加速算法综述

机器学习研究会

16+阅读 · 2017年8月25日

CNN、RNN在自动特征提取中的应用

CNN、RNN在自动特征提取中的应用

乌镇智库

14+阅读 · 2017年8月4日

卷积神经网络(CNN)学习笔记1：基础入门

卷积神经网络(CNN)学习笔记1：基础入门

黑龙江大学自然语言处理实验室

14+阅读 · 2016年6月16日

相关论文

Spira: Exploiting Voxel Data Structural Properties for Efficient Sparse Convolution in Point Cloud Networks

Arxiv

0+阅读 · 4月22日

Post-hoc Self-explanation of CNNs

Arxiv

0+阅读 · 3月30日

Surrogates, Spikes, and Sparsity: Performance Analysis and Characterization of SNN Hyperparameters on Hardware

Arxiv

0+阅读 · 3月26日

Convolutions Predictable Offloading to an Accelerator: Formalization and Optimization

Arxiv

0+阅读 · 3月23日

Beyond Convolution: A Taxonomy of Structured Operators for Learning-Based Image Processing

Arxiv

0+阅读 · 3月12日

CNNs in the Air via Reconfigurable Intelligent Surfaces

Arxiv

0+阅读 · 3月12日

Hardware Efficient Approximate Convolution with Tunable Error Tolerance for CNNs

Arxiv

0+阅读 · 3月10日

Continuous-Flow Data-Rate-Aware CNN Inference on FPGA

Arxiv

0+阅读 · 3月7日

Large deviation principles for convolutional Bayesian neural networks

Arxiv

0+阅读 · 3月6日

SigmaQuant: Hardware-Aware Heterogeneous Quantization Method for Edge DNN Inference

Arxiv

0+阅读 · 2月25日

相关基金

近似计算中基于概率图模型的软错误量化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度卷积神经网络的多源遥感图像时空融合方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

T-S模糊神经网络的容错同步性分析

国家自然科学基金

0+阅读 · 2015年12月31日

无线传感器网络中高效的虚假数据过滤方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

稀疏性多维联合优化在线视觉跟踪方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

求解一类大规模稀疏线性矩阵方程的高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

提高移动最小二乘近似无网格方法计算效率的技术和理论

国家自然科学基金

0+阅读 · 2014年12月31日

几类典型稀疏优化问题的算法、理论及应用

国家自然科学基金

3+阅读 · 2014年12月31日

基于超像素稀疏表示的图像超分辨率方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

无线传感器网络中带几何约束的几类组合优化问题的近似算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员