ENFOR-SA：面向脉动阵列的高效精确深度神经网络可靠性评估端到端跨层瞬态故障注入器 (ENFOR-SA: End-to-end Cross-layer Transient Fault Injector for Efficient and Accurate DNN Reliability Assessment on Systolic Arrays) - 专知论文

会员服务 ·

0

故障注入 · 跨层 · 阵列 · 端到端 · 精度 ·

ENFOR-SA: End-to-end Cross-layer Transient Fault Injector for Efficient and Accurate DNN Reliability Assessment on Systolic Arrays

翻译：ENFOR-SA：面向脉动阵列的高效精确深度神经网络可靠性评估端到端跨层瞬态故障注入器

Rafael Billig Tonetto,Marcello Traiola,Fernando Fernandes dos Santos,Angeliki Kritikakou

Recent advances in deep learning have produced highly accurate but increasingly large and complex DNNs, making traditional fault-injection techniques impractical. Accurate fault analysis requires RTL-accurate hardware models. However, this significantly slows evaluation compared with software-only approaches, particularly when combined with expensive HDL instrumentation. In this work, we show that such high-overhead methods are unnecessary for systolic array (SA) architectures and propose ENFOR-SA, an end-to-end framework for DNN transient fault analysis on SAs. Our two-step approach employs cross-layer simulation and uses RTL SA components only during fault injection, with the rest executed at the software level. Experiments on CNNs and Vision Transformers demonstrate that ENFOR-SA achieves RTL-accurate fault injection with only 6% average slowdown compared to software-based injection, while delivering at least two orders of magnitude speedup (average $569\times$) over full-SoC RTL simulation and a $2.03\times$ improvement over a state-of-the-art cross-layer RTL injection tool. ENFOR-SA code is publicly available at https://github.com/rafaabt/ENFOR-SA.

翻译：深度学习的最新进展催生了高精度但日益庞大复杂的深度神经网络（DNN），使得传统故障注入技术难以适用。精确的故障分析需要寄存器传输级（RTL）精度的硬件模型。然而，与纯软件方法相比，这显著降低了评估速度，尤其是在结合昂贵的硬件描述语言（HDL）插桩时。本工作表明，对于脉动阵列（SA）架构，此类高开销方法并非必需，并提出了ENFOR-SA，一个面向SA上DNN瞬态故障分析的端到端框架。我们的两步法采用跨层仿真，仅在故障注入阶段使用RTL级SA组件，其余部分在软件层面执行。在卷积神经网络（CNN）和视觉Transformer上的实验表明，ENFOR-SA实现了RTL精度的故障注入，与基于软件的注入相比平均仅带来6%的速度损失，同时相比全片上系统（SoC）RTL仿真获得了至少两个数量级的加速（平均$569\times$），相比最先进的跨层RTL注入工具也有$2.03\times$的性能提升。ENFOR-SA代码已公开于 https://github.com/rafaabt/ENFOR-SA。

0

相关内容

故障注入

基于深度神经网络的视频分析中的效率优化技术综述：处理系统、算法与应用

基于深度神经网络的视频分析中的效率优化技术综述：处理系统、算法与应用

专知会员服务

15+阅读 · 2025年7月22日

【普林斯顿博士论文】深度学习加速器的编译器支持：端到端评估与数据访问优化

【普林斯顿博士论文】深度学习加速器的编译器支持：端到端评估与数据访问优化

专知会员服务

18+阅读 · 2025年1月7日

神经网络后门攻击与防御综述

神经网络后门攻击与防御综述

专知会员服务

19+阅读 · 2024年7月30日

【剑桥大学博士论文】高效神经网络的软硬件协同设计，144页pdf

【剑桥大学博士论文】高效神经网络的软硬件协同设计，144页pdf

专知会员服务

52+阅读 · 2023年2月12日

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

专知会员服务

11+阅读 · 2022年6月5日

【深度神经网络加速器的硬件近似技术综述】Hardware Approximate Techniques for Deep Neural Network Accelerators: A Survey

【深度神经网络加速器的硬件近似技术综述】Hardware Approximate Techniques for Deep Neural Network Accelerators: A Survey

专知会员服务

16+阅读 · 2022年3月17日

SIGIR2021 | 基于特征交互学习的门控增强多任务神经网络用于CTR预测

专知会员服务

10+阅读 · 2021年9月10日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知会员服务

159+阅读 · 2020年5月2日

【论文推荐】可解释神经网络，Towards Explainable Deep Neural Networks (xDNN)

【论文推荐】可解释神经网络，Towards Explainable Deep Neural Networks (xDNN)

专知会员服务

40+阅读 · 2019年12月5日

【CCL 2019】特邀报告数据高效性机器学习，郭毅可（英国皇家工程院院士、欧洲科学院院士）

【CCL 2019】特邀报告数据高效性机器学习，郭毅可（英国皇家工程院院士、欧洲科学院院士）

专知会员服务

16+阅读 · 2019年11月11日

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

专知

18+阅读 · 2020年6月22日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

【WWW2020】结构深度聚类网络， Structural Deep Clustering Network，北京邮电大学

【WWW2020】结构深度聚类网络， Structural Deep Clustering Network，北京邮电大学

专知

31+阅读 · 2020年2月19日

当深度强化学习遇见图神经网络

当深度强化学习遇见图神经网络

专知

227+阅读 · 2019年10月21日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

GAN生成式对抗网络

14+阅读 · 2019年5月23日

硬件加速神经网络综述

硬件加速神经网络综述

计算机研究与发展

26+阅读 · 2019年2月1日

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

AI研习社

14+阅读 · 2018年2月17日

前沿 | 简述脉冲神经网络SNN：下一代神经网络

前沿 | 简述脉冲神经网络SNN：下一代神经网络

机器之心

39+阅读 · 2018年1月13日

深度学习中的注意力机制

深度学习中的注意力机制

CSDN大数据

24+阅读 · 2017年11月2日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

数据驱动关键性能指标相关的故障诊断方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

T-S模糊神经网络的容错同步性分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于故障注入和指标模型的工业无线传感器网络可靠性测试与评估方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向有源配电网的数据传输优化及智能过滤机制

国家自然科学基金

0+阅读 · 2015年12月31日

互连网络条件路覆盖与综合诊断策略下的故障诊断性研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于动态匹配的高能量利用率多层堆叠结构静态随机存储器（SRAM）关键技术

国家自然科学基金

0+阅读 · 2015年12月31日

反馈神经网络统一模型临界动力学研究及其在类脑计算机研制中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

通信信号相关探测法实现WDM-PON网络中多信道光纤故障点的同时诊断

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

The Turbo-Charged Mapper: Fast and Optimal Mapping for Accelerator Modeling and Evaluation

Arxiv

0+阅读 · 2月16日

Explainability-Inspired Layer-Wise Pruning of Deep Neural Networks for Efficient Object Detection

Arxiv

0+阅读 · 2月15日

A Parameterizable Convolution Accelerator for Embedded Deep Learning Applications

Arxiv

0+阅读 · 2月3日

Optimizing Tensor Train Decomposition in DNNs for RISC-V Architectures Using Design Space Exploration and Compiler Optimizations

Arxiv

0+阅读 · 2月2日

Energy Efficient Exact and Approximate Systolic Array Architecture for Matrix Multiplication

Arxiv

0+阅读 · 1月28日

Deep Neural Networks as Iterated Function Systems and a Generalization Bound

Arxiv

0+阅读 · 1月27日

MetaML-Pro: Cross-Stage Design Flow Automation for Efficient Deep Learning Acceleration

Arxiv

0+阅读 · 1月24日

DeepFedNAS: A Unified Framework for Principled, Hardware-Aware, and Predictor-Free Federated Neural Architecture Search

Arxiv

0+阅读 · 1月21日

Hierarchical Online-Scheduling for Energy-Efficient Split Inference with Progressive Transmission

Arxiv

0+阅读 · 1月13日

A Highly Efficient Diversity-based Input Selection for DNN Improvement Using VLMs

Arxiv

0+阅读 · 1月12日

VIP会员

文章信息

相关主题

相关VIP内容

基于深度神经网络的视频分析中的效率优化技术综述：处理系统、算法与应用

基于深度神经网络的视频分析中的效率优化技术综述：处理系统、算法与应用

专知会员服务

15+阅读 · 2025年7月22日

【普林斯顿博士论文】深度学习加速器的编译器支持：端到端评估与数据访问优化

【普林斯顿博士论文】深度学习加速器的编译器支持：端到端评估与数据访问优化

专知会员服务

18+阅读 · 2025年1月7日

神经网络后门攻击与防御综述

神经网络后门攻击与防御综述

专知会员服务

19+阅读 · 2024年7月30日

【剑桥大学博士论文】高效神经网络的软硬件协同设计，144页pdf

【剑桥大学博士论文】高效神经网络的软硬件协同设计，144页pdf

专知会员服务

52+阅读 · 2023年2月12日

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

专知会员服务

11+阅读 · 2022年6月5日

【深度神经网络加速器的硬件近似技术综述】Hardware Approximate Techniques for Deep Neural Network Accelerators: A Survey

【深度神经网络加速器的硬件近似技术综述】Hardware Approximate Techniques for Deep Neural Network Accelerators: A Survey

专知会员服务

16+阅读 · 2022年3月17日

SIGIR2021 | 基于特征交互学习的门控增强多任务神经网络用于CTR预测

专知会员服务

10+阅读 · 2021年9月10日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知会员服务

159+阅读 · 2020年5月2日

【论文推荐】可解释神经网络，Towards Explainable Deep Neural Networks (xDNN)

【论文推荐】可解释神经网络，Towards Explainable Deep Neural Networks (xDNN)

专知会员服务

40+阅读 · 2019年12月5日

【CCL 2019】特邀报告数据高效性机器学习，郭毅可（英国皇家工程院院士、欧洲科学院院士）

【CCL 2019】特邀报告数据高效性机器学习，郭毅可（英国皇家工程院院士、欧洲科学院院士）

专知会员服务

16+阅读 · 2019年11月11日

热门VIP内容

开通专知VIP会员享更多权益服务

《可信人工智能赋能系统的支柱》

《从经典神经网络到不确定性下的拓扑神经网络：军事应用》2026最新40页报告

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

《人工智能：对战略与力量的影响》slides

相关资讯

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

专知

18+阅读 · 2020年6月22日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

【WWW2020】结构深度聚类网络， Structural Deep Clustering Network，北京邮电大学

【WWW2020】结构深度聚类网络， Structural Deep Clustering Network，北京邮电大学

专知

31+阅读 · 2020年2月19日

当深度强化学习遇见图神经网络

当深度强化学习遇见图神经网络

专知

227+阅读 · 2019年10月21日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

GAN生成式对抗网络

14+阅读 · 2019年5月23日

硬件加速神经网络综述

硬件加速神经网络综述

计算机研究与发展

26+阅读 · 2019年2月1日

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

AI研习社

14+阅读 · 2018年2月17日

前沿 | 简述脉冲神经网络SNN：下一代神经网络

前沿 | 简述脉冲神经网络SNN：下一代神经网络

机器之心

39+阅读 · 2018年1月13日

深度学习中的注意力机制

深度学习中的注意力机制

CSDN大数据

24+阅读 · 2017年11月2日

相关论文

The Turbo-Charged Mapper: Fast and Optimal Mapping for Accelerator Modeling and Evaluation

Arxiv

0+阅读 · 2月16日

Explainability-Inspired Layer-Wise Pruning of Deep Neural Networks for Efficient Object Detection

Arxiv

0+阅读 · 2月15日

A Parameterizable Convolution Accelerator for Embedded Deep Learning Applications

Arxiv

0+阅读 · 2月3日

Optimizing Tensor Train Decomposition in DNNs for RISC-V Architectures Using Design Space Exploration and Compiler Optimizations

Arxiv

0+阅读 · 2月2日

Energy Efficient Exact and Approximate Systolic Array Architecture for Matrix Multiplication

Arxiv

0+阅读 · 1月28日

Deep Neural Networks as Iterated Function Systems and a Generalization Bound

Arxiv

0+阅读 · 1月27日

MetaML-Pro: Cross-Stage Design Flow Automation for Efficient Deep Learning Acceleration

Arxiv

0+阅读 · 1月24日

DeepFedNAS: A Unified Framework for Principled, Hardware-Aware, and Predictor-Free Federated Neural Architecture Search

Arxiv

0+阅读 · 1月21日

Hierarchical Online-Scheduling for Energy-Efficient Split Inference with Progressive Transmission

Arxiv

0+阅读 · 1月13日

A Highly Efficient Diversity-based Input Selection for DNN Improvement Using VLMs

Arxiv

0+阅读 · 1月12日

相关基金

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

数据驱动关键性能指标相关的故障诊断方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

T-S模糊神经网络的容错同步性分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于故障注入和指标模型的工业无线传感器网络可靠性测试与评估方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向有源配电网的数据传输优化及智能过滤机制

国家自然科学基金

0+阅读 · 2015年12月31日

互连网络条件路覆盖与综合诊断策略下的故障诊断性研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于动态匹配的高能量利用率多层堆叠结构静态随机存储器（SRAM）关键技术

国家自然科学基金

0+阅读 · 2015年12月31日

反馈神经网络统一模型临界动力学研究及其在类脑计算机研制中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

通信信号相关探测法实现WDM-PON网络中多信道光纤故障点的同时诊断

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员