CRAM-ER: Error-Resilient Spintronic Computational Random Access Memory for Scalable In-Memory Computation - 专知论文

会员服务 ·

0

内存 · 自旋 · Er · 高容错 · 存储 ·

CRAM-ER: Error-Resilient Spintronic Computational Random Access Memory for Scalable In-Memory Computation

翻译：CRAM-ER：可扩展内存计算的高容错自旋电子计算随机存取存储器

Sohan Salahuddin Mugdho,Md. Shahedul Hasan,Brahmdutta Dixit,Yang Lv,Jian-Ping Wang,Cheng Wang

Deep neural networks (DNNs) have achieved state-of-the-art performance across diverse domains. However, typical Von Neumann compute paradigms face severe memory bottlenecks. Emerging near-memory and compute-in-memory approaches alleviate this but incur significant peripheral overhead. Computational Random Access Memory (CRAM) based on MRAM enables in-situ logic without peripheral overhead, offering a dense, energy-efficient solution. However, probabilistic MRAM switching induces gate-level errors that limit the scalability and reliability of CRAM for accelerating DNN. Moreover, the large number of sequential MRAM writes severely constrains CRAM throughput. To address these challenges, we propose an error-resilient CRAM (CRAM-ER) architecture for scalable in-memory matrix-vector multiplications (MVMs). Our error-aware hardware-software co-design framework leverages a hybrid spintronic-CRAM + CMOS adder-tree architecture to mitigate the impact of device-level errors, demonstrating MVM functionality with high area and energy efficiency. We further develop an error-aware model fine-tuning and fine-grained error correction for enhanced error resilience. Evaluations of the CMOS+spintronic hybrid architecture on DNN benchmarks show near-lossless accuracy while reducing CRAM latency by up to 2 orders of magnitude, outperforming CPU/GPU+high-bandwidth DRAM in both energy efficiency and energy-delay product.

翻译：深度神经网络（DNN）已在多个领域实现了最先进的性能。然而，传统的冯·诺依曼计算范式面临严重的内存瓶颈。新兴的近内存和存内计算方法缓解了这一问题，但引入了显著的外围开销。基于MRAM的计算随机存取存储器（CRAM）能够原位执行逻辑运算且无外围开销，提供了高密度、高能效的解决方案。然而，概率性的MRAM开关操作会诱发门级错误，限制了CRAM在加速DNN时的可扩展性和可靠性。此外，大量的顺序MRAM写入操作严重制约了CRAM的吞吐量。为应对这些挑战，我们提出了一种面向可扩展内存矩阵向量乘法（MVM）的高容错CRAM（CRAM-ER）架构。我们的错误感知软硬件协同设计框架利用混合自旋电子-CRAM + CMOS加法器树架构来缓解器件级错误的影响，在实现高面积与能量效率的同时展示了MVM功能。我们进一步开发了错误感知的模型微调与细粒度纠错技术，以增强错误鲁棒性。在DNN基准测试上对CMOS+自旋电子混合架构的评估显示，其准确率近乎无损，同时将CRAM延迟降低了多达2个数量级，且在能量效率与能量延迟积方面均优于CPU/GPU+高带宽DRAM方案。

0

相关内容

《嵌入式计算系统的高效深度学习基础设施》综述

《嵌入式计算系统的高效深度学习基础设施》综述

专知会员服务

37+阅读 · 2024年11月5日

【2023新书】针对移动应用的深度强化学习处理器设计,105页pdf

【2023新书】针对移动应用的深度强化学习处理器设计,105页pdf

专知会员服务

42+阅读 · 2023年8月15日

【剑桥大学博士论文】高效神经网络的软硬件协同设计，144页pdf

【剑桥大学博士论文】高效神经网络的软硬件协同设计，144页pdf

专知会员服务

53+阅读 · 2023年2月12日

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

专知会员服务

11+阅读 · 2022年6月5日

【伯克利Guanhua Wang博士论文】分布式机器学习系统的颠覆性研究

【伯克利Guanhua Wang博士论文】分布式机器学习系统的颠覆性研究

专知会员服务

51+阅读 · 2022年5月17日

【深度神经网络加速器的硬件近似技术综述】Hardware Approximate Techniques for Deep Neural Network Accelerators: A Survey

【深度神经网络加速器的硬件近似技术综述】Hardware Approximate Techniques for Deep Neural Network Accelerators: A Survey

专知会员服务

16+阅读 · 2022年3月17日

内存计算研究进展

专知会员服务

29+阅读 · 2021年2月26日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知会员服务

159+阅读 · 2020年5月2日

【UCSD-MIT】深度学习隐私综述论文，Privacy in Deep Learning: A Survey

【UCSD-MIT】深度学习隐私综述论文，Privacy in Deep Learning: A Survey

专知会员服务

68+阅读 · 2020年4月28日

【CCL 2019】特邀报告数据高效性机器学习，郭毅可（英国皇家工程院院士、欧洲科学院院士）

【CCL 2019】特邀报告数据高效性机器学习，郭毅可（英国皇家工程院院士、欧洲科学院院士）

专知会员服务

16+阅读 · 2019年11月11日

【2022新书】元学习: 理论，算法和应用, 404页pdf

【2022新书】元学习: 理论，算法和应用, 404页pdf

专知

26+阅读 · 2022年11月27日

什么是物理信息机器学习(PIML)？清华最新《基于物理信息的机器学习:问题、方法和应用》综述，42页pdf全面阐述PIML进展

什么是物理信息机器学习(PIML)？清华最新《基于物理信息的机器学习:问题、方法和应用》综述，42页pdf全面阐述PIML进展

专知

32+阅读 · 2022年11月16日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

【牛津大学|DeepMind】论深度学习中的统计思维，附49页ppt

【牛津大学|DeepMind】论深度学习中的统计思维，附49页ppt

专知

14+阅读 · 2019年11月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

【泡泡图灵智库】MapNet：一种便于动态更新的全局地图存储方法（CVPR）

【泡泡图灵智库】MapNet：一种便于动态更新的全局地图存储方法（CVPR）

泡泡机器人SLAM

11+阅读 · 2018年12月10日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

AI研习社

14+阅读 · 2018年2月17日

内容中心无线网络的存储和传输协作机制研究

国家自然科学基金

1+阅读 · 2017年12月31日

基于双栅有机场效应晶体管存储器的多值存储研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于非易失内存设备的数据读写性能优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

“非对称多通道”异质、异构内存系统架构及“启发式”混合内存资源管理机制的研究

国家自然科学基金

0+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于动态匹配的高能量利用率多层堆叠结构静态随机存储器（SRAM）关键技术

国家自然科学基金

0+阅读 · 2015年12月31日

嵌入式存储器容错设计关键技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

磁性随机存储器中调控磁化反转势垒降低临界电流密度研究

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

ReSCom: A Reconfigurable Spiking Neural Network Accelerator Using Stochastic Computing

Arxiv

0+阅读 · 6月11日

Accuracy-Configurable Floating-Point Multiplier Design for SRAM-Based Compute-in-Memory

Arxiv

0+阅读 · 6月7日

Heterogeneous Mapping for Analog In-Memory Computing Accelerators: A Unified Workflow

Arxiv

0+阅读 · 6月1日

Memristor-Based Spiking Neural Network Accelerator for Bio-inspired Interception Task

Arxiv

0+阅读 · 5月29日

A Reconfigurable Computing In-Memory Macro with Charge-sharing-based Weighted Accumulator

Arxiv

0+阅读 · 5月29日

LIMCA: LLM for Automating Analog In-Memory Computing Architecture Design Exploration

Arxiv

0+阅读 · 5月28日

NeuroRing: Scaling Spiking Neural Networks via Multi-FPGA Bidirectional Ring Topologies and Stream-Dataflow Architectures

Arxiv

0+阅读 · 5月26日

Self-Evolving Distributed Memory Architecture for Scalable AI Systems

Arxiv

0+阅读 · 5月14日

Time Domain Near Memory Computing Engine

Arxiv

0+阅读 · 5月13日

Towards Topology-Aware Very Large-Scale Photonic AI Accelerators

Arxiv

0+阅读 · 4月16日

VIP会员

文章信息

相关主题

最新内容

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

5+阅读 · 今天4:35

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

3+阅读 · 今天4:24

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

3+阅读 · 今天4:18

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 今天4:15

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 今天4:08

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

7+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

7+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

7+阅读 · 7月31日

“史诗怒火”行动：现代多域作战的重要节点

“史诗怒火”行动：现代多域作战的重要节点

专知会员服务

8+阅读 · 7月30日

《下一代无线网络中的多无人机通信资源管理》

《下一代无线网络中的多无人机通信资源管理》

专知会员服务

8+阅读 · 7月30日

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

专知会员服务

9+阅读 · 7月30日

《人机协同在安全关键型操作决策中的应用》120页

《人机协同在安全关键型操作决策中的应用》120页

专知会员服务

8+阅读 · 7月30日

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

专知会员服务

6+阅读 · 7月30日

相关VIP内容

《嵌入式计算系统的高效深度学习基础设施》综述

《嵌入式计算系统的高效深度学习基础设施》综述

专知会员服务

37+阅读 · 2024年11月5日

【2023新书】针对移动应用的深度强化学习处理器设计,105页pdf

【2023新书】针对移动应用的深度强化学习处理器设计,105页pdf

专知会员服务

42+阅读 · 2023年8月15日

【剑桥大学博士论文】高效神经网络的软硬件协同设计，144页pdf

【剑桥大学博士论文】高效神经网络的软硬件协同设计，144页pdf

专知会员服务

53+阅读 · 2023年2月12日

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

专知会员服务

11+阅读 · 2022年6月5日

【伯克利Guanhua Wang博士论文】分布式机器学习系统的颠覆性研究

【伯克利Guanhua Wang博士论文】分布式机器学习系统的颠覆性研究

专知会员服务

51+阅读 · 2022年5月17日

【深度神经网络加速器的硬件近似技术综述】Hardware Approximate Techniques for Deep Neural Network Accelerators: A Survey

【深度神经网络加速器的硬件近似技术综述】Hardware Approximate Techniques for Deep Neural Network Accelerators: A Survey

专知会员服务

16+阅读 · 2022年3月17日

内存计算研究进展

专知会员服务

29+阅读 · 2021年2月26日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知会员服务

159+阅读 · 2020年5月2日

【UCSD-MIT】深度学习隐私综述论文，Privacy in Deep Learning: A Survey

【UCSD-MIT】深度学习隐私综述论文，Privacy in Deep Learning: A Survey

专知会员服务

68+阅读 · 2020年4月28日

【CCL 2019】特邀报告数据高效性机器学习，郭毅可（英国皇家工程院院士、欧洲科学院院士）

【CCL 2019】特邀报告数据高效性机器学习，郭毅可（英国皇家工程院院士、欧洲科学院院士）

专知会员服务

16+阅读 · 2019年11月11日

热门VIP内容

开通专知VIP会员享更多权益服务

隐身技术前沿综述：物理机理、工程实践与战略展望

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

相关资讯

【2022新书】元学习: 理论，算法和应用, 404页pdf

【2022新书】元学习: 理论，算法和应用, 404页pdf

专知

26+阅读 · 2022年11月27日

什么是物理信息机器学习(PIML)？清华最新《基于物理信息的机器学习:问题、方法和应用》综述，42页pdf全面阐述PIML进展

什么是物理信息机器学习(PIML)？清华最新《基于物理信息的机器学习:问题、方法和应用》综述，42页pdf全面阐述PIML进展

专知

32+阅读 · 2022年11月16日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

【牛津大学|DeepMind】论深度学习中的统计思维，附49页ppt

【牛津大学|DeepMind】论深度学习中的统计思维，附49页ppt

专知

14+阅读 · 2019年11月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

【泡泡图灵智库】MapNet：一种便于动态更新的全局地图存储方法（CVPR）

【泡泡图灵智库】MapNet：一种便于动态更新的全局地图存储方法（CVPR）

泡泡机器人SLAM

11+阅读 · 2018年12月10日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

AI研习社

14+阅读 · 2018年2月17日

相关论文

ReSCom: A Reconfigurable Spiking Neural Network Accelerator Using Stochastic Computing

Arxiv

0+阅读 · 6月11日

Accuracy-Configurable Floating-Point Multiplier Design for SRAM-Based Compute-in-Memory

Arxiv

0+阅读 · 6月7日

Heterogeneous Mapping for Analog In-Memory Computing Accelerators: A Unified Workflow

Arxiv

0+阅读 · 6月1日

Memristor-Based Spiking Neural Network Accelerator for Bio-inspired Interception Task

Arxiv

0+阅读 · 5月29日

A Reconfigurable Computing In-Memory Macro with Charge-sharing-based Weighted Accumulator

Arxiv

0+阅读 · 5月29日

LIMCA: LLM for Automating Analog In-Memory Computing Architecture Design Exploration

Arxiv

0+阅读 · 5月28日

NeuroRing: Scaling Spiking Neural Networks via Multi-FPGA Bidirectional Ring Topologies and Stream-Dataflow Architectures

Arxiv

0+阅读 · 5月26日

Self-Evolving Distributed Memory Architecture for Scalable AI Systems

Arxiv

0+阅读 · 5月14日

Time Domain Near Memory Computing Engine

Arxiv

0+阅读 · 5月13日

Towards Topology-Aware Very Large-Scale Photonic AI Accelerators

Arxiv

0+阅读 · 4月16日

相关基金

内容中心无线网络的存储和传输协作机制研究

国家自然科学基金

1+阅读 · 2017年12月31日

基于双栅有机场效应晶体管存储器的多值存储研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于非易失内存设备的数据读写性能优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

“非对称多通道”异质、异构内存系统架构及“启发式”混合内存资源管理机制的研究

国家自然科学基金

0+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于动态匹配的高能量利用率多层堆叠结构静态随机存储器（SRAM）关键技术

国家自然科学基金

0+阅读 · 2015年12月31日

嵌入式存储器容错设计关键技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

磁性随机存储器中调控磁化反转势垒降低临界电流密度研究

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员