Traditional CPU, GPU, and NPU architectures are increasingly limited by the von Neumann bottleneck. While In-Memory Computing (IMC) using ReRAM crossbar arrays offers a high-density, energy-efficient alternative, its practical deployment is constrained through their non-idealities. Existing hardware-aware training frameworks often require training from scratch, which is computationally prohibitive for modern large-scale models. In this work, we propose a finetuning-based hardware-aware training algorithm that enables robust DNN deployment on ReRAM with minimal training overhead. Our approach mitigates I-V non-linearity by applying a range-shrunk sinh transformation and incorporates retention errors directly into a regularization loss during the finetuning process. We evaluate our framework across models and tasks such as image classification and question-answering (QA). Experimental results demonstrate that our method achieves similar accuracy on large-scale models like ResNet18 and DeiT-Tiny as the base model. In-case of ImageNet for MobileNetV3 families the technique has only less than 2% accuracy degradation. Further, applying the technique on the SQuAD v2 dataset results in only 1 point degradation of F-1 score.


翻译:传统CPU、GPU及NPU架构日益受到冯·诺依曼瓶颈的制约。尽管基于ReRAM交叉阵列的内存计算(IMC)提供了一种高密度、高能效的替代方案,但其实际部署受限于器件非理想特性。现有硬件感知训练框架通常需要从零开始训练,这对现代大规模模型而言计算代价过高。本文提出一种基于微调的硬件感知训练算法,能以极小的训练开销实现鲁棒的DNN在ReRAM上的部署。该方法通过应用范围收缩的sinh变换以缓解I-V非线性,并在微调过程中将保持误差直接纳入正则化损失函数。我们针对图像分类与问答(QA)等任务及模型评估了所提框架。实验结果表明,该方法在ResNet18与DeiT-Tiny等大规模模型上能达到与基准模型相近的准确率。在ImageNet数据集上,对于MobileNetV3系列模型,该技术的准确率下降不超过2%。进一步在SQuAD v2数据集上应用该技术仅导致F-1分数1个点的下降。

0
下载
关闭预览

相关内容

【博士论文】面向未知感知的机器学习基础
专知会员服务
17+阅读 · 2025年5月22日
联邦学习中基础模型参数高效微调综述
专知会员服务
17+阅读 · 2025年5月5日
仿生感存算一体视觉系统:仿生机制、设计原理及其应用
专知会员服务
30+阅读 · 2023年11月30日
深度学习模型不确定性方法对比
PaperWeekly
20+阅读 · 2020年2月10日
【学界】DeepMind论文:深度压缩感知,新框架提升GAN性能
GAN生成式对抗网络
14+阅读 · 2019年5月23日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
最新内容
美国从乌克兰无人机战争中学习经验
专知会员服务
3+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
2+阅读 · 6月21日
学习数据的几何:形状空间分析数学综述
专知会员服务
8+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
10+阅读 · 6月17日
相关VIP内容
【博士论文】面向未知感知的机器学习基础
专知会员服务
17+阅读 · 2025年5月22日
联邦学习中基础模型参数高效微调综述
专知会员服务
17+阅读 · 2025年5月5日
仿生感存算一体视觉系统:仿生机制、设计原理及其应用
专知会员服务
30+阅读 · 2023年11月30日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员