Analog In-memory Training on General Non-ideal Resistive Elements: The Impact of Response Functions - 专知论文

会员服务 ·

0

响应函数 · 内存 · 电导 · 脉冲 · 非对称 ·

Analog In-memory Training on General Non-ideal Resistive Elements: The Impact of Response Functions

翻译：基于通用非理想电阻元件的模拟内存内训练：响应函数的影响

Zhaoxian Wu,Quan Xiao,Tayfun Gokmen,Omobayode Fagbohungbe,Tianyi Chen

As the economic and environmental costs of training and deploying large vision or language models increase dramatically, analog in-memory computing (AIMC) emerges as a promising energy-efficient solution. However, the training perspective, especially its training dynamic, is underexplored. In AIMC hardware, the trainable weights are represented by the conductance of resistive elements and updated using consecutive electrical pulses. While the conductance changes by a constant in response to each pulse, in reality, the change is scaled by asymmetric and non-linear response functions, leading to a non-ideal training dynamic. This paper provides a theoretical foundation for gradient-based training on AIMC hardware with non-ideal response functions. We demonstrate that asymmetric response functions negatively impact Analog SGD by imposing an implicit penalty on the objective. To overcome the issue, we propose Residual Learning algorithm, which provably converges exactly to a critical point by solving a bilevel optimization problem. We demonstrate that the proposed method can be extended to address other hardware imperfections, such as limited response granularity. As we know, it is the first paper to investigate the impact of a class of generic non-ideal response functions. The conclusion is supported by simulations validating our theoretical insights.

翻译：随着训练和部署大型视觉或语言模型的经济与环境成本急剧增加，模拟内存内计算（AIMC）作为一种有前景的节能解决方案应运而生。然而，其训练视角，特别是训练动态，尚未得到充分探索。在AIMC硬件中，可训练权重由电阻元件的电导表示，并通过连续的电脉冲进行更新。虽然理论上每个脉冲会使电导产生恒定变化，但实际中，这种变化会受到非对称和非线性响应函数的缩放，从而导致非理想的训练动态。本文为具有非理想响应函数的AIMC硬件上的基于梯度的训练提供了理论基础。我们证明，非对称响应函数会通过向目标函数施加隐式惩罚，对模拟随机梯度下降（Analog SGD）产生负面影响。为克服此问题，我们提出了残差学习算法，该算法通过求解一个双层优化问题，可证明精确收敛到一个临界点。我们还展示了所提方法可扩展至解决其他硬件缺陷，如有限的响应粒度。据我们所知，这是首篇研究一类通用非理想响应函数影响的论文。结论得到了验证我们理论见解的仿真实验的支持。

0

相关内容

响应函数

中文版4200字 | 大语言模型在电子战训练中的应用分析

中文版4200字 | 大语言模型在电子战训练中的应用分析

专知会员服务

30+阅读 · 2025年6月8日

当持续学习遇上多模态大型语言模型：综述

当持续学习遇上多模态大型语言模型：综述

专知会员服务

32+阅读 · 2025年3月5日

国家标准意见稿《信息技术神经网络表示与模型压缩第2 部分：大规模预训练模型》

国家标准意见稿《信息技术神经网络表示与模型压缩第2 部分：大规模预训练模型》

专知会员服务

33+阅读 · 2024年11月1日

大规模语言模型在分布式基础设施上的高效训练：综述

大规模语言模型在分布式基础设施上的高效训练：综述

专知会员服务

27+阅读 · 2024年7月30日

《基于动机的战术空对空训练和通用架构下机器学习的计算机生成部队（CGF）建模》

《基于动机的战术空对空训练和通用架构下机器学习的计算机生成部队（CGF）建模》

专知会员服务

34+阅读 · 2024年6月29日

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大训练方法

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大训练方法

专知会员服务

149+阅读 · 2023年4月11日

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

专知会员服务

26+阅读 · 2022年3月15日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

132+阅读 · 2020年5月14日

【微软亚研】预训练文本表示作为元学习，Pre-training Text Representations

【微软亚研】预训练文本表示作为元学习，Pre-training Text Representations

专知会员服务

40+阅读 · 2020年4月17日

【理解计算机视觉损失函数】《Understanding Loss Functions in Computer Vision!》by Sowmya Yellapragad

【理解计算机视觉损失函数】《Understanding Loss Functions in Computer Vision!》by Sowmya Yellapragad

专知会员服务

44+阅读 · 2020年3月4日

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

专知

29+阅读 · 2023年4月11日

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

专知

14+阅读 · 2023年4月6日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

30+阅读 · 2022年9月19日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

强化学习《奖励函数设计: Reward Shaping》详细解读

强化学习《奖励函数设计: Reward Shaping》详细解读

深度强化学习实验室

19+阅读 · 2020年9月1日

预训练语言模型关系图+必读论文列表，清华荣誉出品

预训练语言模型关系图+必读论文列表，清华荣誉出品

机器之心

18+阅读 · 2019年10月11日

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

专知

14+阅读 · 2019年10月9日

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

专知

36+阅读 · 2019年9月29日

深度学习的GPU：深度学习中使用GPU的经验和建议

深度学习的GPU：深度学习中使用GPU的经验和建议

数据挖掘入门与实战

11+阅读 · 2018年1月3日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

临界态对生物神经网络学习、记忆以及模式识别能力的影响

国家自然科学基金

0+阅读 · 2015年12月31日

基于不完全测量信息的随机忆阻神经网络的参数与状态估计问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于非易失内存设备的数据读写性能优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

“非对称多通道”异质、异构内存系统架构及“启发式”混合内存资源管理机制的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于编译的PCM内存损耗均衡方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向存储受限应用的GPU性能预测模型和通信优化关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

纳米结构巨压阻记忆和恢复效应的缺陷调控机制及非易失性应力传感和存储性能研究

国家自然科学基金

0+阅读 · 2014年12月31日

适用于模拟神经突触功能的电阻可渐变调控忆阻器及其机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

Out of the Memory Barrier: A Highly Memory Efficient Training System for LLMs with Million-Token Contexts

Arxiv

0+阅读 · 2月17日

Concept Influence: Leveraging Interpretability to Improve Performance and Efficiency in Training Data Attribution

Arxiv

0+阅读 · 2月16日

Investigating Energy Bounds of Analog Compute-in-Memory with Local Normalization

Arxiv

0+阅读 · 2月8日

Out of the Memory Barrier: A Highly Memory Efficient Training System for LLMs with Million-Token Contexts

Arxiv

0+阅读 · 2月7日

Dr. Kernel: Reinforcement Learning Done Right for Triton Kernel Generations

Arxiv

0+阅读 · 2月6日

Horizon-LM: A RAM-Centric Architecture for LLM Training

Arxiv

0+阅读 · 2月4日

How to Train Your Resistive Network: Generalized Equilibrium Propagation and Analytical Learning

Arxiv

0+阅读 · 2月3日

Out of the Memory Barrier: A Highly Memory Efficient Training System for LLMs with Million-Token Contexts

Arxiv

0+阅读 · 2月2日

In-Pipeline Integration of Digital In-Memory-Computing into RISC-V Vector Architecture to Accelerate Deep Learning

Arxiv

0+阅读 · 2月2日

Mixed-Precision Training and Compilation for RRAM-based Computing-in-Memory Accelerators

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

最新内容

《美陆军条例：陆军指挥政策（2026版）》

《美陆军条例：陆军指挥政策（2026版）》

专知会员服务

7+阅读 · 今天8:10

《提升美军全域城市作战训练最佳实践的案例研究》366页

《提升美军全域城市作战训练最佳实践的案例研究》366页

专知会员服务

7+阅读 · 今天8:06

《军用自主人工智能系统的治理与安全》

《军用自主人工智能系统的治理与安全》

专知会员服务

5+阅读 · 今天8:02

美海军数字作战负责人：如何利用数据快速生成战斗力

美海军数字作战负责人：如何利用数据快速生成战斗力

专知会员服务

5+阅读 · 今天7:32

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

11+阅读 · 4月20日

《系统簇式多域作战规划范畴论框架》

《系统簇式多域作战规划范畴论框架》

专知会员服务

9+阅读 · 4月20日

《美国防部指令6130.03，第2卷服役医疗标准：保留》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

专知会员服务

6+阅读 · 4月20日

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

专知会员服务

4+阅读 · 4月20日

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

专知会员服务

8+阅读 · 4月20日

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

专知会员服务

4+阅读 · 4月20日

高效视频扩散模型：进展与挑战

高效视频扩散模型：进展与挑战

专知会员服务

4+阅读 · 4月20日

乌克兰前线的五项创新

乌克兰前线的五项创新

专知会员服务

8+阅读 · 4月20日

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

7+阅读 · 4月20日

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

12+阅读 · 4月20日

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

6+阅读 · 4月20日

相关VIP内容

中文版4200字 | 大语言模型在电子战训练中的应用分析

中文版4200字 | 大语言模型在电子战训练中的应用分析

专知会员服务

30+阅读 · 2025年6月8日

当持续学习遇上多模态大型语言模型：综述

当持续学习遇上多模态大型语言模型：综述

专知会员服务

32+阅读 · 2025年3月5日

国家标准意见稿《信息技术神经网络表示与模型压缩第2 部分：大规模预训练模型》

国家标准意见稿《信息技术神经网络表示与模型压缩第2 部分：大规模预训练模型》

专知会员服务

33+阅读 · 2024年11月1日

大规模语言模型在分布式基础设施上的高效训练：综述

大规模语言模型在分布式基础设施上的高效训练：综述

专知会员服务

27+阅读 · 2024年7月30日

《基于动机的战术空对空训练和通用架构下机器学习的计算机生成部队（CGF）建模》

《基于动机的战术空对空训练和通用架构下机器学习的计算机生成部队（CGF）建模》

专知会员服务

34+阅读 · 2024年6月29日

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大训练方法

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大训练方法

专知会员服务

149+阅读 · 2023年4月11日

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

专知会员服务

26+阅读 · 2022年3月15日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

132+阅读 · 2020年5月14日

【微软亚研】预训练文本表示作为元学习，Pre-training Text Representations

【微软亚研】预训练文本表示作为元学习，Pre-training Text Representations

专知会员服务

40+阅读 · 2020年4月17日

【理解计算机视觉损失函数】《Understanding Loss Functions in Computer Vision!》by Sowmya Yellapragad

【理解计算机视觉损失函数】《Understanding Loss Functions in Computer Vision!》by Sowmya Yellapragad

专知会员服务

44+阅读 · 2020年3月4日

热门VIP内容

开通专知VIP会员享更多权益服务

《提升美军全域城市作战训练最佳实践的案例研究》366页

美海军数字作战负责人：如何利用数据快速生成战斗力

《美陆军条例：陆军指挥政策（2026版）》

《军用自主人工智能系统的治理与安全》

相关资讯

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

专知

29+阅读 · 2023年4月11日

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

专知

14+阅读 · 2023年4月6日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

30+阅读 · 2022年9月19日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

强化学习《奖励函数设计: Reward Shaping》详细解读

强化学习《奖励函数设计: Reward Shaping》详细解读

深度强化学习实验室

19+阅读 · 2020年9月1日

预训练语言模型关系图+必读论文列表，清华荣誉出品

预训练语言模型关系图+必读论文列表，清华荣誉出品

机器之心

18+阅读 · 2019年10月11日

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

【CMU教程】高效大规模机器学习训练，198页PDF带你概览领域前沿进展

专知

14+阅读 · 2019年10月9日

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

专知

36+阅读 · 2019年9月29日

深度学习的GPU：深度学习中使用GPU的经验和建议

深度学习的GPU：深度学习中使用GPU的经验和建议

数据挖掘入门与实战

11+阅读 · 2018年1月3日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

相关论文

Out of the Memory Barrier: A Highly Memory Efficient Training System for LLMs with Million-Token Contexts

Arxiv

0+阅读 · 2月17日

Concept Influence: Leveraging Interpretability to Improve Performance and Efficiency in Training Data Attribution

Arxiv

0+阅读 · 2月16日

Investigating Energy Bounds of Analog Compute-in-Memory with Local Normalization

Arxiv

0+阅读 · 2月8日

Out of the Memory Barrier: A Highly Memory Efficient Training System for LLMs with Million-Token Contexts

Arxiv

0+阅读 · 2月7日

Dr. Kernel: Reinforcement Learning Done Right for Triton Kernel Generations

Arxiv

0+阅读 · 2月6日

Horizon-LM: A RAM-Centric Architecture for LLM Training

Arxiv

0+阅读 · 2月4日

How to Train Your Resistive Network: Generalized Equilibrium Propagation and Analytical Learning

Arxiv

0+阅读 · 2月3日

Out of the Memory Barrier: A Highly Memory Efficient Training System for LLMs with Million-Token Contexts

Arxiv

0+阅读 · 2月2日

In-Pipeline Integration of Digital In-Memory-Computing into RISC-V Vector Architecture to Accelerate Deep Learning

Arxiv

0+阅读 · 2月2日

Mixed-Precision Training and Compilation for RRAM-based Computing-in-Memory Accelerators

Arxiv

0+阅读 · 1月30日

相关基金

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

临界态对生物神经网络学习、记忆以及模式识别能力的影响

国家自然科学基金

0+阅读 · 2015年12月31日

基于不完全测量信息的随机忆阻神经网络的参数与状态估计问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于非易失内存设备的数据读写性能优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

“非对称多通道”异质、异构内存系统架构及“启发式”混合内存资源管理机制的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于编译的PCM内存损耗均衡方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向存储受限应用的GPU性能预测模型和通信优化关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

纳米结构巨压阻记忆和恢复效应的缺陷调控机制及非易失性应力传感和存储性能研究

国家自然科学基金

0+阅读 · 2014年12月31日

适用于模拟神经突触功能的电阻可渐变调控忆阻器及其机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员