Investigating Energy Bounds of Analog Compute-in-Memory with Local Normalization - 专知论文

会员服务 ·

0

归一化 · 积累 · 比特 · 动态范围 · AI ·

Investigating Energy Bounds of Analog Compute-in-Memory with Local Normalization

翻译：探究模拟存内计算中局部归一化的能量边界

Brian Rojkov,Shubham Ranjan,Derek Wright,Manoj Sachdev

Modern edge AI workloads demand maximum energy efficiency, motivating the pursuit of analog Compute-in-Memory (CIM) architectures. Simultaneously, the popularity of Large-Language-Models (LLMs) drives the adoption of low-bit floating-point formats which prioritize dynamic range. However, the conventional direct-accumulation CIM accommodates floating-points by normalizing them to a shared widened fixed-point scale. Consequently, hardware resolution is dictated by the input's dynamic range rather than its precision, and energy consumption is dominated by the ADC. We address this limitation by introducing local normalization for each input, weight, and multiply-accumulate (MAC) output via a Gain-Ranging MAC (GR-MAC). Normalization overhead is handled by low-power digital logic, enabling the computationally expensive MAC operation to remain in the energy-efficient low-precision analog regime. Energy modelling shows that the addition of a gain-ranging Stage to the MAC enables a 4-bit increase in input dynamic range without increased energy consumption at a 35 dB SQNR standard. Additionally, the ADC resolution requirement becomes invariant to input distribution assumptions, allowing construction of an upper bound with a 1.5-bit reduction compared to the conventional lower bound. These results establish a pathway towards unlocking favourable energy scaling trends of analog CIM for modern AI workloads.

翻译：现代边缘AI工作负载对极致能效的需求，推动了模拟存内计算架构的发展。与此同时，大语言模型的普及促使低比特浮点格式因其优先考虑动态范围而得到采用。然而，传统的直接累加式存内计算通过将浮点数归一化到共享的拓宽定点标度来容纳它们。因此，硬件分辨率由输入的动态范围而非其精度决定，且能耗主要由模数转换器主导。我们通过为每个输入、权重及乘积累加运算输出引入局部归一化（借助增益范围可调乘积累加运算单元）来解决这一局限。归一化开销由低功耗数字逻辑处理，使得计算密集的乘积累加运算得以保持在能效高的低精度模拟域。能量建模表明，在乘积累加运算中增加增益范围调节级，可在保持35 dB信号量化噪声比标准的前提下，使输入动态范围增加4比特而不增加能耗。此外，模数转换器的分辨率要求变得与输入分布假设无关，从而能够构建一个相较于传统下界降低1.5比特的上界。这些结果为现代AI工作负载释放模拟存内计算有利的能量缩放趋势开辟了路径。

0

相关内容

归一化

探究模型能力与应用的进展和边界

探究模型能力与应用的进展和边界

专知会员服务

26+阅读 · 2025年8月27日

基于脉冲神经网络的边缘智能

基于脉冲神经网络的边缘智能

专知会员服务

21+阅读 · 2025年7月23日

《面向边缘AI应用的高性能高能效架构探索》156页

《面向边缘AI应用的高性能高能效架构探索》156页

专知会员服务

36+阅读 · 2025年4月12日

《云边计算中加速器虚拟化技术研究》187页

《云边计算中加速器虚拟化技术研究》187页

专知会员服务

30+阅读 · 2025年4月10日

《为高度不确定环境中的边缘系统定义参考架构》

《为高度不确定环境中的边缘系统定义参考架构》

专知会员服务

30+阅读 · 2024年7月11日

仿生感存算一体视觉系统：仿生机制、设计原理及其应用

仿生感存算一体视觉系统：仿生机制、设计原理及其应用

专知会员服务

30+阅读 · 2023年11月30日

边缘智能研究进展

边缘智能研究进展

专知会员服务

80+阅读 · 2023年11月6日

基于资源管理视角的无人机边缘计算研究综述

基于资源管理视角的无人机边缘计算研究综述

专知会员服务

57+阅读 · 2022年10月19日

内存计算研究进展

专知会员服务

29+阅读 · 2021年2月26日

【中科院计算所】边缘计算与工具综述论文，A Survey on Edge Computing Systems and Tools

【中科院计算所】边缘计算与工具综述论文，A Survey on Edge Computing Systems and Tools

专知会员服务

96+阅读 · 2019年11月12日

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

专知

14+阅读 · 2023年4月6日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

《“边缘计算+”技术白皮书》，82页pdf

《“边缘计算+”技术白皮书》，82页pdf

专知

11+阅读 · 2022年8月28日

【研究报告】《边缘计算参考架构3.0》、《边云协同白皮书》发布！（附下载）

【研究报告】《边缘计算参考架构3.0》、《边云协同白皮书》发布！（附下载）

产业智能官

26+阅读 · 2019年10月12日

【边缘计算】边缘计算面临的问题

【边缘计算】边缘计算面临的问题

产业智能官

17+阅读 · 2019年5月31日

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

产业智能官

16+阅读 · 2019年4月22日

类脑计算的前沿论文，看我们推荐的这7篇

类脑计算的前沿论文，看我们推荐的这7篇

人工智能前沿讲习班

21+阅读 · 2019年1月7日

边缘计算（一）——边缘计算的兴起

边缘计算（一）——边缘计算的兴起

大数据和云计算技术

12+阅读 · 2018年12月25日

图上的归纳表示学习

图上的归纳表示学习

科技创新与创业

23+阅读 · 2017年11月9日

边缘计算：万物互联时代新型计算模型

边缘计算：万物互联时代新型计算模型

计算机研究与发展

15+阅读 · 2017年5月19日

近似计算中基于概率图模型的软错误量化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

云存储系统中节能关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于非易失内存设备的数据读写性能优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

众核集群上基于MPI的模型扩展及性能优化研究

国家自然科学基金

1+阅读 · 2015年12月31日

“非对称多通道”异质、异构内存系统架构及“启发式”混合内存资源管理机制的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于动态匹配的高能量利用率多层堆叠结构静态随机存储器（SRAM）关键技术

国家自然科学基金

0+阅读 · 2015年12月31日

面向存储受限应用的GPU性能预测模型和通信优化关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向众核计算的数值方法协同设计--一种高效且高精度广义有限元方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

动态环境下基于耗散结构的新型粒子群算法及应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

Spatiotemporal Analysis of Parallelized Computing at the Extreme Edge

Arxiv

0+阅读 · 3月11日

Estimation of Energy-dissipation Lower-bounds for Neuromorphic Learning-in-memory

Arxiv

0+阅读 · 3月5日

Joint Hardware-Workload Co-Optimization for In-Memory Computing Accelerators

Arxiv

0+阅读 · 3月4日

A Cascaded Graph Neural Network for Joint Root Cause Localization and Analysis in Edge Computing Environments

Arxiv

0+阅读 · 3月2日

GPU Memory and Utilization Estimation for Training-Aware Resource Management: Opportunities and Limitations

Arxiv

0+阅读 · 2月24日

Collaborative Processing for Multi-Tenant Inference on Memory-Constrained Edge TPUs

Arxiv

0+阅读 · 2月19日

Compact LLM Deployment and World Model Assisted Offloading in Mobile Edge Computing

Arxiv

0+阅读 · 2月14日

Quantifying Edge Intelligence: Inference-Time Scaling Formalisms for Heterogeneous Computing

Arxiv

0+阅读 · 2月9日

Functional Estimation of the Marginal Likelihood

Arxiv

0+阅读 · 2月6日

Locality-Aware Automatic Differentiation on the GPU for Mesh-Based Computations

Arxiv

0+阅读 · 1月31日

VIP会员

文章信息

相关主题

最新内容

【博士论文】基于物理结构与贝叶斯不确定性的可靠神经网络

【博士论文】基于物理结构与贝叶斯不确定性的可靠神经网络

专知会员服务

3+阅读 · 6月4日

AgentOps综述：智能体系统运维框架

AgentOps综述：智能体系统运维框架

专知会员服务

5+阅读 · 6月4日

《美陆军最新条令：兵力防护》

《美陆军最新条令：兵力防护》

专知会员服务

7+阅读 · 6月4日

《军用物联网：架构、应用、挑战与现代战争中的战略意义》

《军用物联网：架构、应用、挑战与现代战争中的战略意义》

专知会员服务

6+阅读 · 6月4日

《人工智能的挑战：算法战的想象与现实》

《人工智能的挑战：算法战的想象与现实》

专知会员服务

7+阅读 · 6月4日

《自适应智能：融合数字孪生精准性与人工智能预见力，实现实时决策》

《自适应智能：融合数字孪生精准性与人工智能预见力，实现实时决策》

专知会员服务

8+阅读 · 6月4日

首场人工智能战争：Maven如何重塑武装冲突

首场人工智能战争：Maven如何重塑武装冲突

专知会员服务

5+阅读 · 6月4日

【博士论文】抽象信息论与安全奖励学习的数学发展

【博士论文】抽象信息论与安全奖励学习的数学发展

专知会员服务

7+阅读 · 6月3日

综述 | 机器人操作世界模型：预测、行动接口与学习生命周期

综述 | 机器人操作世界模型：预测、行动接口与学习生命周期

专知会员服务

5+阅读 · 6月3日

《推进军事决策支持：运用强化学习驱动仿真的稳健作战计划验证》

《推进军事决策支持：运用强化学习驱动仿真的稳健作战计划验证》

专知会员服务

10+阅读 · 6月3日

详解人工智能赋能战争的旗舰软件平台：Maven智能系统

详解人工智能赋能战争的旗舰软件平台：Maven智能系统

专知会员服务

20+阅读 · 6月3日

《发展用于决策支持的化生放核（CBRN）态势理解》

《发展用于决策支持的化生放核（CBRN）态势理解》

专知会员服务

8+阅读 · 6月3日

《通往人工通用智能之路上的均衡策略》

《通往人工通用智能之路上的均衡策略》

专知会员服务

7+阅读 · 6月3日

《人工智能与军事整合：现状与未来风险》报告

《人工智能与军事整合：现状与未来风险》报告

专知会员服务

5+阅读 · 6月3日

《Palantir的科技生态系统》

《Palantir的科技生态系统》

专知会员服务

20+阅读 · 6月2日

相关VIP内容

探究模型能力与应用的进展和边界

探究模型能力与应用的进展和边界

专知会员服务

26+阅读 · 2025年8月27日

基于脉冲神经网络的边缘智能

基于脉冲神经网络的边缘智能

专知会员服务

21+阅读 · 2025年7月23日

《面向边缘AI应用的高性能高能效架构探索》156页

《面向边缘AI应用的高性能高能效架构探索》156页

专知会员服务

36+阅读 · 2025年4月12日

《云边计算中加速器虚拟化技术研究》187页

《云边计算中加速器虚拟化技术研究》187页

专知会员服务

30+阅读 · 2025年4月10日

《为高度不确定环境中的边缘系统定义参考架构》

《为高度不确定环境中的边缘系统定义参考架构》

专知会员服务

30+阅读 · 2024年7月11日

仿生感存算一体视觉系统：仿生机制、设计原理及其应用

仿生感存算一体视觉系统：仿生机制、设计原理及其应用

专知会员服务

30+阅读 · 2023年11月30日

边缘智能研究进展

边缘智能研究进展

专知会员服务

80+阅读 · 2023年11月6日

基于资源管理视角的无人机边缘计算研究综述

基于资源管理视角的无人机边缘计算研究综述

专知会员服务

57+阅读 · 2022年10月19日

内存计算研究进展

专知会员服务

29+阅读 · 2021年2月26日

【中科院计算所】边缘计算与工具综述论文，A Survey on Edge Computing Systems and Tools

【中科院计算所】边缘计算与工具综述论文，A Survey on Edge Computing Systems and Tools

专知会员服务

96+阅读 · 2019年11月12日

热门VIP内容

开通专知VIP会员享更多权益服务

AgentOps综述：智能体系统运维框架

《军用物联网：架构、应用、挑战与现代战争中的战略意义》

【博士论文】基于物理结构与贝叶斯不确定性的可靠神经网络

《美陆军最新条令：兵力防护》

相关资讯

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

专知

14+阅读 · 2023年4月6日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

《“边缘计算+”技术白皮书》，82页pdf

《“边缘计算+”技术白皮书》，82页pdf

专知

11+阅读 · 2022年8月28日

【研究报告】《边缘计算参考架构3.0》、《边云协同白皮书》发布！（附下载）

【研究报告】《边缘计算参考架构3.0》、《边云协同白皮书》发布！（附下载）

产业智能官

26+阅读 · 2019年10月12日

【边缘计算】边缘计算面临的问题

【边缘计算】边缘计算面临的问题

产业智能官

17+阅读 · 2019年5月31日

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

产业智能官

16+阅读 · 2019年4月22日

类脑计算的前沿论文，看我们推荐的这7篇

类脑计算的前沿论文，看我们推荐的这7篇

人工智能前沿讲习班

21+阅读 · 2019年1月7日

边缘计算（一）——边缘计算的兴起

边缘计算（一）——边缘计算的兴起

大数据和云计算技术

12+阅读 · 2018年12月25日

图上的归纳表示学习

图上的归纳表示学习

科技创新与创业

23+阅读 · 2017年11月9日

边缘计算：万物互联时代新型计算模型

边缘计算：万物互联时代新型计算模型

计算机研究与发展

15+阅读 · 2017年5月19日

相关论文

Spatiotemporal Analysis of Parallelized Computing at the Extreme Edge

Arxiv

0+阅读 · 3月11日

Estimation of Energy-dissipation Lower-bounds for Neuromorphic Learning-in-memory

Arxiv

0+阅读 · 3月5日

Joint Hardware-Workload Co-Optimization for In-Memory Computing Accelerators

Arxiv

0+阅读 · 3月4日

A Cascaded Graph Neural Network for Joint Root Cause Localization and Analysis in Edge Computing Environments

Arxiv

0+阅读 · 3月2日

GPU Memory and Utilization Estimation for Training-Aware Resource Management: Opportunities and Limitations

Arxiv

0+阅读 · 2月24日

Collaborative Processing for Multi-Tenant Inference on Memory-Constrained Edge TPUs

Arxiv

0+阅读 · 2月19日

Compact LLM Deployment and World Model Assisted Offloading in Mobile Edge Computing

Arxiv

0+阅读 · 2月14日

Quantifying Edge Intelligence: Inference-Time Scaling Formalisms for Heterogeneous Computing

Arxiv

0+阅读 · 2月9日

Functional Estimation of the Marginal Likelihood

Arxiv

0+阅读 · 2月6日

Locality-Aware Automatic Differentiation on the GPU for Mesh-Based Computations

Arxiv

0+阅读 · 1月31日

相关基金

近似计算中基于概率图模型的软错误量化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

云存储系统中节能关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于非易失内存设备的数据读写性能优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

众核集群上基于MPI的模型扩展及性能优化研究

国家自然科学基金

1+阅读 · 2015年12月31日

“非对称多通道”异质、异构内存系统架构及“启发式”混合内存资源管理机制的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于动态匹配的高能量利用率多层堆叠结构静态随机存储器（SRAM）关键技术

国家自然科学基金

0+阅读 · 2015年12月31日

面向存储受限应用的GPU性能预测模型和通信优化关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向众核计算的数值方法协同设计--一种高效且高精度广义有限元方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

动态环境下基于耗散结构的新型粒子群算法及应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员