In the "Big Data" era, a lot of data must be processed and moved between processing and memory units. New technologies and architectures have emerged to improve system performance and overcome the memory bottleneck. The memristor is a technology with both computing and memory capabilities. In-Memory Computing (IMC) can be performed by applying memristors to stateful design methods. The Fast and Energy-Efficient Logic in Memory (FELIX) logic is one of the stateful implementation logics compatible with memristive crossbar arrays. The way computations are performed can be changed to improve performance. Approximate design methods can be applied in error-resilient applications. In error-resilient applications, an acceptable amount of precision is lost while features such as hardware complexity, latency, and energy are improved. In this paper, using these two concepts, an approximate full adder circuit with exact Cout and approximate Sum outputs has been proposed using the FELIX design method for IMC in two different implementation approaches. The applied memristor count in the proposed FELIX-based Approximate Full Adder (FAFA) in the two proposed implementation approaches (FAFA1 and FAFA2) is improved by 14.28% and 28.57%, energy consumption is improved by 73.735% and 81.754%, respectively. The number of computational steps in both approaches is improved by 66.66% compared to the exact FELIX-based full adder. In this paper, two different scenarios are considered for evaluating the FAFA. In the 1st and 2nd scenarios, respectively, for the three and four Most Significant Bits (MSBs), the exact full adder is used, and for the five and four Least Significant Bits (LSBs), the FAFA is used. The results of error analysis and evaluations of the FAFA in three different image processing applications confirmed that FAFA has high accuracy and acceptable performance.


翻译:在"大数据"时代,大量数据需要在处理单元与存储单元之间进行传输和处理。为提升系统性能并克服内存瓶颈,新兴技术与架构不断涌现。忆阻器是一种兼具计算与存储能力的技术。通过将忆阻器应用于状态逻辑设计方法,可实现内存计算。快速节能内存逻辑(FELIX)是一种与忆阻器交叉阵列兼容的状态逻辑实现方法。通过改变计算执行方式可提升系统性能。在容错应用中可采用近似设计方法,该方法在可接受的精度损失范围内,能有效改善硬件复杂度、延迟和能耗等特性。本文融合这两种理念,基于FELIX设计方法提出了两种不同实现方案的近似全加器电路,该电路具有精确进位输出和近似和输出。在两种实现方案(FAFA1与FAFA2)中,所提出的基于FELIX的近似全加器(FAFA)的忆阻器使用量分别优化了14.28%和28.57%,能耗分别降低了73.735%和81.754%。两种方案的计算步骤数相较于精确型FELIX全加器均减少了66.66%。本文设定了两种不同场景评估FAFA性能:在第一和第二场景中,分别对三个和四个最高有效位采用精确全加器,对五个和四个最低有效位采用FAFA。通过在三种不同图像处理应用中的误差分析与性能评估,结果证实FAFA具有高精度与可接受的性能表现。

0
下载
关闭预览

相关内容

现代处理器低功耗漏洞发现与利用
专知会员服务
15+阅读 · 2024年12月5日
【CVPR2023】全栈式,基于 GPU 的深度学习加速, 170页ppt
专知会员服务
64+阅读 · 2023年7月1日
能耗优化的神经网络轻量化方法研究进展
专知会员服务
27+阅读 · 2023年1月29日
神经网络加速器架构概述
专知会员服务
37+阅读 · 2022年4月23日
FPGA加速深度学习综述
专知会员服务
72+阅读 · 2021年11月13日
专知会员服务
81+阅读 · 2020年6月20日
《“边缘计算+”技术白皮书》,82页pdf
专知
11+阅读 · 2022年8月28日
机器学习必备的数学基础有哪些?
人工智能头条
12+阅读 · 2019年10月18日
硬件加速神经网络综述
计算机研究与发展
26+阅读 · 2019年2月1日
新型阻变存储器的物理研究与产业化前景
中国物理学会期刊网
13+阅读 · 2017年11月1日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2月6日
VIP会员
最新内容
面向具身智能与机器人仿真的三维生成:综述
专知会员服务
0+阅读 · 今天14:22
《新兴技术武器化及其对全球风险的影响》
专知会员服务
8+阅读 · 4月29日
《帕兰泰尔平台介绍:信息分析平台》
专知会员服务
21+阅读 · 4月29日
相关VIP内容
现代处理器低功耗漏洞发现与利用
专知会员服务
15+阅读 · 2024年12月5日
【CVPR2023】全栈式,基于 GPU 的深度学习加速, 170页ppt
专知会员服务
64+阅读 · 2023年7月1日
能耗优化的神经网络轻量化方法研究进展
专知会员服务
27+阅读 · 2023年1月29日
神经网络加速器架构概述
专知会员服务
37+阅读 · 2022年4月23日
FPGA加速深度学习综述
专知会员服务
72+阅读 · 2021年11月13日
专知会员服务
81+阅读 · 2020年6月20日
相关资讯
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员