Recently, nature-inspired computing approaches have gained significant attention for solving difficult optimization problems, particularly through Ising machines for NP-complete applications. Existing Ising accelerators range from quantum and optical annealers to CMOS-based von-Neumann and in-memory architectures. However, many prior designs are specialized accelerators limited to specific problem classes, rely on ADC/DAC circuits, and suffer from reliability challenges due to process-variation-sensitive embedded memory technologies. This paper presents SACHI, an all-digital Ising architecture implemented by repurposing the L1 cache of a CPU using SRAM-based processing-in-memory techniques. SACHI eliminates the need for ADCs/DACs, improves reliability compared to prior approaches such as BRIM, and enables Ising acceleration with minimal hardware overhead integrated into the CPU pipeline. The paper also provides detailed architectural analysis and pseudo-code for the proposed algorithms. The key contributions of SACHI are: (i) tight integration of the accelerator with the CPU pipeline, (ii) reuse of existing cache hardware for acceleration, (iii) higher parallelism enabled through reuse-aware computation, and (iv) improved performance and energy efficiency for large-scale, high-precision optimization problems using novel compute and mapping strategies. Compared to BRIM, SACHI achieves 300x performance improvement and 80x energy reduction across applications including asset allocation, molecular dynamics, image segmentation, and traveling salesman problems. Additionally, reuse factors up to 4000x are observed for several workloads. This work demonstrates that reliable and efficient all-digital Ising acceleration can be achieved using commodity SRAM structures tightly integrated with general-purpose processors.


翻译:近期,受自然启发的计算方法在解决困难优化问题方面备受关注,尤其是通过伊辛机解决NP完全应用。现有的伊辛加速器涵盖从量子加速器和光退火器到基于CMOS的冯·诺依曼架构和存内架构。然而,许多现有设计是局限于特定问题类别的专用加速器,依赖模数转换器/数模转换器,并因对工艺偏差敏感的嵌入式存储技术而面临可靠性挑战。本文提出SACHI,一种通过利用SRAM基存内计算技术重新利用CPU一级缓存实现的全数字伊辛架构。SACHI消除了对模数转换器/数模转换器的需求,相比BRIM等先前方法提高了可靠性,并通过集成到CPU流水线中以最小硬件开销实现伊辛加速。本文还提供了详细的架构分析和所提算法的伪代码。SACHI的主要贡献在于:(i) 加速器与CPU流水线的紧耦合集成,(ii) 利用现有缓存硬件进行加速,(iii) 通过复用感知计算实现更高并行性,以及(iv) 通过新颖计算和映射策略提升大规模高精度优化问题的性能与能效。与BRIM相比,SACHI在资产配置、分子动力学、图像分割和旅行商问题等应用中实现了300倍的性能提升和80倍的能耗降低。此外,多个工作负载的复用因子高达4000倍。本研究证明,通过将商用SRAM结构与通用处理器紧耦合,可实现可靠且高效的全数字伊辛加速。

0
下载
关闭预览

相关内容

中央处理器(CPU,Central Processing Unit),电子计算机的主要设备之一。其功能主要是解释计算机指令以及处理计算机软件中的数据。
专知会员服务
29+阅读 · 2021年2月26日
伊利诺伊《算法》书籍,集20年之大成,附472页pdf
专知会员服务
65+阅读 · 2020年9月27日
综述:军事应用中使用的一些重要算法
专知
13+阅读 · 2022年7月3日
可解释的机器学习
平均机器
25+阅读 · 2019年2月25日
类脑计算的前沿论文,看我们推荐的这7篇
人工智能前沿讲习班
21+阅读 · 2019年1月7日
448页伊利诺伊大学《算法》图书-附下载
专知
15+阅读 · 2018年12月31日
最新|深度离散哈希算法,可用于图像检索!
全球人工智能
14+阅读 · 2017年12月15日
国家自然科学基金
8+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Arxiv
0+阅读 · 5月13日
VIP会员
最新内容
《通过小型无人机系统将情报能力“作战化”》
消耗优势:美军的“精确规模化”概念
专知会员服务
8+阅读 · 6月15日
《离线语言支持系统:面向空战战术决策》
专知会员服务
10+阅读 · 6月15日
相关基金
国家自然科学基金
8+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员