Towards Topology-Aware Very Large-Scale Photonic AI Accelerators - 专知论文

会员服务 ·

0

缩放 · AI · Performer · Neural Networks · Networking ·

Towards Topology-Aware Very Large-Scale Photonic AI Accelerators

翻译：面向拓扑感知的超大规模光子AI加速器

Belal Jahannia,Abdolah Amirany,Hamed Dalir

from arxiv, 15 pages, 7 figures

The rapid growth of deep neural networks (DNNs) has exposed fundamental limitations in electronic accelerators, where data movement dominates energy consumption, commonly referred to as the memory wall. Photonic accelerators offer a compelling alternative due to their inherent parallelism and high-speed matrix operations. However, existing research largely focuses on device-level innovations, leaving system-level scalability insufficiently explored. In this paper, we present a scalable photonic accelerator architecture based on a modular scale-out paradigm using 4 X 4 photonic tensor core units. We perform a systematic architectural analysis that incorporates the practical scaling limits of photonic hardware, including insertion loss, fanout penalties, and laser power limits, which restrict monolithic photonic scaling. Through evaluation on representative DNN workloads (GoogleNet, ResNet-18, MobileNet, and AlphaGo Zero) with up to 1024 processing elements, we identify a topology-dominated scaling bottleneck in the photonic domain, termed the Utilization Wall, where performance is governed by grid topology rather than hardware size. We further establish the Symmetric Grid Rule, demonstrating that symmetric topologies improve utilization by up to 6X while reducing memory access by over 40% compared to linear configurations, which reveal that topology-aware scaling is essential for achieving energy-efficient and high-performance photonic AI accelerators.

翻译：深度神经网络（DNN）的快速发展暴露了电子加速器中的根本性局限，其中数据传输主导能耗，这通常被称为“存储墙”。光子加速器凭借其固有的并行性和高速矩阵运算能力，提供了一种引人注目的替代方案。然而，现有研究主要集中于器件层面的创新，系统级可扩展性仍未得到充分探索。本文提出了一种基于模块化横向扩展范式的可扩展光子加速器架构，该架构采用4×4光子张量核心单元。我们进行了系统级的架构分析，纳入了光子硬件的实际扩展限制，包括插入损耗、扇出代价和激光功率限制，这些因素制约了单片光子扩展。通过对代表性DNN工作负载（GoogleNet、ResNet-18、MobileNet和AlphaGo Zero）进行评估（最多使用1024个处理单元），我们识别出光子领域中的拓扑主导扩展瓶颈，称为“利用率墙”，其性能取决于网格拓扑而非硬件规模。我们进一步建立了对称网格规则，证明与线性配置相比，对称拓扑可将利用率提升高达6倍，同时减少超过40%的内存访问。这表明拓扑感知扩展对于实现高能效和高性能的光子AI加速器至关重要。

0

相关内容

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

专知会员服务

27+阅读 · 2025年2月4日

【普林斯顿博士论文】深度学习加速器的编译器支持：端到端评估与数据访问优化

【普林斯顿博士论文】深度学习加速器的编译器支持：端到端评估与数据访问优化

专知会员服务

19+阅读 · 2025年1月7日

【MIT博士论文】稀疏深度神经网络加速器的系统建模与设计, 139页pdf

【MIT博士论文】稀疏深度神经网络加速器的系统建模与设计, 139页pdf

专知会员服务

36+阅读 · 2023年8月12日

UCLA最新《图神经网络加速》综述，54页pdf阐述算法、系统和定制硬件

UCLA最新《图神经网络加速》综述，54页pdf阐述算法、系统和定制硬件

专知会员服务

22+阅读 · 2023年7月1日

【剑桥大学博士论文】高效神经网络的软硬件协同设计，144页pdf

【剑桥大学博士论文】高效神经网络的软硬件协同设计，144页pdf

专知会员服务

53+阅读 · 2023年2月12日

【伯克利Guanhua Wang】分布式机器学习系统的颠覆性研究，附210页Slides与博士论文

【伯克利Guanhua Wang】分布式机器学习系统的颠覆性研究，附210页Slides与博士论文

专知会员服务

44+阅读 · 2022年7月6日

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

专知会员服务

11+阅读 · 2022年6月5日

【深度神经网络加速器的硬件近似技术综述】Hardware Approximate Techniques for Deep Neural Network Accelerators: A Survey

【深度神经网络加速器的硬件近似技术综述】Hardware Approximate Techniques for Deep Neural Network Accelerators: A Survey

专知会员服务

16+阅读 · 2022年3月17日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知会员服务

159+阅读 · 2020年5月2日

【WF-IoT-普渡大学】低功耗深度学习和计算机视觉方法综述

专知会员服务

46+阅读 · 2020年3月26日

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

专知

20+阅读 · 2020年10月5日

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

专知

18+阅读 · 2020年6月22日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

专知

14+阅读 · 2019年10月31日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

GAN生成式对抗网络

14+阅读 · 2019年5月23日

牛逼哄哄的图卷积神经网络将带来哪些机遇？

牛逼哄哄的图卷积神经网络将带来哪些机遇？

计算机视觉life

49+阅读 · 2019年3月25日

【边缘智能】边缘计算驱动的深度学习加速技术

【边缘智能】边缘计算驱动的深度学习加速技术

产业智能官

20+阅读 · 2019年2月8日

硬件加速神经网络综述

硬件加速神经网络综述

计算机研究与发展

26+阅读 · 2019年2月1日

基于光学超晶格实现光纤通讯和量子存储波段的多色连续变量纠缠光场

国家自然科学基金

0+阅读 · 2015年12月31日

宽带硅纳米波导相位敏感光参量放大器的机理与技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于光纤延迟线环和光栅的智能光子射频存储器

国家自然科学基金

0+阅读 · 2015年12月31日

面向大容量长距离波分复用系统的相位敏感光放大器研究

国家自然科学基金

0+阅读 · 2015年12月31日

光电混合型高速高精度数模转换器的关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

超高速CMOS数模转换器关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于光学扫描全息的多图像加密原理及方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

高速双段式DFB集成激光芯片研究

国家自然科学基金

0+阅读 · 2014年12月31日

极限学习机拓展研究及其在近红外光谱分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

可光场调控的纳米磁流体材料及相应的光控全光纤功能器件关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

A biological vision inspired framework for machine perception of abutting grating illusory contours

Arxiv

0+阅读 · 6月15日

Otters++: A Time-to-first-spike Based Energy Efficient Optical Spiking Transformer

Arxiv

0+阅读 · 6月11日

DxPTA: An Architecture Design Space Exploration with Optical Dataflow-guided Strategy for HW/SW Co-Design of Photonic Transformer Accelerators

Arxiv

0+阅读 · 6月2日

CRAM-ER: Error-Resilient Spintronic Computational Random Access Memory for Scalable In-Memory Computation

Arxiv

0+阅读 · 6月1日

OpenEye: A Scalable Open-Source Hardware Accelerator for DNNs

Arxiv

0+阅读 · 5月31日

Memristor-Based Spiking Neural Network Accelerator for Bio-inspired Interception Task

Arxiv

0+阅读 · 5月29日

A complete discussion on fully reconfigurable, digital, scalable, graph and sparsity-aware near-memory accelerator for graph neural networks

Arxiv

0+阅读 · 5月27日

NeuroRing: Scaling Spiking Neural Networks via Multi-FPGA Bidirectional Ring Topologies and Stream-Dataflow Architectures

Arxiv

0+阅读 · 5月26日

A complete discussion on fully reconfigurable, digital, scalable, graph and sparsity-aware near-memory accelerator for graph neural networks

Arxiv

0+阅读 · 5月19日

Spiker-LL: An Energy-Efficient FPGA Accelerator Enabling Adaptive Local Learning in Spiking Neural Networks

Arxiv

0+阅读 · 5月18日

VIP会员

文章信息

相关主题

Neural Networks

最新内容

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

5+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

2+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

6+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

7+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

3+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

7+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

5+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

5+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

5+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

3+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

12+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

9+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

9+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

6+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

9+阅读 · 7月31日

相关VIP内容

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

【博士论文】深度神经网络的统计物理学：泛化能力、超越无限宽度和特征学习

专知会员服务

27+阅读 · 2025年2月4日

【普林斯顿博士论文】深度学习加速器的编译器支持：端到端评估与数据访问优化

【普林斯顿博士论文】深度学习加速器的编译器支持：端到端评估与数据访问优化

专知会员服务

19+阅读 · 2025年1月7日

【MIT博士论文】稀疏深度神经网络加速器的系统建模与设计, 139页pdf

【MIT博士论文】稀疏深度神经网络加速器的系统建模与设计, 139页pdf

专知会员服务

36+阅读 · 2023年8月12日

UCLA最新《图神经网络加速》综述，54页pdf阐述算法、系统和定制硬件

UCLA最新《图神经网络加速》综述，54页pdf阐述算法、系统和定制硬件

专知会员服务

22+阅读 · 2023年7月1日

【剑桥大学博士论文】高效神经网络的软硬件协同设计，144页pdf

【剑桥大学博士论文】高效神经网络的软硬件协同设计，144页pdf

专知会员服务

53+阅读 · 2023年2月12日

【伯克利Guanhua Wang】分布式机器学习系统的颠覆性研究，附210页Slides与博士论文

【伯克利Guanhua Wang】分布式机器学习系统的颠覆性研究，附210页Slides与博士论文

专知会员服务

44+阅读 · 2022年7月6日

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

专知会员服务

11+阅读 · 2022年6月5日

【深度神经网络加速器的硬件近似技术综述】Hardware Approximate Techniques for Deep Neural Network Accelerators: A Survey

【深度神经网络加速器的硬件近似技术综述】Hardware Approximate Techniques for Deep Neural Network Accelerators: A Survey

专知会员服务

16+阅读 · 2022年3月17日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知会员服务

159+阅读 · 2020年5月2日

【WF-IoT-普渡大学】低功耗深度学习和计算机视觉方法综述

专知会员服务

46+阅读 · 2020年3月26日

热门VIP内容

开通专知VIP会员享更多权益服务

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

从采集到决策：美军视角下的战术情报范式重构

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

相关资讯

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

专知

20+阅读 · 2020年10月5日

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

专知

18+阅读 · 2020年6月22日

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

最新《可解释深度学习XDL》2020研究进展综述大全，54页pdf

专知

37+阅读 · 2020年5月2日

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

【综述】深度学习攻防对抗在图像数据、图数据以及文本数据上的应用

专知

14+阅读 · 2019年10月31日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

GAN生成式对抗网络

14+阅读 · 2019年5月23日

牛逼哄哄的图卷积神经网络将带来哪些机遇？

牛逼哄哄的图卷积神经网络将带来哪些机遇？

计算机视觉life

49+阅读 · 2019年3月25日

【边缘智能】边缘计算驱动的深度学习加速技术

【边缘智能】边缘计算驱动的深度学习加速技术

产业智能官

20+阅读 · 2019年2月8日

硬件加速神经网络综述

硬件加速神经网络综述

计算机研究与发展

26+阅读 · 2019年2月1日

相关论文

A biological vision inspired framework for machine perception of abutting grating illusory contours

Arxiv

0+阅读 · 6月15日

Otters++: A Time-to-first-spike Based Energy Efficient Optical Spiking Transformer

Arxiv

0+阅读 · 6月11日

DxPTA: An Architecture Design Space Exploration with Optical Dataflow-guided Strategy for HW/SW Co-Design of Photonic Transformer Accelerators

Arxiv

0+阅读 · 6月2日

CRAM-ER: Error-Resilient Spintronic Computational Random Access Memory for Scalable In-Memory Computation

Arxiv

0+阅读 · 6月1日

OpenEye: A Scalable Open-Source Hardware Accelerator for DNNs

Arxiv

0+阅读 · 5月31日

Memristor-Based Spiking Neural Network Accelerator for Bio-inspired Interception Task

Arxiv

0+阅读 · 5月29日

A complete discussion on fully reconfigurable, digital, scalable, graph and sparsity-aware near-memory accelerator for graph neural networks

Arxiv

0+阅读 · 5月27日

NeuroRing: Scaling Spiking Neural Networks via Multi-FPGA Bidirectional Ring Topologies and Stream-Dataflow Architectures

Arxiv

0+阅读 · 5月26日

A complete discussion on fully reconfigurable, digital, scalable, graph and sparsity-aware near-memory accelerator for graph neural networks

Arxiv

0+阅读 · 5月19日

Spiker-LL: An Energy-Efficient FPGA Accelerator Enabling Adaptive Local Learning in Spiking Neural Networks

Arxiv

0+阅读 · 5月18日

相关基金

基于光学超晶格实现光纤通讯和量子存储波段的多色连续变量纠缠光场

国家自然科学基金

0+阅读 · 2015年12月31日

宽带硅纳米波导相位敏感光参量放大器的机理与技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于光纤延迟线环和光栅的智能光子射频存储器

国家自然科学基金

0+阅读 · 2015年12月31日

面向大容量长距离波分复用系统的相位敏感光放大器研究

国家自然科学基金

0+阅读 · 2015年12月31日

光电混合型高速高精度数模转换器的关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

超高速CMOS数模转换器关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于光学扫描全息的多图像加密原理及方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

高速双段式DFB集成激光芯片研究

国家自然科学基金

0+阅读 · 2014年12月31日

极限学习机拓展研究及其在近红外光谱分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

可光场调控的纳米磁流体材料及相应的光控全光纤功能器件关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员