Multi-GPU Quantum Circuit Simulation and the Impact of Network Performance - 专知论文

会员服务 ·

0

GPU · 基准 · 基准测试 · 电路模拟 · 网络性能 ·

Multi-GPU Quantum Circuit Simulation and the Impact of Network Performance

翻译：多GPU量子电路模拟及网络性能的影响

W. Michael Brown,Anurag Ramesh,Thomas Lubinski,Thien Nguyen,David E. Bernal Neira

from arxiv, 15 Pages, 5 Figures, In press at Computer Physics Communications

As is intrinsic to the fundamental goal of quantum computing, classical simulation of quantum algorithms is notoriously demanding in resource requirements. Nonetheless, simulation is critical to the success of the field and a requirement for algorithm development and validation, as well as hardware design. GPU-acceleration has become standard practice for simulation, and due to the exponential scaling inherent in classical methods, multi-GPU simulation can be required to achieve representative system sizes. In this case, inter-GPU communications can bottleneck performance. In this work, we present the introduction of MPI into the QED-C Application-Oriented Benchmarks to facilitate benchmarking on HPC systems. We review the advances in interconnect technology and the APIs for multi-GPU communication. We benchmark using a variety of interconnect paths, including the recent NVIDIA Grace Blackwell NVL72 architecture that represents the first product to expand high-bandwidth GPU-specialized interconnects across multiple nodes. We show that while improvements to GPU architecture have led to speedups of over 4.5X across the last few generations of GPUs, advances in interconnect performance have had a larger impact with over 16X performance improvements in time to solution for multi-GPU simulations.

翻译：正如量子计算的基本目标所固有的那样，量子算法的经典模拟在资源需求方面是众所周知的苛刻。尽管如此，模拟对于该领域的成功至关重要，也是算法开发与验证以及硬件设计的必要条件。GPU加速已成为模拟的标准实践，并且由于经典方法固有的指数级扩展特性，可能需要多GPU模拟才能达到具有代表性的系统规模。在这种情况下，GPU间的通信可能成为性能瓶颈。在本工作中，我们将MPI引入QED-C面向应用的基准测试套件，以便于在HPC系统上进行基准测试。我们回顾了互连技术的进展以及用于多GPU通信的API。我们使用多种互连路径进行基准测试，包括近期推出的NVIDIA Grace Blackwell NVL72架构，该架构是首个将高带宽GPU专用互连扩展到多节点的产品。我们表明，虽然GPU架构的改进使得过去几代GPU实现了超过4.5倍的加速，但互连性能的进步产生了更大的影响，使得多GPU模拟的求解时间实现了超过16倍的性能提升。

0

相关内容

GPU

中国信通院联合发布《量子计算发展态势研究报告（2024年）》

中国信通院联合发布《量子计算发展态势研究报告（2024年）》

专知会员服务

22+阅读 · 2024年9月25日

面向多GPU的图神经网络训练加速

面向多GPU的图神经网络训练加速

专知会员服务

24+阅读 · 2023年1月19日

推荐！【量子算法设计、应用】《不确定性条件下用于决策的量子计算算法》IBM、美国空军109页技术报告

推荐！【量子算法设计、应用】《不确定性条件下用于决策的量子计算算法》IBM、美国空军109页技术报告

专知会员服务

56+阅读 · 2022年10月8日

《量子计算和算法信息在基因组学和强化学习中的因果模型的应用》2022最新博士论文，代尔夫特理工大学

《量子计算和算法信息在基因组学和强化学习中的因果模型的应用》2022最新博士论文，代尔夫特理工大学

专知会员服务

21+阅读 · 2022年6月29日

《量子优势阈值下的量子计算：一个正式的综述》牛津大学等2022最新525篇文献55页论文

《量子优势阈值下的量子计算：一个正式的综述》牛津大学等2022最新525篇文献55页论文

专知会员服务

11+阅读 · 2022年6月28日

什么是量子神经网络？陶大程等发布最新《量子生成学习模型》研究综述，30页pdf涵盖305篇文献讲述最新量子神经网络进展

什么是量子神经网络？陶大程等发布最新《量子生成学习模型》研究综述，30页pdf涵盖305篇文献讲述最新量子神经网络进展

专知会员服务

30+阅读 · 2022年6月21日

南洋理工北大等首篇《GPU数据中心中深度学习工作负载调度》综述论文，35页pdf全面阐述DL训练与推理GPU调度技术进展

南洋理工北大等首篇《GPU数据中心中深度学习工作负载调度》综述论文，35页pdf全面阐述DL训练与推理GPU调度技术进展

专知会员服务

46+阅读 · 2022年5月27日

paper速读：人工智能中的量子数学，Quantum Mathematics in Artificial Intelligence

paper速读：人工智能中的量子数学，Quantum Mathematics in Artificial Intelligence

专知会员服务

36+阅读 · 2022年3月18日

2021年中国量子计算应用市场研究报告

2021年中国量子计算应用市场研究报告

专知会员服务

38+阅读 · 2021年10月28日

量子优化算法综述

专知会员服务

37+阅读 · 2021年9月12日

盘点来自工业界的GPU共享方案

盘点来自工业界的GPU共享方案

计算机视觉life

12+阅读 · 2021年9月2日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

谷歌EfficientNet缩放模型，PyTorch实现登热榜

谷歌EfficientNet缩放模型，PyTorch实现登热榜

机器学习算法与Python学习

11+阅读 · 2019年6月4日

图神经网络开发必备组件，NetworkX、稀疏矩阵、稀疏Tensor等

图神经网络开发必备组件，NetworkX、稀疏矩阵、稀疏Tensor等

专知

48+阅读 · 2019年5月10日

硬件加速神经网络综述

硬件加速神经网络综述

计算机研究与发展

26+阅读 · 2019年2月1日

图神经网络最近这么火，不妨看看我们精选的这七篇

图神经网络最近这么火，不妨看看我们精选的这七篇

人工智能前沿讲习班

37+阅读 · 2018年12月10日

【优青论文】深度神经网络压缩与加速综述

【优青论文】深度神经网络压缩与加速综述

计算机研究与发展

17+阅读 · 2018年9月20日

超全总结：神经网络加速之量化模型 | 附带代码

超全总结：神经网络加速之量化模型 | 附带代码

PaperWeekly

12+阅读 · 2018年6月1日

深度学习的GPU：深度学习中使用GPU的经验和建议

深度学习的GPU：深度学习中使用GPU的经验和建议

数据挖掘入门与实战

11+阅读 · 2018年1月3日

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

机器人圈

35+阅读 · 2017年7月18日

量子算法加速性差异研究及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

利用连续变量多组份纠缠态实现经典和量子算法

国家自然科学基金

0+阅读 · 2015年12月31日

量子图像安全保密关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

高维多体量子态量子关联的度量及其在量子随机行走中变化的研究

国家自然科学基金

0+阅读 · 2015年12月31日

量子计算算法设计与实现方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向存储受限应用的GPU性能预测模型和通信优化关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

多体量子纠缠与量子信息网络研究

国家自然科学基金

1+阅读 · 2014年12月31日

CPU和GPU混合体系结构上生物网络比对并行算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

噪声环境下腔量子电动力学量子计算与量子相干操控的理论研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于量子图像表示与变换理论的图像加密算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

Towards heterogeneous parallelism for SPHinXsys

Arxiv

0+阅读 · 3月17日

Trainability barriers and opportunities in quantum generative modeling

Arxiv

0+阅读 · 3月16日

Reference Architecture of a Quantum-Centric Supercomputer

Arxiv

0+阅读 · 3月12日

Reference Architecture of a Quantum-Centric Supercomputer

Arxiv

0+阅读 · 3月11日

Simulation of a Heterogeneous Quantum Network

Arxiv

0+阅读 · 3月3日

An Extensible Quantum Network Simulator Built on ns-3: Q2NS Design and Evaluation

Arxiv

0+阅读 · 3月3日

Fast and memory-efficient classical simulation of quantum machine learning via forward and backward gate fusion

Arxiv

0+阅读 · 3月3日

The Road to Useful Quantum Computers

Arxiv

0+阅读 · 2月26日

The Power of Shallow-depth Toffoli and Qudit Quantum Circuits

Arxiv

0+阅读 · 2月12日

Bridging Classical and Quantum: Group-Theoretic Approach to Quantum Circuit Simulation

Arxiv

0+阅读 · 2月7日

VIP会员

文章信息

相关主题

最新内容

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

专知会员服务

2+阅读 · 今天0:51

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

专知会员服务

2+阅读 · 4月29日

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

专知会员服务

6+阅读 · 4月29日

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

专知会员服务

5+阅读 · 4月29日

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

专知会员服务

5+阅读 · 4月29日

《化繁为简：军事模拟器配置的对话式方法》报告

《化繁为简：军事模拟器配置的对话式方法》报告

专知会员服务

6+阅读 · 4月29日

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

专知会员服务

9+阅读 · 4月29日

《新兴技术武器化及其对全球风险的影响》

《新兴技术武器化及其对全球风险的影响》

专知会员服务

7+阅读 · 4月29日

《帕兰泰尔平台介绍：信息分析平台》

《帕兰泰尔平台介绍：信息分析平台》

专知会员服务

17+阅读 · 4月29日

Maven智能系统（MSS）如何赋能第三方解决方案：北约视角

Maven智能系统（MSS）如何赋能第三方解决方案：北约视角

专知会员服务

10+阅读 · 4月29日

【伯克利博士论文】深度解析 AI 智能体的失配问题

【伯克利博士论文】深度解析 AI 智能体的失配问题

专知会员服务

8+阅读 · 4月28日

智能体化世界建模：基础、能力、规律及展望

智能体化世界建模：基础、能力、规律及展望

专知会员服务

11+阅读 · 4月28日

MIT人机协同水下作业关键技术研究——集成适配至美国海军现役AUV

MIT人机协同水下作业关键技术研究——集成适配至美国海军现役AUV

专知会员服务

8+阅读 · 4月28日

美海警海上态势感知无人系统

美海警海上态势感知无人系统

专知会员服务

6+阅读 · 4月28日

安杜里尔Lattice平台的发展演变：美军多域自主作战的核心软件架构

安杜里尔Lattice平台的发展演变：美军多域自主作战的核心软件架构

专知会员服务

10+阅读 · 4月28日

相关VIP内容

中国信通院联合发布《量子计算发展态势研究报告（2024年）》

中国信通院联合发布《量子计算发展态势研究报告（2024年）》

专知会员服务

22+阅读 · 2024年9月25日

面向多GPU的图神经网络训练加速

面向多GPU的图神经网络训练加速

专知会员服务

24+阅读 · 2023年1月19日

推荐！【量子算法设计、应用】《不确定性条件下用于决策的量子计算算法》IBM、美国空军109页技术报告

推荐！【量子算法设计、应用】《不确定性条件下用于决策的量子计算算法》IBM、美国空军109页技术报告

专知会员服务

56+阅读 · 2022年10月8日

《量子计算和算法信息在基因组学和强化学习中的因果模型的应用》2022最新博士论文，代尔夫特理工大学

《量子计算和算法信息在基因组学和强化学习中的因果模型的应用》2022最新博士论文，代尔夫特理工大学

专知会员服务

21+阅读 · 2022年6月29日

《量子优势阈值下的量子计算：一个正式的综述》牛津大学等2022最新525篇文献55页论文

《量子优势阈值下的量子计算：一个正式的综述》牛津大学等2022最新525篇文献55页论文

专知会员服务

11+阅读 · 2022年6月28日

什么是量子神经网络？陶大程等发布最新《量子生成学习模型》研究综述，30页pdf涵盖305篇文献讲述最新量子神经网络进展

什么是量子神经网络？陶大程等发布最新《量子生成学习模型》研究综述，30页pdf涵盖305篇文献讲述最新量子神经网络进展

专知会员服务

30+阅读 · 2022年6月21日

南洋理工北大等首篇《GPU数据中心中深度学习工作负载调度》综述论文，35页pdf全面阐述DL训练与推理GPU调度技术进展

南洋理工北大等首篇《GPU数据中心中深度学习工作负载调度》综述论文，35页pdf全面阐述DL训练与推理GPU调度技术进展

专知会员服务

46+阅读 · 2022年5月27日

paper速读：人工智能中的量子数学，Quantum Mathematics in Artificial Intelligence

paper速读：人工智能中的量子数学，Quantum Mathematics in Artificial Intelligence

专知会员服务

36+阅读 · 2022年3月18日

2021年中国量子计算应用市场研究报告

2021年中国量子计算应用市场研究报告

专知会员服务

38+阅读 · 2021年10月28日

量子优化算法综述

专知会员服务

37+阅读 · 2021年9月12日

热门VIP内容

开通专知VIP会员享更多权益服务

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

相关资讯

盘点来自工业界的GPU共享方案

盘点来自工业界的GPU共享方案

计算机视觉life

12+阅读 · 2021年9月2日

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

最新最全《深度元学习》2021综述论文，68页pdf，A Survey of Deep Meta-Learning

专知

11+阅读 · 2021年4月23日

谷歌EfficientNet缩放模型，PyTorch实现登热榜

谷歌EfficientNet缩放模型，PyTorch实现登热榜

机器学习算法与Python学习

11+阅读 · 2019年6月4日

图神经网络开发必备组件，NetworkX、稀疏矩阵、稀疏Tensor等

图神经网络开发必备组件，NetworkX、稀疏矩阵、稀疏Tensor等

专知

48+阅读 · 2019年5月10日

硬件加速神经网络综述

硬件加速神经网络综述

计算机研究与发展

26+阅读 · 2019年2月1日

图神经网络最近这么火，不妨看看我们精选的这七篇

图神经网络最近这么火，不妨看看我们精选的这七篇

人工智能前沿讲习班

37+阅读 · 2018年12月10日

【优青论文】深度神经网络压缩与加速综述

【优青论文】深度神经网络压缩与加速综述

计算机研究与发展

17+阅读 · 2018年9月20日

超全总结：神经网络加速之量化模型 | 附带代码

超全总结：神经网络加速之量化模型 | 附带代码

PaperWeekly

12+阅读 · 2018年6月1日

深度学习的GPU：深度学习中使用GPU的经验和建议

深度学习的GPU：深度学习中使用GPU的经验和建议

数据挖掘入门与实战

11+阅读 · 2018年1月3日

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

机器人圈

35+阅读 · 2017年7月18日

相关论文

Towards heterogeneous parallelism for SPHinXsys

Arxiv

0+阅读 · 3月17日

Trainability barriers and opportunities in quantum generative modeling

Arxiv

0+阅读 · 3月16日

Reference Architecture of a Quantum-Centric Supercomputer

Arxiv

0+阅读 · 3月12日

Reference Architecture of a Quantum-Centric Supercomputer

Arxiv

0+阅读 · 3月11日

Simulation of a Heterogeneous Quantum Network

Arxiv

0+阅读 · 3月3日

An Extensible Quantum Network Simulator Built on ns-3: Q2NS Design and Evaluation

Arxiv

0+阅读 · 3月3日

Fast and memory-efficient classical simulation of quantum machine learning via forward and backward gate fusion

Arxiv

0+阅读 · 3月3日

The Road to Useful Quantum Computers

Arxiv

0+阅读 · 2月26日

The Power of Shallow-depth Toffoli and Qudit Quantum Circuits

Arxiv

0+阅读 · 2月12日

Bridging Classical and Quantum: Group-Theoretic Approach to Quantum Circuit Simulation

Arxiv

0+阅读 · 2月7日

相关基金

量子算法加速性差异研究及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

利用连续变量多组份纠缠态实现经典和量子算法

国家自然科学基金

0+阅读 · 2015年12月31日

量子图像安全保密关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

高维多体量子态量子关联的度量及其在量子随机行走中变化的研究

国家自然科学基金

0+阅读 · 2015年12月31日

量子计算算法设计与实现方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向存储受限应用的GPU性能预测模型和通信优化关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

多体量子纠缠与量子信息网络研究

国家自然科学基金

1+阅读 · 2014年12月31日

CPU和GPU混合体系结构上生物网络比对并行算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

噪声环境下腔量子电动力学量子计算与量子相干操控的理论研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于量子图像表示与变换理论的图像加密算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员