High-performance Vector-length Agnostic Quantum Circuit Simulations on ARM Processors - 专知论文

会员服务 ·

0

ARM · 设计 · 电路模拟 · 向量化 · 负载 ·

High-performance Vector-length Agnostic Quantum Circuit Simulations on ARM Processors

翻译：基于ARM处理器的高性能向量长度无关量子电路模拟

Ruimin Shi,Gabin Schieffer,Pei-Hung Lin,Maya Gokhale,Andreas Herten,Ivy Peng

from arxiv, To be published in IPDPS2026

ARM SVE and RISC-V RVV are emerging vector architectures in high-end processors that support vectorization of flexible vector length. In this work, we leverage an important workload for quantum computing, quantum state-vector simulations, to understand whether high-performance portability can be achieved in a vector-length agnostic (VLA) design. We propose a VLA design and optimization techniques critical for achieving high performance, including VLEN-adaptive memory layout adjustment, load buffering, fine-grained loop control, and gate fusion-based arithmetic intensity adaptation. We provide an implementation in Google's Qsim and evaluate five quantum circuits of up to 36 qubits on three ARM processors, including NVIDIA Grace, AWS Graviton3, and Fujitsu A64FX. By defining new metrics and PMU events to quantify vectorization activities, we draw generic insights for future VLA designs. Our single-source implementation of VLA quantum simulations achieves up to 4.5x speedup on A64FX, 2.5x speedup on Grace, and 1.5x speedup on Graviton.

翻译：ARM SVE与RISC-V RVV是高端处理器中新兴的向量架构，支持灵活向量长度的向量化运算。本研究以量子计算的关键负载——量子态矢量模拟为切入点，探究在向量长度无关（VLA）的设计范式下能否实现高性能的可移植性。我们提出了一套对实现高性能至关重要的VLA设计与优化技术，包括VLEN自适应内存布局调整、加载缓冲、细粒度循环控制以及基于量子门融合的算术强度适配。我们在Google的Qsim模拟器中实现了该方案，并在三款ARM处理器（包括NVIDIA Grace、AWS Graviton3和富士通A64FX）上对五个最高达36量子位的量子电路进行了评估。通过定义新的度量指标与PMU事件来量化向量化活动，我们为未来VLA架构设计提供了通用性见解。我们采用单一代码库实现的VLA量子模拟在A64FX上最高获得4.5倍加速，在Grace上获得2.5倍加速，在Graviton上获得1.5倍加速。

0

相关内容

ARM

安谋控股公司，又称ARM公司，跨国性半导体设计与软件公司，总部位于英国英格兰剑桥。主要的产品是ARM架构处理器的设计，将其以知识产权的形式向客户进行授权，同时也提供软件开发工具。维基百科

CVPR 2026 Findings | 算力砍半、性能不降！全开源 A₁模型：让机器人大模型真正走向落地

CVPR 2026 Findings | 算力砍半、性能不降！全开源 A₁模型：让机器人大模型真正走向落地

专知会员服务

13+阅读 · 4月12日

军方将如何运用量子人工智能？量子人工智能可能在抵达战场前重塑军事规划

军方将如何运用量子人工智能？量子人工智能可能在抵达战场前重塑军事规划

专知会员服务

16+阅读 · 2月6日

《将量子技术整合至移动军事系统与战术作战中心框架》

《将量子技术整合至移动军事系统与战术作战中心框架》

专知会员服务

25+阅读 · 1月28日

量子增强计算机视觉：超越经典算法

量子增强计算机视觉：超越经典算法

专知会员服务

20+阅读 · 2025年10月9日

《量子与军事通信安全：量子计算在军事通信中的机遇、风险、实施挑战与前景分析》最新综述

《量子与军事通信安全：量子计算在军事通信中的机遇、风险、实施挑战与前景分析》最新综述

专知会员服务

28+阅读 · 2025年4月30日

《可重构智能表面和无人机辅助通信：深度强化学习方法》169页博士论文

《可重构智能表面和无人机辅助通信：深度强化学习方法》169页博士论文

专知会员服务

28+阅读 · 2025年1月12日

【新书】深度强化学习在可重构智能表面和无人机赋能智能6G通信中的应用

【新书】深度强化学习在可重构智能表面和无人机赋能智能6G通信中的应用

专知会员服务

27+阅读 · 2025年1月3日

Transformer它就是个支持向量机

Transformer它就是个支持向量机

专知会员服务

38+阅读 · 2023年9月7日

【剑桥大学博士论文】针对微控制器和应用级处理器的高效空间和时间安全性，192页pdf

【剑桥大学博士论文】针对微控制器和应用级处理器的高效空间和时间安全性，192页pdf

专知会员服务

17+阅读 · 2023年7月7日

什么是量子神经网络？陶大程等发布最新《量子生成学习模型》研究综述，30页pdf涵盖305篇文献讲述最新量子神经网络进展

什么是量子神经网络？陶大程等发布最新《量子生成学习模型》研究综述，30页pdf涵盖305篇文献讲述最新量子神经网络进展

专知会员服务

30+阅读 · 2022年6月21日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

综述：军事应用中使用的一些重要算法

综述：军事应用中使用的一些重要算法

专知

13+阅读 · 2022年7月3日

量子技术+军事？这篇最新53页pdf《量子技术在军事中的应用》万字综述论文阐述未来量子战争形态 (附中文版）

量子技术+军事？这篇最新53页pdf《量子技术在军事中的应用》万字综述论文阐述未来量子战争形态 (附中文版）

专知

35+阅读 · 2022年3月27日

谷歌ALBERT模型V2+中文版来了：之前刷新NLP各大基准，现在GitHub热榜第二

谷歌ALBERT模型V2+中文版来了：之前刷新NLP各大基准，现在GitHub热榜第二

量子位

14+阅读 · 2020年1月2日

【ICCV2019】中科院自动化所：AlignGAN-夜间行人重识别：通过联合像素和特征对齐解决跨模态行人重识别

【ICCV2019】中科院自动化所：AlignGAN-夜间行人重识别：通过联合像素和特征对齐解决跨模态行人重识别

专知

17+阅读 · 2019年10月29日

【泡泡图灵智库】基于CPU的实时6D物体姿态估计（arXiv）

【泡泡图灵智库】基于CPU的实时6D物体姿态估计（arXiv）

泡泡机器人SLAM

12+阅读 · 2019年1月26日

最新基于FPGA的深度学习加速器综述论文（附下载）

最新基于FPGA的深度学习加速器综述论文（附下载）

专知

23+阅读 · 2019年1月17日

【收藏】支持向量机原理详解+案例+代码！【点击阅读原文下载】

【收藏】支持向量机原理详解+案例+代码！【点击阅读原文下载】

机器学习算法与Python学习

10+阅读 · 2018年9月13日

超全总结：神经网络加速之量化模型 | 附带代码

超全总结：神经网络加速之量化模型 | 附带代码

PaperWeekly

12+阅读 · 2018年6月1日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

纳米尺度自旋电子器件参数化电路模型建立方法的研究

国家自然科学基金

0+阅读 · 2017年12月31日

超导量子比特器件的材料、工艺、设计探索

国家自然科学基金

1+阅读 · 2017年12月31日

量子相干性的度量及其在量子信息处理中的应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向数万处理器的有限元线性方程组与模态多级算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

神经形态多核处理器的架构模型研究

国家自然科学基金

3+阅读 · 2015年12月31日

低功耗数字化高集成度无线通信SoC芯片关键技术研究

国家自然科学基金

2+阅读 · 2014年12月31日

准粒子的量子控制及其在量子信息处理中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

噪声环境下腔量子电动力学量子计算与量子相干操控的理论研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于超导电路混合装置的量子信息处理的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于硅基微纳谐振腔的量子纠缠光频梳产生及传输问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

VQKV: High-Fidelity and High-Ratio Cache Compression via Vector-Quantization

Arxiv

0+阅读 · 3月17日

Multi-GPU Quantum Circuit Simulation and the Impact of Network Performance

Arxiv

0+阅读 · 3月11日

Simulation of a Heterogeneous Quantum Network

Arxiv

0+阅读 · 3月3日

Pareto Optimal Benchmarking of AI Models on ARM Cortex Processors for Sustainable Embedded Systems

Arxiv

0+阅读 · 2月20日

Superposed parameterised quantum circuits

Arxiv

0+阅读 · 2月16日

Reconfigurable Quantum Instruction Set Computers for High Performance Attainable on Hardware

Arxiv

0+阅读 · 2月14日

Bridging Classical and Quantum: Group-Theoretic Approach to Quantum Circuit Simulation

Arxiv

0+阅读 · 2月7日

Vector Quantization using Gaussian Variational Autoencoder

Arxiv

0+阅读 · 2月5日

Quantum Sequential Circuits

Arxiv

0+阅读 · 2月5日

Crypto-RV: High-Efficiency FPGA-Based RISC-V Cryptographic Co-Processor for IoT Security

Arxiv

0+阅读 · 2月4日

VIP会员

文章信息

相关主题

最新内容

【NTU博士论文】3D人体动作生成

【NTU博士论文】3D人体动作生成

专知会员服务

2+阅读 · 4月24日

DeepSeek-V4：百万 Token 上下文背后，大模型正在进入“长程智能”时代（附中英文pdf版）

DeepSeek-V4：百万 Token 上下文背后，大模型正在进入“长程智能”时代（附中英文pdf版）

专知会员服务

2+阅读 · 4月24日

以色列军事技术对美国军力发展的持续性赋能

以色列军事技术对美国军力发展的持续性赋能

专知会员服务

8+阅读 · 4月24日

战场之外的较量：美伊冲突中的认知战与心理博弈

战场之外的较量：美伊冲突中的认知战与心理博弈

专知会员服务

5+阅读 · 4月24日

俄乌战争中乌克兰防空能力演变与见解（中文版）

俄乌战争中乌克兰防空能力演变与见解（中文版）

专知会员服务

3+阅读 · 4月24日

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

专知会员服务

8+阅读 · 4月24日

《深度强化学习在兵棋推演中的应用》40页报告

《深度强化学习在兵棋推演中的应用》40页报告

专知会员服务

10+阅读 · 4月24日

《多域作战面临复杂现实》

《多域作战面临复杂现实》

专知会员服务

8+阅读 · 4月24日

《印度的多域作战：条令与能力发展》报告

《印度的多域作战：条令与能力发展》报告

专知会员服务

3+阅读 · 4月24日

《是“修复情报”还是修复部队？阿富汗反叛乱行动中的美军情报调整》400页

《是“修复情报”还是修复部队？阿富汗反叛乱行动中的美军情报调整》400页

专知会员服务

3+阅读 · 4月24日

美军的算法化军备库：无人机优势计划（DDP）、复制者倡议（Replicator）与联合全域指挥控制（JADC2）如何重写战争规则

美军的算法化军备库：无人机优势计划（DDP）、复制者倡议（Replicator）与联合全域指挥控制（JADC2）如何重写战争规则

专知会员服务

3+阅读 · 4月24日

（中文版）美空军部发布《空军部数据战略》与《人工智能战略》两份战略：旨在加速建立军事优势

（中文版）美空军部发布《空军部数据战略》与《人工智能战略》两份战略：旨在加速建立军事优势

专知会员服务

17+阅读 · 4月24日

【斯坦福博士论文】语言模型的机械可解释性与控制

【斯坦福博士论文】语言模型的机械可解释性与控制

专知会员服务

4+阅读 · 4月23日

大语言模型智能体长期记忆安全性综述：迈向记忆主权

大语言模型智能体长期记忆安全性综述：迈向记忆主权

专知会员服务

5+阅读 · 4月23日

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

专知会员服务

5+阅读 · 4月23日

相关VIP内容

CVPR 2026 Findings | 算力砍半、性能不降！全开源 A₁模型：让机器人大模型真正走向落地

CVPR 2026 Findings | 算力砍半、性能不降！全开源 A₁模型：让机器人大模型真正走向落地

专知会员服务

13+阅读 · 4月12日

军方将如何运用量子人工智能？量子人工智能可能在抵达战场前重塑军事规划

军方将如何运用量子人工智能？量子人工智能可能在抵达战场前重塑军事规划

专知会员服务

16+阅读 · 2月6日

《将量子技术整合至移动军事系统与战术作战中心框架》

《将量子技术整合至移动军事系统与战术作战中心框架》

专知会员服务

25+阅读 · 1月28日

量子增强计算机视觉：超越经典算法

量子增强计算机视觉：超越经典算法

专知会员服务

20+阅读 · 2025年10月9日

《量子与军事通信安全：量子计算在军事通信中的机遇、风险、实施挑战与前景分析》最新综述

《量子与军事通信安全：量子计算在军事通信中的机遇、风险、实施挑战与前景分析》最新综述

专知会员服务

28+阅读 · 2025年4月30日

《可重构智能表面和无人机辅助通信：深度强化学习方法》169页博士论文

《可重构智能表面和无人机辅助通信：深度强化学习方法》169页博士论文

专知会员服务

28+阅读 · 2025年1月12日

【新书】深度强化学习在可重构智能表面和无人机赋能智能6G通信中的应用

【新书】深度强化学习在可重构智能表面和无人机赋能智能6G通信中的应用

专知会员服务

27+阅读 · 2025年1月3日

Transformer它就是个支持向量机

Transformer它就是个支持向量机

专知会员服务

38+阅读 · 2023年9月7日

【剑桥大学博士论文】针对微控制器和应用级处理器的高效空间和时间安全性，192页pdf

【剑桥大学博士论文】针对微控制器和应用级处理器的高效空间和时间安全性，192页pdf

专知会员服务

17+阅读 · 2023年7月7日

什么是量子神经网络？陶大程等发布最新《量子生成学习模型》研究综述，30页pdf涵盖305篇文献讲述最新量子神经网络进展

什么是量子神经网络？陶大程等发布最新《量子生成学习模型》研究综述，30页pdf涵盖305篇文献讲述最新量子神经网络进展

专知会员服务

30+阅读 · 2022年6月21日

热门VIP内容

开通专知VIP会员享更多权益服务

DeepSeek-V4：百万 Token 上下文背后，大模型正在进入“长程智能”时代（附中英文pdf版）

战场之外的较量：美伊冲突中的认知战与心理博弈

【NTU博士论文】3D人体动作生成

以色列军事技术对美国军力发展的持续性赋能

相关资讯

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

综述：军事应用中使用的一些重要算法

综述：军事应用中使用的一些重要算法

专知

13+阅读 · 2022年7月3日

量子技术+军事？这篇最新53页pdf《量子技术在军事中的应用》万字综述论文阐述未来量子战争形态 (附中文版）

量子技术+军事？这篇最新53页pdf《量子技术在军事中的应用》万字综述论文阐述未来量子战争形态 (附中文版）

专知

35+阅读 · 2022年3月27日

谷歌ALBERT模型V2+中文版来了：之前刷新NLP各大基准，现在GitHub热榜第二

谷歌ALBERT模型V2+中文版来了：之前刷新NLP各大基准，现在GitHub热榜第二

量子位

14+阅读 · 2020年1月2日

【ICCV2019】中科院自动化所：AlignGAN-夜间行人重识别：通过联合像素和特征对齐解决跨模态行人重识别

【ICCV2019】中科院自动化所：AlignGAN-夜间行人重识别：通过联合像素和特征对齐解决跨模态行人重识别

专知

17+阅读 · 2019年10月29日

【泡泡图灵智库】基于CPU的实时6D物体姿态估计（arXiv）

【泡泡图灵智库】基于CPU的实时6D物体姿态估计（arXiv）

泡泡机器人SLAM

12+阅读 · 2019年1月26日

最新基于FPGA的深度学习加速器综述论文（附下载）

最新基于FPGA的深度学习加速器综述论文（附下载）

专知

23+阅读 · 2019年1月17日

【收藏】支持向量机原理详解+案例+代码！【点击阅读原文下载】

【收藏】支持向量机原理详解+案例+代码！【点击阅读原文下载】

机器学习算法与Python学习

10+阅读 · 2018年9月13日

超全总结：神经网络加速之量化模型 | 附带代码

超全总结：神经网络加速之量化模型 | 附带代码

PaperWeekly

12+阅读 · 2018年6月1日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

相关论文

VQKV: High-Fidelity and High-Ratio Cache Compression via Vector-Quantization

Arxiv

0+阅读 · 3月17日

Multi-GPU Quantum Circuit Simulation and the Impact of Network Performance

Arxiv

0+阅读 · 3月11日

Simulation of a Heterogeneous Quantum Network

Arxiv

0+阅读 · 3月3日

Pareto Optimal Benchmarking of AI Models on ARM Cortex Processors for Sustainable Embedded Systems

Arxiv

0+阅读 · 2月20日

Superposed parameterised quantum circuits

Arxiv

0+阅读 · 2月16日

Reconfigurable Quantum Instruction Set Computers for High Performance Attainable on Hardware

Arxiv

0+阅读 · 2月14日

Bridging Classical and Quantum: Group-Theoretic Approach to Quantum Circuit Simulation

Arxiv

0+阅读 · 2月7日

Vector Quantization using Gaussian Variational Autoencoder

Arxiv

0+阅读 · 2月5日

Quantum Sequential Circuits

Arxiv

0+阅读 · 2月5日

Crypto-RV: High-Efficiency FPGA-Based RISC-V Cryptographic Co-Processor for IoT Security

Arxiv

0+阅读 · 2月4日

相关基金

纳米尺度自旋电子器件参数化电路模型建立方法的研究

国家自然科学基金

0+阅读 · 2017年12月31日

超导量子比特器件的材料、工艺、设计探索

国家自然科学基金

1+阅读 · 2017年12月31日

量子相干性的度量及其在量子信息处理中的应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向数万处理器的有限元线性方程组与模态多级算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

神经形态多核处理器的架构模型研究

国家自然科学基金

3+阅读 · 2015年12月31日

低功耗数字化高集成度无线通信SoC芯片关键技术研究

国家自然科学基金

2+阅读 · 2014年12月31日

准粒子的量子控制及其在量子信息处理中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

噪声环境下腔量子电动力学量子计算与量子相干操控的理论研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于超导电路混合装置的量子信息处理的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于硅基微纳谐振腔的量子纠缠光频梳产生及传输问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员