MPX: A Unified Systolic Array for Matrix and Polynomial Multiplication - 专知论文

会员服务 ·

0

阵列 · 矩阵乘法 · 设计 · 引擎 · 双模 ·

MPX: A Unified Systolic Array for Matrix and Polynomial Multiplication

翻译：MPX：一种支持矩阵乘法与多项式乘法的统一脉动阵列

George Alexakis,Dimitrios Schoinianakis,Giorgos Dimitrakopoulos

Polynomial multiplication is a fundamental kernel in Fully Homomorphic Encryption (FHE) and post-quantum cryptography (PQC) and is commonly accelerated through Number Theoretic Transforms (NTTs). To avoid the cost of designing dedicated cryptographic accelerators, recent efforts have mapped NTT computations onto existing systolic matrix engines, enabling the reuse of AI hardware for cryptographic workloads. In this work, we take the opposite approach. We observe that the wavefront dataflow of systolic arrays naturally aligns with the accumulation pattern of polynomial multiplication and leverage this correspondence to design MPX, a dual-mode systolic array that supports both matrix multiplication and direct polynomial multiplication within the same hardware fabric. Experimental results show that extending a conventional systolic array with this dual-mode capability requires only 20% additional area and introduces negligible power overhead during matrix-multiplication execution. In polynomial-multiplication mode, MPX achieves more than 1.2x lower latency compared to NTT-based polynomial multiplication on systolic matrix engines.

翻译：多项式乘法是全同态加密（FHE）和后量子密码学（PQC）中的基础核心计算，通常通过数论变换（NTT）加速。为规避专用密码加速器的设计成本，近期研究将NTT计算映射至现有脉动矩阵引擎，实现了AI硬件在密码学工作负载中的复用。本文采取相反思路：观察到脉动阵列的波前数据流与多项式乘法的累积模式天然契合，利用这一对应关系设计了MPX——一种在同一硬件架构内同时支持矩阵乘法与直接多项式乘法的双模脉动阵列。实验表明，为传统脉动阵列扩展该双模能力仅需20%的额外面积，且在矩阵乘法执行期间引入的功耗开销可忽略不计。在多项式乘法模式下，与基于NTT的脉动矩阵引擎多项式实现相比，MPX的延迟降低了1.2倍以上。

0

相关内容

【NeurIPS2023】MultiModN:多模态，多任务，可解释的模块化网络

【NeurIPS2023】MultiModN:多模态，多任务，可解释的模块化网络

专知会员服务

40+阅读 · 2023年9月27日

李宏毅老师讲解！《AlphaTensor: 用强化学习找出更有效率的矩阵相乘，附Slides与视频

李宏毅老师讲解！《AlphaTensor: 用强化学习找出更有效率的矩阵相乘，附Slides与视频

专知会员服务

42+阅读 · 2022年10月15日

牛津大学发布首篇《Transformer多模态学习》综述论文，23页pdf涵盖310篇文献全面阐述MMT的理论与应用

牛津大学发布首篇《Transformer多模态学习》综述论文，23页pdf涵盖310篇文献全面阐述MMT的理论与应用

专知会员服务

124+阅读 · 2022年6月15日

浙大最新《多目标跟踪MOT嵌入》方法研究进展综述，20页pdf涵盖314篇综述文献阐述最新方法与数据集

浙大最新《多目标跟踪MOT嵌入》方法研究进展综述，20页pdf涵盖314篇综述文献阐述最新方法与数据集

专知会员服务

24+阅读 · 2022年5月31日

【博士论文】基于冲量的加速优化算法

【博士论文】基于冲量的加速优化算法

专知会员服务

28+阅读 · 2021年11月29日

【ICML2021】矩阵乘法无需相乘，速度提升100倍：MIT大佬的新研究

专知会员服务

22+阅读 · 2021年9月3日

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

专知会员服务

37+阅读 · 2020年2月27日

【ML课程】多变量微积分（Multivariable Calculus），加州大学伯克利分校| Prof. Denis Auroux

【ML课程】多变量微积分（Multivariable Calculus），加州大学伯克利分校| Prof. Denis Auroux

专知会员服务

10+阅读 · 2020年1月7日

【论文推荐】数据科学中有关矩阵方法的文献综述：A LITERATURE SURVEY OF MATRIX METHODS FOR DATASCIENCE

【论文推荐】数据科学中有关矩阵方法的文献综述：A LITERATURE SURVEY OF MATRIX METHODS FOR DATASCIENCE

专知会员服务

25+阅读 · 2019年12月19日

【论文|CMU】用于多模序列学习的因数分解多模态变压器，Factorized Multimodal Transformer for Multimodal Sequential Learning

【论文|CMU】用于多模序列学习的因数分解多模态变压器，Factorized Multimodal Transformer for Multimodal Sequential Learning

专知会员服务

23+阅读 · 2019年11月26日

综述：军事应用中使用的一些重要算法

综述：军事应用中使用的一些重要算法

专知

13+阅读 · 2022年7月3日

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

专知

69+阅读 · 2022年4月9日

【GNN】MPNN：消息传递神经网络

【GNN】MPNN：消息传递神经网络

深度学习自然语言处理

17+阅读 · 2020年4月11日

一文读懂深度学习中的矩阵微积分，fast.ai创始人&ANTLR之父出品 | 免费资源

一文读懂深度学习中的矩阵微积分，fast.ai创始人&ANTLR之父出品 | 免费资源

量子位

17+阅读 · 2019年12月2日

斯坦福开放新书《应用线性代数导论：向量、矩阵和最小二乘法》473页pdf，带你入门线代

斯坦福开放新书《应用线性代数导论：向量、矩阵和最小二乘法》473页pdf，带你入门线代

专知

37+阅读 · 2019年11月30日

17种深度强化学习算法用Pytorch实现

17种深度强化学习算法用Pytorch实现

新智元

31+阅读 · 2019年9月16日

脉冲神经网络（SNN）概述

脉冲神经网络（SNN）概述

人工智能前沿讲习班

62+阅读 · 2019年5月30日

【干货】理解深度学习中的矩阵运算

【干货】理解深度学习中的矩阵运算

专知

12+阅读 · 2018年2月12日

最新｜深度离散哈希算法，可用于图像检索！

最新｜深度离散哈希算法，可用于图像检索！

全球人工智能

14+阅读 · 2017年12月15日

并行算法演进，从MapReduce到MPI

并行算法演进，从MapReduce到MPI

凡人机器学习

10+阅读 · 2017年11月5日

复杂系统中多密码算法密钥协同安全研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于双基系统的椭圆曲线标量乘算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

利用连续变量多组份纠缠态实现经典和量子算法

国家自然科学基金

0+阅读 · 2015年12月31日

基于异构体系结构的稀疏矩阵分解算法并行化研究

国家自然科学基金

1+阅读 · 2015年12月31日

结构矩阵计算的扰动理论与算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

柔性多体系统动力学仿真算法数值稳定性研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于矩阵半群的公钥密码体制研究

国家自然科学基金

0+阅读 · 2014年12月31日

函数空间、几何和Mahler测度

国家自然科学基金

0+阅读 · 2014年12月31日

求解非线性方程的加速迭代算法

国家自然科学基金

0+阅读 · 2014年12月31日

多元多项式环的Hermite性质与多项式矩阵的分解

国家自然科学基金

0+阅读 · 2014年12月31日

Quasi-linear Time Multiplication of Sparse Polynomials with Integer Coefficients

Arxiv

0+阅读 · 6月10日

WHET: Welding Homomorphic Encryption to Accelerator Architectures

Arxiv

0+阅读 · 6月10日

Kronecker products and iterated matrix multiplication

Arxiv

0+阅读 · 6月6日

Rectangular Matrix Multiplication in the Low-Bandwidth Model

Arxiv

0+阅读 · 6月3日

Fast Entropy Decoding for Sparse MVM on GPUs

Arxiv

0+阅读 · 6月2日

Efficient Matrix Product State Learning in Logarithmic Depth

Arxiv

0+阅读 · 5月20日

Decompose, Optimize, and Reconstruct: Very Large Constant Multiplication at Scale

Arxiv

0+阅读 · 5月18日

High-Rate Quantized Matrix Multiplication I

Arxiv

0+阅读 · 5月13日

Accelerating Locality-Driven Integration in Quantum Chemistry with Block-Structured Matrix Multiplication

Arxiv

0+阅读 · 5月11日

MERBIT: A GPU-Based SpMV Method for Iterative Workloads

Arxiv

0+阅读 · 5月8日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

3+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

4+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

9+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

8+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

4+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

7+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

6+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

9+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

4+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

6+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

7+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

6+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

5+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

相关VIP内容

【NeurIPS2023】MultiModN:多模态，多任务，可解释的模块化网络

【NeurIPS2023】MultiModN:多模态，多任务，可解释的模块化网络

专知会员服务

40+阅读 · 2023年9月27日

李宏毅老师讲解！《AlphaTensor: 用强化学习找出更有效率的矩阵相乘，附Slides与视频

李宏毅老师讲解！《AlphaTensor: 用强化学习找出更有效率的矩阵相乘，附Slides与视频

专知会员服务

42+阅读 · 2022年10月15日

牛津大学发布首篇《Transformer多模态学习》综述论文，23页pdf涵盖310篇文献全面阐述MMT的理论与应用

牛津大学发布首篇《Transformer多模态学习》综述论文，23页pdf涵盖310篇文献全面阐述MMT的理论与应用

专知会员服务

124+阅读 · 2022年6月15日

浙大最新《多目标跟踪MOT嵌入》方法研究进展综述，20页pdf涵盖314篇综述文献阐述最新方法与数据集

浙大最新《多目标跟踪MOT嵌入》方法研究进展综述，20页pdf涵盖314篇综述文献阐述最新方法与数据集

专知会员服务

24+阅读 · 2022年5月31日

【博士论文】基于冲量的加速优化算法

【博士论文】基于冲量的加速优化算法

专知会员服务

28+阅读 · 2021年11月29日

【ICML2021】矩阵乘法无需相乘，速度提升100倍：MIT大佬的新研究

专知会员服务

22+阅读 · 2021年9月3日

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

专知会员服务

37+阅读 · 2020年2月27日

【ML课程】多变量微积分（Multivariable Calculus），加州大学伯克利分校| Prof. Denis Auroux

【ML课程】多变量微积分（Multivariable Calculus），加州大学伯克利分校| Prof. Denis Auroux

专知会员服务

10+阅读 · 2020年1月7日

【论文推荐】数据科学中有关矩阵方法的文献综述：A LITERATURE SURVEY OF MATRIX METHODS FOR DATASCIENCE

【论文推荐】数据科学中有关矩阵方法的文献综述：A LITERATURE SURVEY OF MATRIX METHODS FOR DATASCIENCE

专知会员服务

25+阅读 · 2019年12月19日

【论文|CMU】用于多模序列学习的因数分解多模态变压器，Factorized Multimodal Transformer for Multimodal Sequential Learning

【论文|CMU】用于多模序列学习的因数分解多模态变压器，Factorized Multimodal Transformer for Multimodal Sequential Learning

专知会员服务

23+阅读 · 2019年11月26日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

综述：军事应用中使用的一些重要算法

综述：军事应用中使用的一些重要算法

专知

13+阅读 · 2022年7月3日

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

专知

69+阅读 · 2022年4月9日

【GNN】MPNN：消息传递神经网络

【GNN】MPNN：消息传递神经网络

深度学习自然语言处理

17+阅读 · 2020年4月11日

一文读懂深度学习中的矩阵微积分，fast.ai创始人&ANTLR之父出品 | 免费资源

一文读懂深度学习中的矩阵微积分，fast.ai创始人&ANTLR之父出品 | 免费资源

量子位

17+阅读 · 2019年12月2日

斯坦福开放新书《应用线性代数导论：向量、矩阵和最小二乘法》473页pdf，带你入门线代

斯坦福开放新书《应用线性代数导论：向量、矩阵和最小二乘法》473页pdf，带你入门线代

专知

37+阅读 · 2019年11月30日

17种深度强化学习算法用Pytorch实现

17种深度强化学习算法用Pytorch实现

新智元

31+阅读 · 2019年9月16日

脉冲神经网络（SNN）概述

脉冲神经网络（SNN）概述

人工智能前沿讲习班

62+阅读 · 2019年5月30日

【干货】理解深度学习中的矩阵运算

【干货】理解深度学习中的矩阵运算

专知

12+阅读 · 2018年2月12日

最新｜深度离散哈希算法，可用于图像检索！

最新｜深度离散哈希算法，可用于图像检索！

全球人工智能

14+阅读 · 2017年12月15日

并行算法演进，从MapReduce到MPI

并行算法演进，从MapReduce到MPI

凡人机器学习

10+阅读 · 2017年11月5日

相关论文

Quasi-linear Time Multiplication of Sparse Polynomials with Integer Coefficients

Arxiv

0+阅读 · 6月10日

WHET: Welding Homomorphic Encryption to Accelerator Architectures

Arxiv

0+阅读 · 6月10日

Kronecker products and iterated matrix multiplication

Arxiv

0+阅读 · 6月6日

Rectangular Matrix Multiplication in the Low-Bandwidth Model

Arxiv

0+阅读 · 6月3日

Fast Entropy Decoding for Sparse MVM on GPUs

Arxiv

0+阅读 · 6月2日

Efficient Matrix Product State Learning in Logarithmic Depth

Arxiv

0+阅读 · 5月20日

Decompose, Optimize, and Reconstruct: Very Large Constant Multiplication at Scale

Arxiv

0+阅读 · 5月18日

High-Rate Quantized Matrix Multiplication I

Arxiv

0+阅读 · 5月13日

Accelerating Locality-Driven Integration in Quantum Chemistry with Block-Structured Matrix Multiplication

Arxiv

0+阅读 · 5月11日

MERBIT: A GPU-Based SpMV Method for Iterative Workloads

Arxiv

0+阅读 · 5月8日

相关基金

复杂系统中多密码算法密钥协同安全研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于双基系统的椭圆曲线标量乘算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

利用连续变量多组份纠缠态实现经典和量子算法

国家自然科学基金

0+阅读 · 2015年12月31日

基于异构体系结构的稀疏矩阵分解算法并行化研究

国家自然科学基金

1+阅读 · 2015年12月31日

结构矩阵计算的扰动理论与算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

柔性多体系统动力学仿真算法数值稳定性研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于矩阵半群的公钥密码体制研究

国家自然科学基金

0+阅读 · 2014年12月31日

函数空间、几何和Mahler测度

国家自然科学基金

0+阅读 · 2014年12月31日

求解非线性方程的加速迭代算法

国家自然科学基金

0+阅读 · 2014年12月31日

多元多项式环的Hermite性质与多项式矩阵的分解

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员