Communication Lower Bounds and Algorithms for Sketching with Random Dense Matrices - 专知论文

会员服务 ·

0

下界 · 算法 · 并行 · 近似 · 分布式内存 ·

Communication Lower Bounds and Algorithms for Sketching with Random Dense Matrices

翻译：使用随机稠密矩阵进行草图的通信下界与算法

Hussam Al Daas,Grey Ballard,Laura Grigori,Md Taufique Hussain,Suraj Kumar,Mohammad Marufur Rahman,Kathryn Rouse

Sketching is widely used in randomized linear algebra for low-rank matrix approximation, column subset selection, and many other problems, and it has gained significant traction in machine learning applications. However, sketching large matrices often necessitates distributed memory algorithms, where communication overhead becomes a critical bottleneck on modern supercomputing clusters. Despite its growing relevance, distributed-memory parallel strategies for sketching remain largely unexplored. In this work, we establish communication lower bounds for sketching using dense matrices that determine how much data movement is required to perform it in parallel. One important observation of our lower bounds is that no communication is required for a small number of processors. We show that our lower bounds are tight by presenting communication optimal algorithms. Furthermore, we extend our approach to determine communication lower bounds for computations of Nyström approximation where sketching is applied twice. We also introduce novel parallel algorithms whose communication costs are close to the lower bounds. Finally, we implement our algorithms on modern state-of-the-art supercomputing infrastructures which have both CPU- and GPU-equipped systems and demonstrate their parallel scalability.

翻译：草图（Sketching）广泛应用于随机线性代数中的低秩矩阵近似、列子集选择等多个问题，并在机器学习应用中获得了显著进展。然而，对大型矩阵进行草图通常需要分布式内存算法，此时通信开销成为现代超级计算集群中的关键瓶颈。尽管其重要性日益凸显，针对草图的分布式内存并行策略仍鲜有探索。本文针对使用稠密矩阵进行草图的问题，建立了通信下界，确定了在并行计算中所需的数据移动量。一个重要的观察结果是，对于少量处理器，无需通信。我们通过提出通信最优算法证明了该下界的紧致性。此外，我们将方法扩展至Nyström近似计算中需要两次草图的场景，建立了通信下界。我们同时引入了通信成本接近下界的新型并行算法。最终，我们在配备CPU和GPU的现代最先进超级计算基础设施上实现了所提算法，并展示了其并行可扩展性。

0

相关内容

【博士论文】利用图结构加速稀疏计算

【博士论文】利用图结构加速稀疏计算

专知会员服务

18+阅读 · 2025年3月6日

《大规模分布式图算法》综述

《大规模分布式图算法》综述

专知会员服务

28+阅读 · 2024年4月11日

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

专知会员服务

53+阅读 · 2022年11月2日

【经典书】随机矩阵理论与无线网络，186和pdf

【经典书】随机矩阵理论与无线网络，186和pdf

专知会员服务

52+阅读 · 2021年12月21日

挖掘图神经网络与矩阵分解之间的关系，56页ppt

专知会员服务

28+阅读 · 2021年9月4日

【硬核书】机器学习随机矩阵理论，472页pdf

专知会员服务

148+阅读 · 2021年8月12日

【论文推荐】Stochastic Graph Neural Networks，随机图神经网络

【论文推荐】Stochastic Graph Neural Networks，随机图神经网络

专知会员服务

69+阅读 · 2020年6月6日

【清华大学】图随机神经网络，Graph Random Neural Networks

【清华大学】图随机神经网络，Graph Random Neural Networks

专知会员服务

156+阅读 · 2020年5月26日

【图机器学习论文】图表示学习:方法与应用（Representation Learning on Graphs: Methods and Applications）

【图机器学习论文】图表示学习:方法与应用（Representation Learning on Graphs: Methods and Applications）

专知会员服务

147+阅读 · 2019年12月16日

Deep Learning for Graphs: Models and Applications，密歇根州立大学唐继良助理教授，CIPS ATT 16（2019）

Deep Learning for Graphs: Models and Applications，密歇根州立大学唐继良助理教授，CIPS ATT 16（2019）

专知会员服务

54+阅读 · 2019年10月25日

【TPAMI2022】「深度学习图像分割」最新综述论文，带你全面了解100个10大类深度图像分割算法

【TPAMI2022】「深度学习图像分割」最新综述论文，带你全面了解100个10大类深度图像分割算法

专知

10+阅读 · 2022年4月11日

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

专知

20+阅读 · 2020年10月5日

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

专知

38+阅读 · 2020年9月30日

图机器学习 2.2-2.4 Properties of Networks, Random Graph

图机器学习 2.2-2.4 Properties of Networks, Random Graph

图与推荐

10+阅读 · 2020年3月28日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

图论、图算法与图学习

图论、图算法与图学习

专知

29+阅读 · 2019年6月24日

图神经网络开发必备组件，NetworkX、稀疏矩阵、稀疏Tensor等

图神经网络开发必备组件，NetworkX、稀疏矩阵、稀疏Tensor等

专知

48+阅读 · 2019年5月10日

图分类：结合胶囊网络Capsule和图卷积GCN（附代码）

图分类：结合胶囊网络Capsule和图卷积GCN（附代码）

专知

149+阅读 · 2019年2月26日

图神经网络最近这么火，不妨看看我们精选的这七篇

图神经网络最近这么火，不妨看看我们精选的这七篇

人工智能前沿讲习班

37+阅读 · 2018年12月10日

【干货】理解深度学习中的矩阵运算

【干货】理解深度学习中的矩阵运算

专知

12+阅读 · 2018年2月12日

面向特征提取的低秩与稀疏图嵌入理论与算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于矩阵分解的图像表示方法及其应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于稀疏理论和图Laplacian矩阵的图像去噪理论与方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

求解一类大规模稀疏线性矩阵方程的高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

图的随机p-中心和中位问题的理论和算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

信息科学中图与超图划分问题的随机近似算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

超分辨率中的矩阵值算子学习问题

国家自然科学基金

1+阅读 · 2014年12月31日

矩阵分解问题的优化算法与理论

国家自然科学基金

8+阅读 · 2014年12月31日

基于超像素稀疏表示的图像超分辨率方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

随机方法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

Computationally Efficient Sparse Signal Recovery via Linear Sketching and Deep Unfolding

Arxiv

0+阅读 · 4月22日

Bipartite matching under communication constraints

Arxiv

0+阅读 · 4月12日

Communication-free Sampling and 4D Hybrid Parallelism for Scalable Mini-batch GNN Training

Arxiv

0+阅读 · 4月3日

Elastic Sketch under Random Stationary Streams: Limiting Behavior and Near-Optimal Configuration

Arxiv

0+阅读 · 3月26日

Communication-Efficient Approximate Gradient Coding

Arxiv

0+阅读 · 3月23日

Communication-Avoiding SpGEMM via Trident Partitioning on Hierarchical GPU Interconnects

Arxiv

0+阅读 · 3月22日

Vector sketch animation generation with differentiable motion trajectories

Arxiv

0+阅读 · 3月18日

SDGraph: Multi-Level Sketch Representation Learning by Sparse-Dense Graph Architecture

Arxiv

0+阅读 · 3月11日

Randomized Distributed Function Computation (RDFC): Ultra-Efficient Semantic Communication Applications to Privacy

Arxiv

0+阅读 · 3月10日

Fundamental Bias in Inverting Random Sampling Matrices with Application to Sub-sampled Newton

Arxiv

0+阅读 · 3月3日

VIP会员

文章信息

相关主题

分布式内存

最新内容

无人机自主控制与人工智能：系统性综述

无人机自主控制与人工智能：系统性综述

专知会员服务

8+阅读 · 今天7:25

巡飞弹与反无人机系统——现代战场的两大支柱

巡飞弹与反无人机系统——现代战场的两大支柱

专知会员服务

3+阅读 · 今天6:54

《打造“黄金舰队”》57页报告

《打造“黄金舰队”》57页报告

专知会员服务

2+阅读 · 今天6:52

《北约数字教官网络发展路径》128页报告

《北约数字教官网络发展路径》128页报告

专知会员服务

2+阅读 · 今天6:33

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

7+阅读 · 6月25日

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

6+阅读 · 6月25日

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

9+阅读 · 6月25日

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

7+阅读 · 6月25日

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

8+阅读 · 6月25日

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

8+阅读 · 6月25日

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

专知会员服务

10+阅读 · 6月25日

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

专知会员服务

9+阅读 · 6月25日

《国防领域敏感性分析白皮书》

《国防领域敏感性分析白皮书》

专知会员服务

9+阅读 · 6月25日

综述 | 从问答到任务完成：Agent系统与Harness设计

综述 | 从问答到任务完成：Agent系统与Harness设计

专知会员服务

10+阅读 · 6月24日

Agentic RL：框架、实践与长程智能体训练

Agentic RL：框架、实践与长程智能体训练

专知会员服务

10+阅读 · 6月24日

相关VIP内容

【博士论文】利用图结构加速稀疏计算

【博士论文】利用图结构加速稀疏计算

专知会员服务

18+阅读 · 2025年3月6日

《大规模分布式图算法》综述

《大规模分布式图算法》综述

专知会员服务

28+阅读 · 2024年4月11日

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

专知会员服务

53+阅读 · 2022年11月2日

【经典书】随机矩阵理论与无线网络，186和pdf

【经典书】随机矩阵理论与无线网络，186和pdf

专知会员服务

52+阅读 · 2021年12月21日

挖掘图神经网络与矩阵分解之间的关系，56页ppt

专知会员服务

28+阅读 · 2021年9月4日

【硬核书】机器学习随机矩阵理论，472页pdf

专知会员服务

148+阅读 · 2021年8月12日

【论文推荐】Stochastic Graph Neural Networks，随机图神经网络

【论文推荐】Stochastic Graph Neural Networks，随机图神经网络

专知会员服务

69+阅读 · 2020年6月6日

【清华大学】图随机神经网络，Graph Random Neural Networks

【清华大学】图随机神经网络，Graph Random Neural Networks

专知会员服务

156+阅读 · 2020年5月26日

【图机器学习论文】图表示学习:方法与应用（Representation Learning on Graphs: Methods and Applications）

【图机器学习论文】图表示学习:方法与应用（Representation Learning on Graphs: Methods and Applications）

专知会员服务

147+阅读 · 2019年12月16日

Deep Learning for Graphs: Models and Applications，密歇根州立大学唐继良助理教授，CIPS ATT 16（2019）

Deep Learning for Graphs: Models and Applications，密歇根州立大学唐继良助理教授，CIPS ATT 16（2019）

专知会员服务

54+阅读 · 2019年10月25日

热门VIP内容

开通专知VIP会员享更多权益服务

巡飞弹与反无人机系统——现代战场的两大支柱

《北约数字教官网络发展路径》128页报告

无人机自主控制与人工智能：系统性综述

《打造“黄金舰队”》57页报告

相关资讯

【TPAMI2022】「深度学习图像分割」最新综述论文，带你全面了解100个10大类深度图像分割算法

【TPAMI2022】「深度学习图像分割」最新综述论文，带你全面了解100个10大类深度图像分割算法

专知

10+阅读 · 2022年4月11日

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

专知

20+阅读 · 2020年10月5日

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

【NeurIPS2020-MIT】子图神经网络，Subgraph Neural Networks

专知

38+阅读 · 2020年9月30日

图机器学习 2.2-2.4 Properties of Networks, Random Graph

图机器学习 2.2-2.4 Properties of Networks, Random Graph

图与推荐

10+阅读 · 2020年3月28日

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

中山大学发布最新《图对抗机器学习》2020综述论文，带你全面了解40+种攻防对抗学习方法

专知

15+阅读 · 2020年3月13日

图论、图算法与图学习

图论、图算法与图学习

专知

29+阅读 · 2019年6月24日

图神经网络开发必备组件，NetworkX、稀疏矩阵、稀疏Tensor等

图神经网络开发必备组件，NetworkX、稀疏矩阵、稀疏Tensor等

专知

48+阅读 · 2019年5月10日

图分类：结合胶囊网络Capsule和图卷积GCN（附代码）

图分类：结合胶囊网络Capsule和图卷积GCN（附代码）

专知

149+阅读 · 2019年2月26日

图神经网络最近这么火，不妨看看我们精选的这七篇

图神经网络最近这么火，不妨看看我们精选的这七篇

人工智能前沿讲习班

37+阅读 · 2018年12月10日

【干货】理解深度学习中的矩阵运算

【干货】理解深度学习中的矩阵运算

专知

12+阅读 · 2018年2月12日

相关论文

Computationally Efficient Sparse Signal Recovery via Linear Sketching and Deep Unfolding

Arxiv

0+阅读 · 4月22日

Bipartite matching under communication constraints

Arxiv

0+阅读 · 4月12日

Communication-free Sampling and 4D Hybrid Parallelism for Scalable Mini-batch GNN Training

Arxiv

0+阅读 · 4月3日

Elastic Sketch under Random Stationary Streams: Limiting Behavior and Near-Optimal Configuration

Arxiv

0+阅读 · 3月26日

Communication-Efficient Approximate Gradient Coding

Arxiv

0+阅读 · 3月23日

Communication-Avoiding SpGEMM via Trident Partitioning on Hierarchical GPU Interconnects

Arxiv

0+阅读 · 3月22日

Vector sketch animation generation with differentiable motion trajectories

Arxiv

0+阅读 · 3月18日

SDGraph: Multi-Level Sketch Representation Learning by Sparse-Dense Graph Architecture

Arxiv

0+阅读 · 3月11日

Randomized Distributed Function Computation (RDFC): Ultra-Efficient Semantic Communication Applications to Privacy

Arxiv

0+阅读 · 3月10日

Fundamental Bias in Inverting Random Sampling Matrices with Application to Sub-sampled Newton

Arxiv

0+阅读 · 3月3日

相关基金

面向特征提取的低秩与稀疏图嵌入理论与算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于矩阵分解的图像表示方法及其应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于稀疏理论和图Laplacian矩阵的图像去噪理论与方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

求解一类大规模稀疏线性矩阵方程的高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

图的随机p-中心和中位问题的理论和算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

信息科学中图与超图划分问题的随机近似算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

超分辨率中的矩阵值算子学习问题

国家自然科学基金

1+阅读 · 2014年12月31日

矩阵分解问题的优化算法与理论

国家自然科学基金

8+阅读 · 2014年12月31日

基于超像素稀疏表示的图像超分辨率方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

随机方法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员