Communication-free Sampling and 4D Hybrid Parallelism for Scalable Mini-batch GNN Training - 专知论文

会员服务 ·

0

Communication-free Sampling and 4D Hybrid Parallelism for Scalable Mini-batch GNN Training

翻译：无通信采样与4D混合并行实现可扩展的小批量GNN训练

Cunyang Wei,Siddharth Singh,Aishwarya Sarkar,Daniel Nichols,Tisha Patel,Aditya K. Ranjan,Sayan Ghosh,Ali Jannesari,Nathan R. Tallent,Abhinav Bhatele

Graph neural networks (GNNs) are widely used for learning on graph datasets derived from various real-world scenarios. Learning from extremely large graphs requires distributed training, and mini-batching with sampling is a popular approach for parallelizing GNN training. Existing distributed mini-batch approaches have significant performance bottlenecks due to expensive sampling methods and limited scaling when using data parallelism. In this work, we present ScaleGNN, a 4D parallel framework for scalable mini-batch GNN training that combines communication-free distributed sampling, 3D parallel matrix multiplication (PMM), and data parallelism. ScaleGNN introduces a uniform vertex sampling algorithm, enabling each process (GPU device) to construct its local mini-batch, i.e., subgraph partitions without any inter-process communication. 3D PMM enables scaling mini-batch training to much larger GPU counts than vanilla data parallelism with significantly lower communication overheads. We also present additional optimizations to overlap sampling with training, reduce communication overhead by sending data in lower precision, kernel fusion, and communication-computation overlap. We evaluate ScaleGNN on five graph datasets and demonstrate strong scaling up to 2048 GPUs on Perlmutter, 2048 GCDs on Frontier, and 1024 GPUs on Tuolumne. On Perlmutter, ScaleGNN achieves 3.5x end-to-end training speedup over the SOTA baseline on ogbn-products.

翻译：图神经网络（GNN）被广泛用于从各种现实场景中提取的图数据集上进行学习。针对超大规模图的学习需要分布式训练，而结合采样的小批量方法常被用于并行化GNN训练。现有分布式小批量方法因昂贵的采样技术以及数据并行下的有限扩展性，存在显著性能瓶颈。本文提出ScaleGNN——一种面向可扩展小批量GNN训练的4D并行框架，该框架融合了无通信分布式采样、3D并行矩阵乘法（PMM）与数据并行。ScaleGNN引入均匀顶点采样算法，使得每个进程（GPU设备）能够在无需任何进程间通信的情况下构建本地小批量（即子图分区）。3D PMM可使小批量训练扩展到远高于普通数据并行所能支持的GPU数量，同时显著降低通信开销。我们还提出了额外优化措施，包括将采样与训练重叠、通过低精度数据发送降低通信开销、内核融合以及通信-计算重叠。我们在五个图数据集上评估了ScaleGNN，并在Perlmutter上实现至多2048个GPU、Frontier上2048个GCD以及Tuolumne上1024个GPU的强扩展。在Perlmutter上，ScaleGNN相较于ogbn-products数据集上的SOTA基线实现了3.5倍的端到端训练加速。

0

相关内容

GNN如何处理表格？NCKU等最新《图神经网络表格数据学习》综述，详述其技术体系和方向

GNN如何处理表格？NCKU等最新《图神经网络表格数据学习》综述，详述其技术体系和方向

专知会员服务

37+阅读 · 2024年1月6日

什么是好的GNN表达？国防科大最新《图神经网络的表达能力》综述

什么是好的GNN表达？国防科大最新《图神经网络的表达能力》综述

专知会员服务

40+阅读 · 2023年8月20日

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

专知会员服务

41+阅读 · 2022年11月14日

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

专知会员服务

53+阅读 · 2022年11月2日

GNN如何可解释？悉尼科大最新《可解释图神经网络研究》综述，全面阐述可解释GNN的方法与评价指标

GNN如何可解释？悉尼科大最新《可解释图神经网络研究》综述，全面阐述可解释GNN的方法与评价指标

专知会员服务

112+阅读 · 2022年7月28日

GNN+IoT=？弗吉尼亚大学最新《图神经网络与物联网》综述论文，45页pdf全面阐述GNN在IoT中的进展，包括算法与代码数据

GNN+IoT=？弗吉尼亚大学最新《图神经网络与物联网》综述论文，45页pdf全面阐述GNN在IoT中的进展，包括算法与代码数据

专知会员服务

61+阅读 · 2022年4月2日

1000层的GNN效果如何？ICML2021论述训练1000层的图神经网络大模型！

专知会员服务

37+阅读 · 2021年6月16日

到底什么是GNN？《图神经网络理论基础》这份DeepMind大牛Petar讲授，附96页ppt与视频

到底什么是GNN？《图神经网络理论基础》这份DeepMind大牛Petar讲授，附96页ppt与视频

专知会员服务

87+阅读 · 2021年2月26日

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

专知会员服务

99+阅读 · 2020年7月3日

一份简短《图神经网络GNN》笔记，入门小册

一份简短《图神经网络GNN》笔记，入门小册

专知会员服务

226+阅读 · 2020年4月11日

2022最新！3篇GNN领域综述！

2022最新！3篇GNN领域综述！

图与推荐

11+阅读 · 2022年2月18日

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

专知

20+阅读 · 2020年10月5日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

17+阅读 · 2020年6月7日

深入浅出「图神经网络GNN」的原理、应用以及前景 (附赠GNN新书鼠年春节福利)

深入浅出「图神经网络GNN」的原理、应用以及前景 (附赠GNN新书鼠年春节福利)

专知

65+阅读 · 2020年1月17日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

Graph Neural Network（GNN）最全资源整理分享

Graph Neural Network（GNN）最全资源整理分享

深度学习与NLP

339+阅读 · 2019年7月9日

【荟萃】图神经网络论文列表，包含GNN理论及其在NLP和CV等领域的应用

【荟萃】图神经网络论文列表，包含GNN理论及其在NLP和CV等领域的应用

专知

45+阅读 · 2019年3月26日

掌握图神经网络GNN基本，看这篇文章就够了

掌握图神经网络GNN基本，看这篇文章就够了

新智元

164+阅读 · 2019年2月14日

清华NLP组图深度学习推荐，146篇必读GNN最新论文

清华NLP组图深度学习推荐，146篇必读GNN最新论文

中国人工智能学会

28+阅读 · 2018年12月29日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

云计算环境下面向大数据的在线聚集并行优化机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于微型批量采样的分布式多智能个体网络协同优化算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

极限学习机拓展研究及其在近红外光谱分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

基于分布式∑/△与扩展量化的红外焦平面阵列像素级/列级混合式模数转换方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

Scalable Hyperparameter-Divergent Ensemble Training with Automatic Learning Rate Exploration for Large Models

Arxiv

0+阅读 · 4月27日

Sampling Transferable Graph Neural Networks with Limited Graph Information

Arxiv

0+阅读 · 4月16日

FIT-GNN: Faster Inference Time for GNNs that 'FIT' in Memory Using Coarsening

Arxiv

0+阅读 · 4月10日

EmbedPart: Embedding-Driven Graph Partitioning for Scalable Graph Neural Network Training

Arxiv

0+阅读 · 4月1日

LSM-GNN: Large-scale Storage-based Multi-GPU GNN Training by Optimizing Data Transfer Scheme

Arxiv

0+阅读 · 3月28日

Morphling: Fast, Fused, and Flexible GNN Training at Scale

Arxiv

0+阅读 · 3月26日

Incremental GNN Embedding Computation on Streaming Graphs

Arxiv

0+阅读 · 3月21日

Rudder: Steering Prefetching in Distributed GNN Training using LLM Agents

Arxiv

0+阅读 · 2月26日

The Expressive Power of Graph Neural Networks: A Survey

Arxiv

10+阅读 · 2023年8月16日

A Collective Learning Framework to Boost GNN Expressiveness

A Collective Learning Framework to Boost GNN Expressiveness

Arxiv

20+阅读 · 2020年3月26日

VIP会员

文章信息

相关主题

最新内容

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

5+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

2+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

2+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

13+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

12+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

12+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

8+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

13+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

9+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

22+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

11+阅读 · 6月17日

相关VIP内容

GNN如何处理表格？NCKU等最新《图神经网络表格数据学习》综述，详述其技术体系和方向

GNN如何处理表格？NCKU等最新《图神经网络表格数据学习》综述，详述其技术体系和方向

专知会员服务

37+阅读 · 2024年1月6日

什么是好的GNN表达？国防科大最新《图神经网络的表达能力》综述

什么是好的GNN表达？国防科大最新《图神经网络的表达能力》综述

专知会员服务

40+阅读 · 2023年8月20日

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

专知会员服务

41+阅读 · 2022年11月14日

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

专知会员服务

53+阅读 · 2022年11月2日

GNN如何可解释？悉尼科大最新《可解释图神经网络研究》综述，全面阐述可解释GNN的方法与评价指标

GNN如何可解释？悉尼科大最新《可解释图神经网络研究》综述，全面阐述可解释GNN的方法与评价指标

专知会员服务

112+阅读 · 2022年7月28日

GNN+IoT=？弗吉尼亚大学最新《图神经网络与物联网》综述论文，45页pdf全面阐述GNN在IoT中的进展，包括算法与代码数据

GNN+IoT=？弗吉尼亚大学最新《图神经网络与物联网》综述论文，45页pdf全面阐述GNN在IoT中的进展，包括算法与代码数据

专知会员服务

61+阅读 · 2022年4月2日

1000层的GNN效果如何？ICML2021论述训练1000层的图神经网络大模型！

专知会员服务

37+阅读 · 2021年6月16日

到底什么是GNN？《图神经网络理论基础》这份DeepMind大牛Petar讲授，附96页ppt与视频

到底什么是GNN？《图神经网络理论基础》这份DeepMind大牛Petar讲授，附96页ppt与视频

专知会员服务

87+阅读 · 2021年2月26日

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

专知会员服务

99+阅读 · 2020年7月3日

一份简短《图神经网络GNN》笔记，入门小册

一份简短《图神经网络GNN》笔记，入门小册

专知会员服务

226+阅读 · 2020年4月11日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

美国从乌克兰无人机战争中学习经验

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

相关资讯

2022最新！3篇GNN领域综述！

2022最新！3篇GNN领域综述！

图与推荐

11+阅读 · 2022年2月18日

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

专知

20+阅读 · 2020年10月5日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

17+阅读 · 2020年6月7日

深入浅出「图神经网络GNN」的原理、应用以及前景 (附赠GNN新书鼠年春节福利)

深入浅出「图神经网络GNN」的原理、应用以及前景 (附赠GNN新书鼠年春节福利)

专知

65+阅读 · 2020年1月17日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

Graph Neural Network（GNN）最全资源整理分享

Graph Neural Network（GNN）最全资源整理分享

深度学习与NLP

339+阅读 · 2019年7月9日

【荟萃】图神经网络论文列表，包含GNN理论及其在NLP和CV等领域的应用

【荟萃】图神经网络论文列表，包含GNN理论及其在NLP和CV等领域的应用

专知

45+阅读 · 2019年3月26日

掌握图神经网络GNN基本，看这篇文章就够了

掌握图神经网络GNN基本，看这篇文章就够了

新智元

164+阅读 · 2019年2月14日

清华NLP组图深度学习推荐，146篇必读GNN最新论文

清华NLP组图深度学习推荐，146篇必读GNN最新论文

中国人工智能学会

28+阅读 · 2018年12月29日

相关论文

Scalable Hyperparameter-Divergent Ensemble Training with Automatic Learning Rate Exploration for Large Models

Arxiv

0+阅读 · 4月27日

Sampling Transferable Graph Neural Networks with Limited Graph Information

Arxiv

0+阅读 · 4月16日

FIT-GNN: Faster Inference Time for GNNs that 'FIT' in Memory Using Coarsening

Arxiv

0+阅读 · 4月10日

EmbedPart: Embedding-Driven Graph Partitioning for Scalable Graph Neural Network Training

Arxiv

0+阅读 · 4月1日

LSM-GNN: Large-scale Storage-based Multi-GPU GNN Training by Optimizing Data Transfer Scheme

Arxiv

0+阅读 · 3月28日

Morphling: Fast, Fused, and Flexible GNN Training at Scale

Arxiv

0+阅读 · 3月26日

Incremental GNN Embedding Computation on Streaming Graphs

Arxiv

0+阅读 · 3月21日

Rudder: Steering Prefetching in Distributed GNN Training using LLM Agents

Arxiv

0+阅读 · 2月26日

The Expressive Power of Graph Neural Networks: A Survey

Arxiv

10+阅读 · 2023年8月16日

A Collective Learning Framework to Boost GNN Expressiveness

A Collective Learning Framework to Boost GNN Expressiveness

Arxiv

20+阅读 · 2020年3月26日

相关基金

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

云计算环境下面向大数据的在线聚集并行优化机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于微型批量采样的分布式多智能个体网络协同优化算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

极限学习机拓展研究及其在近红外光谱分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

基于分布式∑/△与扩展量化的红外焦平面阵列像素级/列级混合式模数转换方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员