EmbedPart: Embedding-Driven Graph Partitioning for Scalable Graph Neural Network Training - 专知论文

会员服务 ·

0

划分 · 嵌入 · GNN · 图划分 · 图结构 ·

EmbedPart: Embedding-Driven Graph Partitioning for Scalable Graph Neural Network Training

翻译：标题：EmbedPart：面向可扩展图神经网络训练的嵌入驱动图划分方法

Nikolai Merkel,Ruben Mayer,Volker Markl,Hans-Arno Jacobsen

Graph Neural Networks (GNNs) are widely used for learning on graph-structured data, but scaling GNN training to massive graphs remains challenging. To enable scalable distributed training, graphs are divided into smaller partitions that are distributed across multiple machines such that inter-machine communication is minimized and computational load is balanced. In practice, existing partitioning approaches face a fundamental trade-off between partitioning overhead and partitioning quality. We propose EmbedPart, an embedding-driven partitioning approach that achieves both speed and quality. Instead of operating directly on irregular graph structures, EmbedPart leverages node embeddings produced during the actual GNN training workload and clusters these dense embeddings to derive a partitioning. EmbedPart achieves more than 100x speedup over Metis while maintaining competitive partitioning quality and accelerating distributed GNN training. Moreover, EmbedPart naturally supports graph updates and fast repartitioning, and can be applied to graph reordering to improve data locality and accelerate single-machine GNN training. By shifting partitioning from irregular graph structures to dense embeddings, EmbedPart enables scalable and high-quality graph data optimization.

翻译：摘要：图神经网络（GNN）被广泛用于图结构数据的学习，但将GNN训练扩展到大规模图仍具有挑战性。为实现可扩展的分布式训练，需将图划分为更小的分区并分布到多台机器上，以最小化机器间通信并平衡计算负载。实际上，现有划分方法在划分开销与划分质量之间存在根本性权衡。我们提出EmbedPart，一种既保证速度又兼顾质量的嵌入驱动划分方法。与直接处理不规则图结构不同，EmbedPart利用实际GNN训练过程中生成的节点嵌入，并对这些稠密嵌入进行聚类以推导划分方案。EmbedPart在保持竞争性划分质量并加速分布式GNN训练的同时，相比Metis实现了超过100倍的加速比。此外，EmbedPart天然支持图更新与快速重划分，并可应用于图重排序以改善数据局部性，从而加速单机GNN训练。通过将划分从处理不规则图结构转变为处理稠密嵌入，EmbedPart实现了可扩展的高质量图数据优化。

0

相关内容

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

专知会员服务

41+阅读 · 2022年11月14日

【芝加博士论文】图表示学习，图上的深度生成模型，组等变分子神经网络和多分辨率机器学习

【芝加博士论文】图表示学习，图上的深度生成模型，组等变分子神经网络和多分辨率机器学习

专知会员服务

33+阅读 · 2022年11月5日

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

专知会员服务

53+阅读 · 2022年11月2日

【Google AI】鲁棒图神经网络，Robust Graph Neural Networks

【Google AI】鲁棒图神经网络，Robust Graph Neural Networks

专知会员服务

38+阅读 · 2022年3月9日

【图神经网络导论】Intro to Graph Neural Networks，176页ppt

【图神经网络导论】Intro to Graph Neural Networks，176页ppt

专知会员服务

129+阅读 · 2021年6月4日

【NeurIPS2020】点针图网络，Pointer Graph Networks

【NeurIPS2020】点针图网络，Pointer Graph Networks

专知会员服务

40+阅读 · 2020年9月27日

注意力图神经网络的小样本学习

注意力图神经网络的小样本学习

专知会员服务

192+阅读 · 2020年7月16日

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

专知会员服务

99+阅读 · 2020年7月3日

一份简短《图神经网络GNN》笔记，入门小册

一份简短《图神经网络GNN》笔记，入门小册

专知会员服务

226+阅读 · 2020年4月11日

【南洋理工大学课程】图神经网络，Graph Neural Networks，附121页PPT

【南洋理工大学课程】图神经网络，Graph Neural Networks，附121页PPT

专知会员服务

256+阅读 · 2019年11月9日

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知

17+阅读 · 2021年1月24日

【NeurIPS 2020】通过双向传播的可扩展图神经网络

【NeurIPS 2020】通过双向传播的可扩展图神经网络

专知

12+阅读 · 2020年11月3日

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

专知

20+阅读 · 2020年10月5日

【AAAI2020-清华大学】张量图卷积网络(TensorGCN)文本分类

【AAAI2020-清华大学】张量图卷积网络(TensorGCN)文本分类

专知

63+阅读 · 2020年1月20日

【论文笔记】具有可微分池化的分层图表示学习

【论文笔记】具有可微分池化的分层图表示学习

专知

47+阅读 · 2019年11月11日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

图神经网络火了？谈下它的普适性与局限性

图神经网络火了？谈下它的普适性与局限性

机器之心

22+阅读 · 2019年7月29日

入门学习 | 什么是图卷积网络？行为识别领域新星

入门学习 | 什么是图卷积网络？行为识别领域新星

AI100

18+阅读 · 2019年6月7日

掌握图神经网络GNN基本，看这篇文章就够了

掌握图神经网络GNN基本，看这篇文章就够了

新智元

164+阅读 · 2019年2月14日

面向图像网状结构体的蚁群分割算法

国家自然科学基金

0+阅读 · 2017年12月31日

面向特征提取的低秩与稀疏图嵌入理论与算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

分布无关的概率图模型结构学习方法的研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

肝脏磁共振图像分割的可计算变分模型

国家自然科学基金

0+阅读 · 2015年12月31日

任意网络中的可分数据处理研究

国家自然科学基金

0+阅读 · 2015年12月31日

图像分割中若干图论问题的研究

国家自然科学基金

0+阅读 · 2014年12月31日

信息科学中图与超图划分问题的随机近似算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于结构图论的一般图嵌入分布的研究

国家自然科学基金

4+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

Adaptive Node Feature Selection For Graph Neural Networks

Arxiv

0+阅读 · 5月1日

From Nodes to Narratives: Explaining Graph Neural Networks with LLMs and Graph Context

Arxiv

0+阅读 · 4月22日

Bounded Graph Clustering with Graph Neural Networks

Arxiv

0+阅读 · 4月20日

Incremental GNN Embedding Computation on Streaming Graphs

Arxiv

0+阅读 · 3月21日

Survey on Trustworthy Graph Neural Networks: From A Causal Perspective

Arxiv

10+阅读 · 2023年12月19日

A Survey on Privacy in Graph Neural Networks: Attacks, Preservation, and Applications

Arxiv

11+阅读 · 2023年8月31日

The Expressive Power of Graph Neural Networks: A Survey

Arxiv

10+阅读 · 2023年8月16日

Learning on Graphs with Out-of-Distribution Nodes

Arxiv

10+阅读 · 2023年8月13日

Adaptive Transfer Learning on Graph Neural Networks

Arxiv

14+阅读 · 2021年7月20日

Learning Discrete Structures for Graph Neural Networks

Arxiv

18+阅读 · 2019年3月28日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

1+阅读 · 今天15:02

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

1+阅读 · 今天15:00

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

2+阅读 · 今天14:30

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

2+阅读 · 今天14:05

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

2+阅读 · 今天13:55

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

2+阅读 · 今天13:51

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

2+阅读 · 今天13:48

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

7+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

20+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

专知会员服务

41+阅读 · 2022年11月14日

【芝加博士论文】图表示学习，图上的深度生成模型，组等变分子神经网络和多分辨率机器学习

【芝加博士论文】图表示学习，图上的深度生成模型，组等变分子神经网络和多分辨率机器学习

专知会员服务

33+阅读 · 2022年11月5日

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

专知会员服务

53+阅读 · 2022年11月2日

【Google AI】鲁棒图神经网络，Robust Graph Neural Networks

【Google AI】鲁棒图神经网络，Robust Graph Neural Networks

专知会员服务

38+阅读 · 2022年3月9日

【图神经网络导论】Intro to Graph Neural Networks，176页ppt

【图神经网络导论】Intro to Graph Neural Networks，176页ppt

专知会员服务

129+阅读 · 2021年6月4日

【NeurIPS2020】点针图网络，Pointer Graph Networks

【NeurIPS2020】点针图网络，Pointer Graph Networks

专知会员服务

40+阅读 · 2020年9月27日

注意力图神经网络的小样本学习

注意力图神经网络的小样本学习

专知会员服务

192+阅读 · 2020年7月16日

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

【KDD2020】图神经网络生成式预训练，GPT-GNN: Generative Pre-Training of Graph Neural Networks

专知会员服务

99+阅读 · 2020年7月3日

一份简短《图神经网络GNN》笔记，入门小册

一份简短《图神经网络GNN》笔记，入门小册

专知会员服务

226+阅读 · 2020年4月11日

【南洋理工大学课程】图神经网络，Graph Neural Networks，附121页PPT

【南洋理工大学课程】图神经网络，Graph Neural Networks，附121页PPT

专知会员服务

256+阅读 · 2019年11月9日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知

17+阅读 · 2021年1月24日

【NeurIPS 2020】通过双向传播的可扩展图神经网络

【NeurIPS 2020】通过双向传播的可扩展图神经网络

专知

12+阅读 · 2020年11月3日

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

专知

20+阅读 · 2020年10月5日

【AAAI2020-清华大学】张量图卷积网络(TensorGCN)文本分类

【AAAI2020-清华大学】张量图卷积网络(TensorGCN)文本分类

专知

63+阅读 · 2020年1月20日

【论文笔记】具有可微分池化的分层图表示学习

【论文笔记】具有可微分池化的分层图表示学习

专知

47+阅读 · 2019年11月11日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

图神经网络火了？谈下它的普适性与局限性

图神经网络火了？谈下它的普适性与局限性

机器之心

22+阅读 · 2019年7月29日

入门学习 | 什么是图卷积网络？行为识别领域新星

入门学习 | 什么是图卷积网络？行为识别领域新星

AI100

18+阅读 · 2019年6月7日

掌握图神经网络GNN基本，看这篇文章就够了

掌握图神经网络GNN基本，看这篇文章就够了

新智元

164+阅读 · 2019年2月14日

相关论文

Adaptive Node Feature Selection For Graph Neural Networks

Arxiv

0+阅读 · 5月1日

From Nodes to Narratives: Explaining Graph Neural Networks with LLMs and Graph Context

Arxiv

0+阅读 · 4月22日

Bounded Graph Clustering with Graph Neural Networks

Arxiv

0+阅读 · 4月20日

Incremental GNN Embedding Computation on Streaming Graphs

Arxiv

0+阅读 · 3月21日

Survey on Trustworthy Graph Neural Networks: From A Causal Perspective

Arxiv

10+阅读 · 2023年12月19日

A Survey on Privacy in Graph Neural Networks: Attacks, Preservation, and Applications

Arxiv

11+阅读 · 2023年8月31日

The Expressive Power of Graph Neural Networks: A Survey

Arxiv

10+阅读 · 2023年8月16日

Learning on Graphs with Out-of-Distribution Nodes

Arxiv

10+阅读 · 2023年8月13日

Adaptive Transfer Learning on Graph Neural Networks

Arxiv

14+阅读 · 2021年7月20日

Learning Discrete Structures for Graph Neural Networks

Arxiv

18+阅读 · 2019年3月28日

相关基金

面向图像网状结构体的蚁群分割算法

国家自然科学基金

0+阅读 · 2017年12月31日

面向特征提取的低秩与稀疏图嵌入理论与算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

分布无关的概率图模型结构学习方法的研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

肝脏磁共振图像分割的可计算变分模型

国家自然科学基金

0+阅读 · 2015年12月31日

任意网络中的可分数据处理研究

国家自然科学基金

0+阅读 · 2015年12月31日

图像分割中若干图论问题的研究

国家自然科学基金

0+阅读 · 2014年12月31日

信息科学中图与超图划分问题的随机近似算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于结构图论的一般图嵌入分布的研究

国家自然科学基金

4+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员