Grappa: Gradient-Only Communication for Scalable Graph Neural Network Training - 专知论文

会员服务 ·

0

梯度 · GNN · 结构 · 精度 · 神经网络训练 ·

Grappa: Gradient-Only Communication for Scalable Graph Neural Network Training

翻译：Grappa：面向可扩展图神经网络训练的梯度专用通信框架

Chongyang Xu,Christoph Siebenbrunner,Laurent Bindschaedler

Cross-partition edges dominate the cost of distributed GNN training: fetching remote features and activations per iteration overwhelms the network as graphs deepen and partition counts grow. Grappa is a distributed GNN training framework that enforces gradient-only communication: during each iteration, partitions train in isolation and exchange only gradients for the global update. To recover accuracy lost to isolation, Grappa (i) periodically repartitions to expose new neighborhoods and (ii) applies a lightweight coverage-corrected gradient aggregation inspired by importance sampling. We prove the corrected estimator is asymptotically unbiased under standard support and boundedness assumptions, and we derive a batch-level variant for compatibility with common deep-learning packages that minimizes mean-squared deviation from the ideal node-level correction. We also introduce a shrinkage version that improves stability in practice. Empirical results on real and synthetic graphs show that Grappa trains GNNs 4 times faster on average (up to 13 times) than state-of-the-art systems, achieves better accuracy especially for deeper models, and sustains training at the trillion-edge scale on commodity hardware. Grappa is model-agnostic, supports full-graph and mini-batch training, and does not rely on high-bandwidth interconnects or caching.

翻译：跨分区边主导了分布式图神经网络（GNN）训练的成本：随着图结构加深和分区数量增加，每次迭代获取远程特征和激活值会使网络负载过重。Grappa 是一个分布式 GNN 训练框架，强制实施梯度专用通信机制：在每次迭代过程中，各分区独立进行训练，仅交换用于全局更新的梯度。为弥补因隔离训练造成的精度损失，Grappa 采用两种策略：（i）周期性重分区以暴露新的邻域结构；（ii）借鉴重要性采样思想，采用轻量级的覆盖校正梯度聚合方法。我们在标准支撑性和有界性假设下证明了校正估计量的渐近无偏性，并推导出批处理级变体以兼容主流深度学习框架，该变体通过最小化与理想节点级校正的均方偏差来实现优化。我们还引入了收缩版本以提升实际训练稳定性。在真实与合成图数据上的实验结果表明：Grappa 训练 GNN 的平均速度比现有先进系统快 4 倍（最高可达 13 倍），在深层模型中尤其能获得更优精度，并能在商用硬件上实现万亿边级别的持续训练。Grappa 具有模型无关性，支持全图训练与小批量训练，且不依赖高带宽互连或缓存机制。

0

相关内容

梯度的本意是一个向量（矢量），表示某一函数在该点处的方向导数沿着该方向取得最大值，即函数在该点处沿着该方向（此梯度的方向）变化最快，变化率最大（为该梯度的模）。

【KDD2023】GraphGLOW：面向图神经网络的通用和可泛化的结构学习

【KDD2023】GraphGLOW：面向图神经网络的通用和可泛化的结构学习

专知会员服务

30+阅读 · 2023年6月24日

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

专知会员服务

41+阅读 · 2022年11月14日

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

专知会员服务

53+阅读 · 2022年11月2日

1000层的GNN效果如何？ICML2021论述训练1000层的图神经网络大模型！

专知会员服务

37+阅读 · 2021年6月16日

【NeurIPS 2020】图神经网络GNN架构设计

【NeurIPS 2020】图神经网络GNN架构设计

专知会员服务

85+阅读 · 2020年11月19日

图神经网络架构，稳定性，可迁移性

专知会员服务

29+阅读 · 2020年8月8日

【清华大学】图随机神经网络，Graph Random Neural Networks

【清华大学】图随机神经网络，Graph Random Neural Networks

专知会员服务

156+阅读 · 2020年5月26日

一份简短《图神经网络GNN》笔记，入门小册

一份简短《图神经网络GNN》笔记，入门小册

专知会员服务

226+阅读 · 2020年4月11日

【普渡大学】提升GNN表达能力的集体学习框架，Boost GNN Expressiveness

【普渡大学】提升GNN表达能力的集体学习框架，Boost GNN Expressiveness

专知会员服务

46+阅读 · 2020年3月30日

【斯坦福大学NeuralPS2019】GNN解释器，GNNExplainer: Generating Explanations for Graph Neural Networks，斯坦福大学|Jure Leskovec

【斯坦福大学NeuralPS2019】GNN解释器，GNNExplainer: Generating Explanations for Graph Neural Networks，斯坦福大学|Jure Leskovec

专知会员服务

89+阅读 · 2019年10月13日

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

专知

20+阅读 · 2020年10月5日

Tensorflow GNN最佳实践：tf_geometric（附图自编码器GAE完整代码）

Tensorflow GNN最佳实践：tf_geometric（附图自编码器GAE完整代码）

图与推荐

130+阅读 · 2020年2月6日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

图神经网络火了？谈下它的普适性与局限性

图神经网络火了？谈下它的普适性与局限性

机器之心

22+阅读 · 2019年7月29日

Graph Neural Network（GNN）最全资源整理分享

Graph Neural Network（GNN）最全资源整理分享

深度学习与NLP

339+阅读 · 2019年7月9日

【学界】基于GNN，强于GNN：胶囊图神经网络的PyTorch实现 | ICLR 2019

【学界】基于GNN，强于GNN：胶囊图神经网络的PyTorch实现 | ICLR 2019

GAN生成式对抗网络

31+阅读 · 2019年3月26日

Github热门图深度学习（GraphDL）源码与框架

Github热门图深度学习（GraphDL）源码与框架

新智元

21+阅读 · 2019年3月19日

Github上热门图深度学习（GraphDL）源码与工业级框架

Github上热门图深度学习（GraphDL）源码与工业级框架

专知

15+阅读 · 2019年3月15日

掌握图神经网络GNN基本，看这篇文章就够了

掌握图神经网络GNN基本，看这篇文章就够了

新智元

164+阅读 · 2019年2月14日

面向图像网状结构体的蚁群分割算法

国家自然科学基金

0+阅读 · 2017年12月31日

基于核与核度理论的在线社交网络拓扑结构研究

国家自然科学基金

1+阅读 · 2016年12月31日

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

神经干细胞复合功能化注射型胶原支架用于脊髓损伤的修复及实时监测

国家自然科学基金

0+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

任意网络中的可分数据处理研究

国家自然科学基金

0+阅读 · 2015年12月31日

Ghrelin整合调控神经血管单元网络抑制脑缺血再灌注损伤并促进神经修复

国家自然科学基金

0+阅读 · 2014年12月31日

时间-空间可控生物活性分子释放的胶原支架用于脊髓损伤神经网络重建的研究

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

TopoEdge: Topology-Grounded Agentic Framework for Edge Networking Code Generation and Repair

Arxiv

0+阅读 · 2月28日

GraphOmni: A Comprehensive and Extensible Benchmark Framework for Large Language Models on Graph-theoretic Tasks

Arxiv

0+阅读 · 2月22日

Revisiting Graph Neural Networks for Graph-level Tasks: Taxonomy, Empirical Study, and Future Directions

Arxiv

0+阅读 · 2月22日

Unifying approach to uniform expressivity of graph neural networks

Arxiv

0+阅读 · 2月20日

Grappa: Gradient-Only Communication for Scalable Graph Neural Network Training

Arxiv

0+阅读 · 2月16日

GraphFM: A generalist graph transformer that learns transferable representations across diverse domains

Arxiv

0+阅读 · 2月14日

Batch-CAM: Introduction to better reasoning in convolutional deep learning models

Arxiv

0+阅读 · 2月13日

Efficient Graph Knowledge Distillation from GNNs to Kolmogorov--Arnold Networks via Self-Attention Dynamic Sampling

Arxiv

0+阅读 · 2月9日

LogicXGNN: Grounded Logical Rules for Explaining Graph Neural Networks

Arxiv

0+阅读 · 2月8日

BitLogic: Training Framework for Gradient-Based FPGA-Native Neural Networks

Arxiv

0+阅读 · 2月7日

VIP会员

文章信息

相关主题

神经网络训练

最新内容

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

0+阅读 · 3分钟前

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

0+阅读 · 5分钟前

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

11+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

4+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

7+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

8+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

11+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

12+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

8+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

21+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

10+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

6+阅读 · 6月17日

相关VIP内容

【KDD2023】GraphGLOW：面向图神经网络的通用和可泛化的结构学习

【KDD2023】GraphGLOW：面向图神经网络的通用和可泛化的结构学习

专知会员服务

30+阅读 · 2023年6月24日

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

专知会员服务

41+阅读 · 2022年11月14日

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

专知会员服务

53+阅读 · 2022年11月2日

1000层的GNN效果如何？ICML2021论述训练1000层的图神经网络大模型！

专知会员服务

37+阅读 · 2021年6月16日

【NeurIPS 2020】图神经网络GNN架构设计

【NeurIPS 2020】图神经网络GNN架构设计

专知会员服务

85+阅读 · 2020年11月19日

图神经网络架构，稳定性，可迁移性

专知会员服务

29+阅读 · 2020年8月8日

【清华大学】图随机神经网络，Graph Random Neural Networks

【清华大学】图随机神经网络，Graph Random Neural Networks

专知会员服务

156+阅读 · 2020年5月26日

一份简短《图神经网络GNN》笔记，入门小册

一份简短《图神经网络GNN》笔记，入门小册

专知会员服务

226+阅读 · 2020年4月11日

【普渡大学】提升GNN表达能力的集体学习框架，Boost GNN Expressiveness

【普渡大学】提升GNN表达能力的集体学习框架，Boost GNN Expressiveness

专知会员服务

46+阅读 · 2020年3月30日

【斯坦福大学NeuralPS2019】GNN解释器，GNNExplainer: Generating Explanations for Graph Neural Networks，斯坦福大学|Jure Leskovec

【斯坦福大学NeuralPS2019】GNN解释器，GNNExplainer: Generating Explanations for Graph Neural Networks，斯坦福大学|Jure Leskovec

专知会员服务

89+阅读 · 2019年10月13日

热门VIP内容

开通专知VIP会员享更多权益服务

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

相关资讯

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

专知

20+阅读 · 2020年10月5日

Tensorflow GNN最佳实践：tf_geometric（附图自编码器GAE完整代码）

Tensorflow GNN最佳实践：tf_geometric（附图自编码器GAE完整代码）

图与推荐

130+阅读 · 2020年2月6日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

图神经网络火了？谈下它的普适性与局限性

图神经网络火了？谈下它的普适性与局限性

机器之心

22+阅读 · 2019年7月29日

Graph Neural Network（GNN）最全资源整理分享

Graph Neural Network（GNN）最全资源整理分享

深度学习与NLP

339+阅读 · 2019年7月9日

【学界】基于GNN，强于GNN：胶囊图神经网络的PyTorch实现 | ICLR 2019

【学界】基于GNN，强于GNN：胶囊图神经网络的PyTorch实现 | ICLR 2019

GAN生成式对抗网络

31+阅读 · 2019年3月26日

Github热门图深度学习（GraphDL）源码与框架

Github热门图深度学习（GraphDL）源码与框架

新智元

21+阅读 · 2019年3月19日

Github上热门图深度学习（GraphDL）源码与工业级框架

Github上热门图深度学习（GraphDL）源码与工业级框架

专知

15+阅读 · 2019年3月15日

掌握图神经网络GNN基本，看这篇文章就够了

掌握图神经网络GNN基本，看这篇文章就够了

新智元

164+阅读 · 2019年2月14日

相关论文

TopoEdge: Topology-Grounded Agentic Framework for Edge Networking Code Generation and Repair

Arxiv

0+阅读 · 2月28日

GraphOmni: A Comprehensive and Extensible Benchmark Framework for Large Language Models on Graph-theoretic Tasks

Arxiv

0+阅读 · 2月22日

Revisiting Graph Neural Networks for Graph-level Tasks: Taxonomy, Empirical Study, and Future Directions

Arxiv

0+阅读 · 2月22日

Unifying approach to uniform expressivity of graph neural networks

Arxiv

0+阅读 · 2月20日

Grappa: Gradient-Only Communication for Scalable Graph Neural Network Training

Arxiv

0+阅读 · 2月16日

GraphFM: A generalist graph transformer that learns transferable representations across diverse domains

Arxiv

0+阅读 · 2月14日

Batch-CAM: Introduction to better reasoning in convolutional deep learning models

Arxiv

0+阅读 · 2月13日

Efficient Graph Knowledge Distillation from GNNs to Kolmogorov--Arnold Networks via Self-Attention Dynamic Sampling

Arxiv

0+阅读 · 2月9日

LogicXGNN: Grounded Logical Rules for Explaining Graph Neural Networks

Arxiv

0+阅读 · 2月8日

BitLogic: Training Framework for Gradient-Based FPGA-Native Neural Networks

Arxiv

0+阅读 · 2月7日

相关基金

面向图像网状结构体的蚁群分割算法

国家自然科学基金

0+阅读 · 2017年12月31日

基于核与核度理论的在线社交网络拓扑结构研究

国家自然科学基金

1+阅读 · 2016年12月31日

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

神经干细胞复合功能化注射型胶原支架用于脊髓损伤的修复及实时监测

国家自然科学基金

0+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

任意网络中的可分数据处理研究

国家自然科学基金

0+阅读 · 2015年12月31日

Ghrelin整合调控神经血管单元网络抑制脑缺血再灌注损伤并促进神经修复

国家自然科学基金

0+阅读 · 2014年12月31日

时间-空间可控生物活性分子释放的胶原支架用于脊髓损伤神经网络重建的研究

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员