Grappa: Gradient-Only Communication for Scalable Graph Neural Network Training - 专知论文

会员服务 ·

0

梯度 · GNN · 结构 · 精度 · 神经网络训练 ·

Grappa: Gradient-Only Communication for Scalable Graph Neural Network Training

翻译：Grappa：面向可扩展图神经网络训练的纯梯度通信框架

Chongyang Xu,Christoph Siebenbrunner,Laurent Bindschaedler

Cross-partition edges dominate the cost of distributed GNN training: fetching remote features and activations per iteration overwhelms the network as graphs deepen and partition counts grow. Grappa is a distributed GNN training framework that enforces gradient-only communication: during each iteration, partitions train in isolation and exchange only gradients for the global update. To recover accuracy lost to isolation, Grappa (i) periodically repartitions to expose new neighborhoods and (ii) applies a lightweight coverage-corrected gradient aggregation inspired by importance sampling. We present an asymptotically unbiased estimator for gradient correction, which we use to develop a minimum-distance batch-level variant that is compatible with common deep-learning packages. We also introduce a shrinkage version that improves stability in practice. Empirical results on real and synthetic graphs show that Grappa trains GNNs 4x faster on average (up to 13x) than state-of-the-art systems, achieves better accuracy especially for deeper models, and sustains training at the trillion-edge scale on commodity hardware. Grappa is model-agnostic, supports full-graph and mini-batch training, and does not rely on high-bandwidth interconnects or caching.

翻译：跨分区边主导了分布式图神经网络（GNN）训练的成本：随着图结构加深和分区数量增加，每轮迭代中获取远程特征和激活值的操作会使网络负载过载。Grappa 是一个分布式 GNN 训练框架，其强制采用纯梯度通信机制：在每轮迭代中，各分区独立进行训练，仅交换用于全局更新的梯度。为弥补因隔离训练造成的精度损失，Grappa 采用两种策略：（i）周期性重分区以暴露新的邻域结构；（ii）基于重要性采样思想，采用轻量级的覆盖校正梯度聚合方法。我们提出了一种渐近无偏的梯度校正估计器，并基于此开发了与常见深度学习框架兼容的最小距离批处理级变体。同时，我们还引入了收缩版本以提升实际训练稳定性。在真实与合成图数据上的实验结果表明，Grappa 训练 GNN 的平均速度比现有先进系统快 4 倍（最高可达 13 倍），在深层模型中尤其能获得更优的精度，并能在商用硬件上支持万亿边规模的持续训练。Grappa 具备模型无关性，支持全图训练与小批量训练，且不依赖高带宽互连或缓存机制。

0

相关内容

梯度的本意是一个向量（矢量），表示某一函数在该点处的方向导数沿着该方向取得最大值，即函数在该点处沿着该方向（此梯度的方向）变化最快，变化率最大（为该梯度的模）。

【KDD2023】GraphGLOW：面向图神经网络的通用和可泛化的结构学习

【KDD2023】GraphGLOW：面向图神经网络的通用和可泛化的结构学习

专知会员服务

30+阅读 · 2023年6月24日

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

专知会员服务

41+阅读 · 2022年11月14日

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

专知会员服务

53+阅读 · 2022年11月2日

1000层的GNN效果如何？ICML2021论述训练1000层的图神经网络大模型！

专知会员服务

37+阅读 · 2021年6月16日

【NeurIPS 2020】图神经网络GNN架构设计

【NeurIPS 2020】图神经网络GNN架构设计

专知会员服务

85+阅读 · 2020年11月19日

图神经网络架构，稳定性，可迁移性

专知会员服务

29+阅读 · 2020年8月8日

【清华大学】图随机神经网络，Graph Random Neural Networks

【清华大学】图随机神经网络，Graph Random Neural Networks

专知会员服务

156+阅读 · 2020年5月26日

一份简短《图神经网络GNN》笔记，入门小册

一份简短《图神经网络GNN》笔记，入门小册

专知会员服务

226+阅读 · 2020年4月11日

【普渡大学】提升GNN表达能力的集体学习框架，Boost GNN Expressiveness

【普渡大学】提升GNN表达能力的集体学习框架，Boost GNN Expressiveness

专知会员服务

46+阅读 · 2020年3月30日

【斯坦福大学NeuralPS2019】GNN解释器，GNNExplainer: Generating Explanations for Graph Neural Networks，斯坦福大学|Jure Leskovec

【斯坦福大学NeuralPS2019】GNN解释器，GNNExplainer: Generating Explanations for Graph Neural Networks，斯坦福大学|Jure Leskovec

专知会员服务

89+阅读 · 2019年10月13日

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

专知

20+阅读 · 2020年10月5日

Tensorflow GNN最佳实践：tf_geometric（附图自编码器GAE完整代码）

Tensorflow GNN最佳实践：tf_geometric（附图自编码器GAE完整代码）

图与推荐

130+阅读 · 2020年2月6日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

图神经网络火了？谈下它的普适性与局限性

图神经网络火了？谈下它的普适性与局限性

机器之心

22+阅读 · 2019年7月29日

Graph Neural Network（GNN）最全资源整理分享

Graph Neural Network（GNN）最全资源整理分享

深度学习与NLP

339+阅读 · 2019年7月9日

【学界】基于GNN，强于GNN：胶囊图神经网络的PyTorch实现 | ICLR 2019

【学界】基于GNN，强于GNN：胶囊图神经网络的PyTorch实现 | ICLR 2019

GAN生成式对抗网络

31+阅读 · 2019年3月26日

Github热门图深度学习（GraphDL）源码与框架

Github热门图深度学习（GraphDL）源码与框架

新智元

21+阅读 · 2019年3月19日

Github上热门图深度学习（GraphDL）源码与工业级框架

Github上热门图深度学习（GraphDL）源码与工业级框架

专知

15+阅读 · 2019年3月15日

掌握图神经网络GNN基本，看这篇文章就够了

掌握图神经网络GNN基本，看这篇文章就够了

新智元

164+阅读 · 2019年2月14日

面向图像网状结构体的蚁群分割算法

国家自然科学基金

0+阅读 · 2017年12月31日

基于核与核度理论的在线社交网络拓扑结构研究

国家自然科学基金

2+阅读 · 2016年12月31日

复杂网络中部分同步斑图的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

任意网络中的可分数据处理研究

国家自然科学基金

0+阅读 · 2015年12月31日

Ghrelin整合调控神经血管单元网络抑制脑缺血再灌注损伤并促进神经修复

国家自然科学基金

0+阅读 · 2014年12月31日

时间-空间可控生物活性分子释放的胶原支架用于脊髓损伤神经网络重建的研究

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

TopoEdge: Topology-Grounded Agentic Framework for Edge Networking Code Generation and Repair

Arxiv

0+阅读 · 2月28日

GraphOmni: A Comprehensive and Extensible Benchmark Framework for Large Language Models on Graph-theoretic Tasks

Arxiv

0+阅读 · 2月22日

Unifying approach to uniform expressivity of graph neural networks

Arxiv

0+阅读 · 2月20日

GraphFM: A generalist graph transformer that learns transferable representations across diverse domains

Arxiv

0+阅读 · 2月14日

Batch-CAM: Introduction to better reasoning in convolutional deep learning models

Arxiv

0+阅读 · 2月13日

Efficient Graph Knowledge Distillation from GNNs to Kolmogorov--Arnold Networks via Self-Attention Dynamic Sampling

Arxiv

0+阅读 · 2月9日

LogicXGNN: Grounded Logical Rules for Explaining Graph Neural Networks

Arxiv

0+阅读 · 2月8日

BitLogic: Training Framework for Gradient-Based FPGA-Native Neural Networks

Arxiv

0+阅读 · 2月7日

SPGCL: Simple yet Powerful Graph Contrastive Learning via SVD-Guided Structural Perturbation

Arxiv

0+阅读 · 2月3日

Grappa: Gradient-Only Communication for Scalable Graph Neural Network Training

Arxiv

0+阅读 · 2月2日

VIP会员

文章信息

相关主题

神经网络训练

最新内容

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

专知会员服务

10+阅读 · 7月16日

《无人地面战车（UGV）的崛起》报告

《无人地面战车（UGV）的崛起》报告

专知会员服务

6+阅读 · 7月16日

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

专知会员服务

5+阅读 · 7月16日

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

专知会员服务

11+阅读 · 7月16日

美陆军任务式指挥人工智能解决方案

美陆军任务式指挥人工智能解决方案

专知会员服务

10+阅读 · 7月16日

ICML 2026 | 理论级自动形式化：从孤立命题到统一形式化知识库

ICML 2026 | 理论级自动形式化：从孤立命题到统一形式化知识库

专知会员服务

7+阅读 · 7月16日

综述 | 现代智能体自我改进，从模型更新到脚手架演化

综述 | 现代智能体自我改进，从模型更新到脚手架演化

专知会员服务

13+阅读 · 7月16日

美国陆军宣布“项目融合-顶点6”：现代化进程的关键里程碑

美国陆军宣布“项目融合-顶点6”：现代化进程的关键里程碑

专知会员服务

12+阅读 · 7月15日

五角大楼新版反无人机手册：内容解析与战略影响（附手册100页原件）

五角大楼新版反无人机手册：内容解析与战略影响（附手册100页原件）

专知会员服务

15+阅读 · 7月15日

《军事基地能源韧性与经济性权衡评估方法研究》

《军事基地能源韧性与经济性权衡评估方法研究》

专知会员服务

7+阅读 · 7月15日

ACM MM 2026 | UNIT：释放大语言模型在图持续学习中的潜力

ACM MM 2026 | UNIT：释放大语言模型在图持续学习中的潜力

专知会员服务

9+阅读 · 7月15日

综述 | 具身视觉语言导航：系统综述与真实世界评测

综述 | 具身视觉语言导航：系统综述与真实世界评测

专知会员服务

12+阅读 · 7月15日

应对第1、2类无人机威胁的推荐战术、技术与程序

应对第1、2类无人机威胁的推荐战术、技术与程序

专知会员服务

11+阅读 · 7月15日

《反制多无人机集群攻城：序贯斯塔克伯格安全博弈方法研究》59页

《反制多无人机集群攻城：序贯斯塔克伯格安全博弈方法研究》59页

专知会员服务

13+阅读 · 7月15日

博士论文 | 可扩展、自我改进的大语言模型智能体

博士论文 | 可扩展、自我改进的大语言模型智能体

专知会员服务

15+阅读 · 7月14日

相关VIP内容

【KDD2023】GraphGLOW：面向图神经网络的通用和可泛化的结构学习

【KDD2023】GraphGLOW：面向图神经网络的通用和可泛化的结构学习

专知会员服务

30+阅读 · 2023年6月24日

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

专知会员服务

41+阅读 · 2022年11月14日

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

大“GNN”如何学习？北邮最新《分布式图神经网络》综述，35页pdf阐述分布式GNN训练算法和系统

专知会员服务

53+阅读 · 2022年11月2日

1000层的GNN效果如何？ICML2021论述训练1000层的图神经网络大模型！

专知会员服务

37+阅读 · 2021年6月16日

【NeurIPS 2020】图神经网络GNN架构设计

【NeurIPS 2020】图神经网络GNN架构设计

专知会员服务

85+阅读 · 2020年11月19日

图神经网络架构，稳定性，可迁移性

专知会员服务

29+阅读 · 2020年8月8日

【清华大学】图随机神经网络，Graph Random Neural Networks

【清华大学】图随机神经网络，Graph Random Neural Networks

专知会员服务

156+阅读 · 2020年5月26日

一份简短《图神经网络GNN》笔记，入门小册

一份简短《图神经网络GNN》笔记，入门小册

专知会员服务

226+阅读 · 2020年4月11日

【普渡大学】提升GNN表达能力的集体学习框架，Boost GNN Expressiveness

【普渡大学】提升GNN表达能力的集体学习框架，Boost GNN Expressiveness

专知会员服务

46+阅读 · 2020年3月30日

【斯坦福大学NeuralPS2019】GNN解释器，GNNExplainer: Generating Explanations for Graph Neural Networks，斯坦福大学|Jure Leskovec

【斯坦福大学NeuralPS2019】GNN解释器，GNNExplainer: Generating Explanations for Graph Neural Networks，斯坦福大学|Jure Leskovec

专知会员服务

89+阅读 · 2019年10月13日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人地面战车（UGV）的崛起》报告

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

相关资讯

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

专知

20+阅读 · 2020年10月5日

Tensorflow GNN最佳实践：tf_geometric（附图自编码器GAE完整代码）

Tensorflow GNN最佳实践：tf_geometric（附图自编码器GAE完整代码）

图与推荐

130+阅读 · 2020年2月6日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

图神经网络火了？谈下它的普适性与局限性

图神经网络火了？谈下它的普适性与局限性

机器之心

22+阅读 · 2019年7月29日

Graph Neural Network（GNN）最全资源整理分享

Graph Neural Network（GNN）最全资源整理分享

深度学习与NLP

339+阅读 · 2019年7月9日

【学界】基于GNN，强于GNN：胶囊图神经网络的PyTorch实现 | ICLR 2019

【学界】基于GNN，强于GNN：胶囊图神经网络的PyTorch实现 | ICLR 2019

GAN生成式对抗网络

31+阅读 · 2019年3月26日

Github热门图深度学习（GraphDL）源码与框架

Github热门图深度学习（GraphDL）源码与框架

新智元

21+阅读 · 2019年3月19日

Github上热门图深度学习（GraphDL）源码与工业级框架

Github上热门图深度学习（GraphDL）源码与工业级框架

专知

15+阅读 · 2019年3月15日

掌握图神经网络GNN基本，看这篇文章就够了

掌握图神经网络GNN基本，看这篇文章就够了

新智元

164+阅读 · 2019年2月14日

相关论文

TopoEdge: Topology-Grounded Agentic Framework for Edge Networking Code Generation and Repair

Arxiv

0+阅读 · 2月28日

GraphOmni: A Comprehensive and Extensible Benchmark Framework for Large Language Models on Graph-theoretic Tasks

Arxiv

0+阅读 · 2月22日

Unifying approach to uniform expressivity of graph neural networks

Arxiv

0+阅读 · 2月20日

GraphFM: A generalist graph transformer that learns transferable representations across diverse domains

Arxiv

0+阅读 · 2月14日

Batch-CAM: Introduction to better reasoning in convolutional deep learning models

Arxiv

0+阅读 · 2月13日

Efficient Graph Knowledge Distillation from GNNs to Kolmogorov--Arnold Networks via Self-Attention Dynamic Sampling

Arxiv

0+阅读 · 2月9日

LogicXGNN: Grounded Logical Rules for Explaining Graph Neural Networks

Arxiv

0+阅读 · 2月8日

BitLogic: Training Framework for Gradient-Based FPGA-Native Neural Networks

Arxiv

0+阅读 · 2月7日

SPGCL: Simple yet Powerful Graph Contrastive Learning via SVD-Guided Structural Perturbation

Arxiv

0+阅读 · 2月3日

Grappa: Gradient-Only Communication for Scalable Graph Neural Network Training

Arxiv

0+阅读 · 2月2日

相关基金

面向图像网状结构体的蚁群分割算法

国家自然科学基金

0+阅读 · 2017年12月31日

基于核与核度理论的在线社交网络拓扑结构研究

国家自然科学基金

2+阅读 · 2016年12月31日

复杂网络中部分同步斑图的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

任意网络中的可分数据处理研究

国家自然科学基金

0+阅读 · 2015年12月31日

Ghrelin整合调控神经血管单元网络抑制脑缺血再灌注损伤并促进神经修复

国家自然科学基金

0+阅读 · 2014年12月31日

时间-空间可控生物活性分子释放的胶原支架用于脊髓损伤神经网络重建的研究

国家自然科学基金

0+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员