Billion-Scale Graph Foundation Models - 专知论文

会员服务 ·

0

样本 · 预训练 · 构建 · 大模型 · 图结构 ·

Billion-Scale Graph Foundation Models

翻译：十亿规模图基础模型

Maya Bechler-Speicher,Yoel Gottlieb,Andrey Isakov,David Abensur,Ami Tavory,Daniel Haimovich,Ido Guy,Udi Weinsberg

Graph-structured data underpins many critical applications. While foundation models have transformed language and vision via large-scale pretraining and lightweight adaptation, extending this paradigm to general, real-world graphs is challenging. In this work, we present Graph Billion- Foundation-Fusion (GraphBFF): the first end-to-end recipe for building billion-parameter Graph Foundation Models (GFMs) for arbitrary heterogeneous, billion-scale graphs. Central to the recipe is the GraphBFF Transformer, a flexible and scalable architecture designed for practical billion-scale GFMs. Using the GraphBFF, we present the first neural scaling laws for general graphs and show that loss decreases predictably as either model capacity or training data scales, depending on which factor is the bottleneck. The GraphBFF framework provides concrete methodologies for data batching, pretraining, and fine-tuning for building GFMs at scale. We demonstrate the effectiveness of the framework with an evaluation of a 1.4 billion-parameter GraphBFF Transformer pretrained on one billion samples. Across ten diverse, real-world downstream tasks on graphs unseen during training, spanning node- and link-level classification and regression, GraphBFF achieves remarkable zero-shot and probing performance, including in few-shot settings, with large margins of up to 31 PRAUC points. Finally, we discuss key challenges and open opportunities for making GFMs a practical and principled foundation for graph learning at industrial scale.

翻译：图结构数据支撑着许多关键应用。尽管基础模型已通过大规模预训练与轻量级适配改变了语言与视觉领域，但将这一范式扩展到通用、真实世界的图数据仍面临挑战。本研究提出Graph Billion-Foundation-Fusion（GraphBFF）：首个为任意异构十亿规模图构建十亿参数级图基础模型（GFM）的端到端方案。该方案的核心是GraphBFF Transformer——一种为实用化十亿规模GFM设计的灵活可扩展架构。基于GraphBFF，我们首次提出了通用图的神经缩放定律，并证明损失函数会随模型容量或训练数据规模的扩大而可预测地下降，具体取决于何者为瓶颈因素。GraphBFF框架为大规模构建GFM提供了数据批处理、预训练与微调的具体方法论。我们通过评估一个基于十亿样本预训练的14亿参数GraphBFF Transformer，验证了该框架的有效性。在训练阶段未见过的十个多样化真实世界下游图任务（涵盖节点级与链接级分类及回归任务）中，GraphBFF在零样本与探针评估（包括少样本场景）中均取得显著性能提升，PRAUC指标最高领先达31个百分点。最后，我们探讨了将GFM发展为工业级图学习实用化、原则性基础所面临的关键挑战与开放机遇。

0

相关内容

图基础模型中的分布外（Out-of-Distribution）泛化研究

图基础模型中的分布外（Out-of-Distribution）泛化研究

专知会员服务

12+阅读 · 1月31日

图基础模型：全面综述

图基础模型：全面综述

专知会员服务

38+阅读 · 2025年5月22日

推荐系统的图基础模型综述

推荐系统的图基础模型综述

专知会员服务

20+阅读 · 2025年2月13日

知识图谱基础模型的数学基础

知识图谱基础模型的数学基础

专知会员服务

41+阅读 · 2025年1月12日

【KDD2024教程】《大规模语言模型在图上的综述: 进展与方向》，142页ppt

【KDD2024教程】《大规模语言模型在图上的综述: 进展与方向》，142页ppt

专知会员服务

53+阅读 · 2024年8月27日

【剑桥大学博士论文】图机器学习非参数建模，128页pdf

【剑桥大学博士论文】图机器学习非参数建模，128页pdf

专知会员服务

47+阅读 · 2024年5月4日

大模型在图上怎么做？北邮等最新《图基础模型》综述，详述GFMs关键技术

大模型在图上怎么做？北邮等最新《图基础模型》综述，详述GFMs关键技术

专知会员服务

60+阅读 · 2023年10月19日

「图神经网络GNN:模型与应用」最新SDM2021-Tutorial，附视频与203页ppt

专知会员服务

93+阅读 · 2021年5月1日

【AAAI2021-Tutorial】图神经网络GNN:模型与应用，附视频与291页ppt

【AAAI2021-Tutorial】图神经网络GNN:模型与应用，附视频与291页ppt

专知会员服务

178+阅读 · 2021年2月6日

Deep Learning for Graphs: Models and Applications，密歇根州立大学唐继良助理教授，CIPS ATT 16（2019）

Deep Learning for Graphs: Models and Applications，密歇根州立大学唐继良助理教授，CIPS ATT 16（2019）

专知会员服务

54+阅读 · 2019年10月25日

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

专知

55+阅读 · 2023年4月13日

(KDD'21) 异构图神经网络到底哪家强？清华、微软、阿里、中科院等推出HGB基准！

(KDD'21) 异构图神经网络到底哪家强？清华、微软、阿里、中科院等推出HGB基准！

学术头条

13+阅读 · 2021年11月9日

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

专知

20+阅读 · 2020年10月5日

55页图深度学习导论《A Gentle Introduction to Deep Learning for Graphs》

55页图深度学习导论《A Gentle Introduction to Deep Learning for Graphs》

专知

16+阅读 · 2020年1月3日

图神经网络最近十篇论文，来自KDD、IJCAI、ICML等，附PDF下载

图神经网络最近十篇论文，来自KDD、IJCAI、ICML等，附PDF下载

专知

50+阅读 · 2019年6月7日

图神经网络开发必备组件，NetworkX、稀疏矩阵、稀疏Tensor等

图神经网络开发必备组件，NetworkX、稀疏矩阵、稀疏Tensor等

专知

48+阅读 · 2019年5月10日

Github上热门图深度学习（GraphDL）源码与工业级框架

Github上热门图深度学习（GraphDL）源码与工业级框架

专知

15+阅读 · 2019年3月15日

神经网络图的简介（基本概念，DeepWalk以及GraphSage算法）

神经网络图的简介（基本概念，DeepWalk以及GraphSage算法）

AI研习社

12+阅读 · 2019年3月5日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

图神经网络最近这么火，不妨看看我们精选的这七篇

图神经网络最近这么火，不妨看看我们精选的这七篇

人工智能前沿讲习班

37+阅读 · 2018年12月10日

大规模多视角高维图像特征提取

国家自然科学基金

4+阅读 · 2017年12月31日

天元数学交流项目图像处理中的数学理论及方法研讨会

国家自然科学基金

9+阅读 · 2017年12月31日

分布无关的概率图模型结构学习方法的研究

国家自然科学基金

4+阅读 · 2015年12月31日

动态异质大图匹配模型及算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

云计算环境下基于图模型的海量RDF数据管理关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于Spark的大图数据最优子模式匹配查询方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

大规模格结构数据管理关键技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向大规模知识图谱的查询处理关键技术研究

国家自然科学基金

18+阅读 · 2014年12月31日

概率图模型学习及其在数据分析中的应用研究

国家自然科学基金

16+阅读 · 2013年12月31日

GraphSeek: Next-Generation Graph Analytics with LLMs

Arxiv

0+阅读 · 3月14日

GraphOmni: A Comprehensive and Extensible Benchmark Framework for Large Language Models on Graph-theoretic Tasks

Arxiv

0+阅读 · 2月22日

Diffusion-Guided Pretraining for Brain Graph Foundation Models

Arxiv

0+阅读 · 2月19日

GraphPFN: A Prior-Data Fitted Graph Foundation Model

Arxiv

0+阅读 · 2月12日

GraphSeek: Next-Generation Graph Analytics with LLMs

Arxiv

0+阅读 · 2月11日

Ecological mapping with geospatial foundation models

Arxiv

0+阅读 · 2月11日

Foundation Models for Decision Making: Problems, Methods, and Opportunities

Arxiv

37+阅读 · 2023年3月7日

A Systematic Survey on Deep Generative Models for Graph Generation

Arxiv

18+阅读 · 2022年10月4日

Federated Graph Neural Networks: Overview, Techniques and Challenges

Arxiv

16+阅读 · 2022年2月15日

Graph Learning: A Survey

Arxiv

58+阅读 · 2021年5月3日

VIP会员

文章信息

相关主题

最新内容

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

专知会员服务

2+阅读 · 今天7:11

人工智能赋能无人机：俄乌战争（万字长文）

人工智能赋能无人机：俄乌战争（万字长文）

专知会员服务

4+阅读 · 今天6:56

国外海军作战管理系统与作战训练系统

国外海军作战管理系统与作战训练系统

专知会员服务

2+阅读 · 今天4:16

美军条令《海军陆战队规划流程（2026版）》

美军条令《海军陆战队规划流程（2026版）》

专知会员服务

9+阅读 · 今天3:36

《压缩式分布式交互仿真标准》120页

《压缩式分布式交互仿真标准》120页

专知会员服务

4+阅读 · 今天3:21

《电子战数据交换模型研究报告》

《电子战数据交换模型研究报告》

专知会员服务

6+阅读 · 今天3:13

美军运用水下无人机与机器人系统竞速清除霍尔木兹海峡水雷

美军运用水下无人机与机器人系统竞速清除霍尔木兹海峡水雷

专知会员服务

4+阅读 · 今天2:55

《基于Transformer的异常舰船导航识别与跟踪》80页

《基于Transformer的异常舰船导航识别与跟踪》80页

专知会员服务

7+阅读 · 今天2:45

《美国太空系统司令部实验室原型作战管理系统的数据与决策可追溯性》

《美国太空系统司令部实验室原型作战管理系统的数据与决策可追溯性》

专知会员服务

6+阅读 · 今天2:41

《低数据领域军事目标检测模型研究》

《低数据领域军事目标检测模型研究》

专知会员服务

6+阅读 · 今天2:37

《为韧性而设计：在战略不确定时代提升军事空军基地的生存能力》

《为韧性而设计：在战略不确定时代提升军事空军基地的生存能力》

专知会员服务

6+阅读 · 今天2:32

【CMU博士论文】物理世界的视觉感知与深度理解

【CMU博士论文】物理世界的视觉感知与深度理解

专知会员服务

9+阅读 · 4月22日

多智能体系统：从经典范式到大基础模型驱动的未来

多智能体系统：从经典范式到大基础模型驱动的未来

专知会员服务

12+阅读 · 4月22日

伊朗战争停火期间美军关键弹药状况分析

伊朗战争停火期间美军关键弹药状况分析

专知会员服务

8+阅读 · 4月22日

电子战革命：塑造战场的十年突破（2015–2025）

电子战革命：塑造战场的十年突破（2015–2025）

专知会员服务

6+阅读 · 4月22日

相关VIP内容

图基础模型中的分布外（Out-of-Distribution）泛化研究

图基础模型中的分布外（Out-of-Distribution）泛化研究

专知会员服务

12+阅读 · 1月31日

图基础模型：全面综述

图基础模型：全面综述

专知会员服务

38+阅读 · 2025年5月22日

推荐系统的图基础模型综述

推荐系统的图基础模型综述

专知会员服务

20+阅读 · 2025年2月13日

知识图谱基础模型的数学基础

知识图谱基础模型的数学基础

专知会员服务

41+阅读 · 2025年1月12日

【KDD2024教程】《大规模语言模型在图上的综述: 进展与方向》，142页ppt

【KDD2024教程】《大规模语言模型在图上的综述: 进展与方向》，142页ppt

专知会员服务

53+阅读 · 2024年8月27日

【剑桥大学博士论文】图机器学习非参数建模，128页pdf

【剑桥大学博士论文】图机器学习非参数建模，128页pdf

专知会员服务

47+阅读 · 2024年5月4日

大模型在图上怎么做？北邮等最新《图基础模型》综述，详述GFMs关键技术

大模型在图上怎么做？北邮等最新《图基础模型》综述，详述GFMs关键技术

专知会员服务

60+阅读 · 2023年10月19日

「图神经网络GNN:模型与应用」最新SDM2021-Tutorial，附视频与203页ppt

专知会员服务

93+阅读 · 2021年5月1日

【AAAI2021-Tutorial】图神经网络GNN:模型与应用，附视频与291页ppt

【AAAI2021-Tutorial】图神经网络GNN:模型与应用，附视频与291页ppt

专知会员服务

178+阅读 · 2021年2月6日

Deep Learning for Graphs: Models and Applications，密歇根州立大学唐继良助理教授，CIPS ATT 16（2019）

Deep Learning for Graphs: Models and Applications，密歇根州立大学唐继良助理教授，CIPS ATT 16（2019）

专知会员服务

54+阅读 · 2019年10月25日

热门VIP内容

开通专知VIP会员享更多权益服务

人工智能赋能无人机：俄乌战争（万字长文）

美军条令《海军陆战队规划流程（2026版）》

美军被摧毁的空战装备：伊朗战争如何重创美国空中力量

国外海军作战管理系统与作战训练系统

相关资讯

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

专知

55+阅读 · 2023年4月13日

(KDD'21) 异构图神经网络到底哪家强？清华、微软、阿里、中科院等推出HGB基准！

(KDD'21) 异构图神经网络到底哪家强？清华、微软、阿里、中科院等推出HGB基准！

学术头条

13+阅读 · 2021年11月9日

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

专知

20+阅读 · 2020年10月5日

55页图深度学习导论《A Gentle Introduction to Deep Learning for Graphs》

55页图深度学习导论《A Gentle Introduction to Deep Learning for Graphs》

专知

16+阅读 · 2020年1月3日

图神经网络最近十篇论文，来自KDD、IJCAI、ICML等，附PDF下载

图神经网络最近十篇论文，来自KDD、IJCAI、ICML等，附PDF下载

专知

50+阅读 · 2019年6月7日

图神经网络开发必备组件，NetworkX、稀疏矩阵、稀疏Tensor等

图神经网络开发必备组件，NetworkX、稀疏矩阵、稀疏Tensor等

专知

48+阅读 · 2019年5月10日

Github上热门图深度学习（GraphDL）源码与工业级框架

Github上热门图深度学习（GraphDL）源码与工业级框架

专知

15+阅读 · 2019年3月15日

神经网络图的简介（基本概念，DeepWalk以及GraphSage算法）

神经网络图的简介（基本概念，DeepWalk以及GraphSage算法）

AI研习社

12+阅读 · 2019年3月5日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

图神经网络最近这么火，不妨看看我们精选的这七篇

图神经网络最近这么火，不妨看看我们精选的这七篇

人工智能前沿讲习班

37+阅读 · 2018年12月10日

相关论文

GraphSeek: Next-Generation Graph Analytics with LLMs

Arxiv

0+阅读 · 3月14日

GraphOmni: A Comprehensive and Extensible Benchmark Framework for Large Language Models on Graph-theoretic Tasks

Arxiv

0+阅读 · 2月22日

Diffusion-Guided Pretraining for Brain Graph Foundation Models

Arxiv

0+阅读 · 2月19日

GraphPFN: A Prior-Data Fitted Graph Foundation Model

Arxiv

0+阅读 · 2月12日

GraphSeek: Next-Generation Graph Analytics with LLMs

Arxiv

0+阅读 · 2月11日

Ecological mapping with geospatial foundation models

Arxiv

0+阅读 · 2月11日

Foundation Models for Decision Making: Problems, Methods, and Opportunities

Arxiv

37+阅读 · 2023年3月7日

A Systematic Survey on Deep Generative Models for Graph Generation

Arxiv

18+阅读 · 2022年10月4日

Federated Graph Neural Networks: Overview, Techniques and Challenges

Arxiv

16+阅读 · 2022年2月15日

Graph Learning: A Survey

Arxiv

58+阅读 · 2021年5月3日

相关基金

大规模多视角高维图像特征提取

国家自然科学基金

4+阅读 · 2017年12月31日

天元数学交流项目图像处理中的数学理论及方法研讨会

国家自然科学基金

9+阅读 · 2017年12月31日

分布无关的概率图模型结构学习方法的研究

国家自然科学基金

4+阅读 · 2015年12月31日

动态异质大图匹配模型及算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

云计算环境下基于图模型的海量RDF数据管理关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于Spark的大图数据最优子模式匹配查询方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

大规模格结构数据管理关键技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向大规模知识图谱的查询处理关键技术研究

国家自然科学基金

18+阅读 · 2014年12月31日

概率图模型学习及其在数据分析中的应用研究

国家自然科学基金

16+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员