Gaussian Process Limit Reveals Structural Benefits of Graph Transformers - 专知论文

会员服务 ·

0

图变换器 · 变换 · 结构 · 高斯过程 · 图结构 ·

Gaussian Process Limit Reveals Structural Benefits of Graph Transformers

翻译：图变换器的高斯过程极限揭示其结构优势

Nil Ayday,Lingchu Yang,Debarghya Ghoshdastidar

Graph transformers are the state-of-the-art for learning from graph-structured data and are empirically known to avoid several pitfalls of message-passing architectures. However, there is limited theoretical analysis on why these models perform well in practice. In this work, we prove that attention-based architectures have structural benefits over graph convolutional networks in the context of node-level prediction tasks. Specifically, we study the neural network gaussian process limits of graph transformers (GAT, Graphormer, Specformer) with infinite width and infinite heads, and derive the node-level and edge-level kernels across the layers. Our results characterise how the node features and the graph structure propagate through the graph attention layers. As a specific example, we prove that graph transformers structurally preserve community information and maintain discriminative node representations even in deep layers, thereby preventing oversmoothing. We provide empirical evidence on synthetic and real-world graphs that validate our theoretical insights, such as integrating informative priors and positional encoding can improve performance of deep graph transformers.

翻译：图变换器是目前从图结构数据中学习的最先进模型，经验表明它们能避免消息传递架构的若干缺陷。然而，关于这些模型在实践中表现优异的理论分析仍然有限。在本工作中，我们证明在节点级预测任务中，基于注意力的架构相比图卷积网络具有结构优势。具体而言，我们研究了无限宽度和无限头数下图变换器（GAT、Graphormer、Specformer）的神经网络高斯过程极限，并推导了各层节点级和边级核函数。我们的结果刻画了节点特征和图结构如何通过图注意力层传播。作为特例，我们证明图变换器能在深层中结构性保留社区信息并保持具有判别力的节点表示，从而防止过平滑。我们在合成图与真实图上提供了实证证据，验证了我们的理论洞见，例如整合信息先验和位置编码可提升深层图变换器的性能。

0

相关内容

图变换器

【牛津大学博士论文】图高斯过程，134页pdf

【牛津大学博士论文】图高斯过程，134页pdf

专知会员服务

31+阅读 · 2024年10月3日

「图Transformers」综述

「图Transformers」综述

专知会员服务

28+阅读 · 2024年7月16日

【ICML2024】少即是多：论图Transformers的过度全局化问题

【ICML2024】少即是多：论图Transformers的过度全局化问题

专知会员服务

23+阅读 · 2024年5月12日

【IJCAI2024】Gradformer：具有指数衰减的图变换器

【IJCAI2024】Gradformer：具有指数衰减的图变换器

专知会员服务

17+阅读 · 2024年4月25日

结构保持图transformer综述

结构保持图transformer综述

专知会员服务

42+阅读 · 2024年2月19日

Transformer为什么有效？Google最新《揭示变换器中的台阶优化算法》解释

Transformer为什么有效？Google最新《揭示变换器中的台阶优化算法》解释

专知会员服务

34+阅读 · 2023年9月13日

【ICML2022】结构感知Transformer的图表示学习

【ICML2022】结构感知Transformer的图表示学习

专知会员服务

49+阅读 · 2022年6月17日

【斯坦福】距离编码-为结构表示学习设计更强大的GNN.

专知会员服务

45+阅读 · 2020年9月3日

系列教程GNN-algorithms之一：《图卷积网络（GCN）的前世今生》

专知会员服务

131+阅读 · 2020年8月2日

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

专知会员服务

63+阅读 · 2020年7月12日

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

专知

55+阅读 · 2023年4月13日

【干货书】《Transformers 机器学习:深度探究》，284页pdf

【干货书】《Transformers 机器学习:深度探究》，284页pdf

专知

72+阅读 · 2022年4月21日

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

专知

18+阅读 · 2020年6月22日

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

专知

20+阅读 · 2020年3月1日

图神经网络开发必备组件，NetworkX、稀疏矩阵、稀疏Tensor等

图神经网络开发必备组件，NetworkX、稀疏矩阵、稀疏Tensor等

专知

48+阅读 · 2019年5月10日

专栏 | 深入理解图注意力机制

专栏 | 深入理解图注意力机制

机器之心

25+阅读 · 2019年2月19日

大讲堂 | 基于小波变换的图卷积神经网络

大讲堂 | 基于小波变换的图卷积神经网络

AI研习社

12+阅读 · 2019年1月3日

图神经网络最近这么火，不妨看看我们精选的这七篇

图神经网络最近这么火，不妨看看我们精选的这七篇

人工智能前沿讲习班

37+阅读 · 2018年12月10日

深度 | 一文概览图卷积网络基本结构和最新进展

深度 | 一文概览图卷积网络基本结构和最新进展

机器之心

17+阅读 · 2017年11月30日

图上的归纳表示学习

图上的归纳表示学习

科技创新与创业

23+阅读 · 2017年11月9日

图的距离矩阵的惯性及极端负特征值的研究

国家自然科学基金

0+阅读 · 2015年12月31日

含非正态及缺失数据的结构方程模型分析

国家自然科学基金

0+阅读 · 2015年12月31日

结构化压缩感知及其在盲信号处理中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

图信号滤波与估计的理论及应用研究

国家自然科学基金

3+阅读 · 2015年12月31日

图积和多项式理论中的图结构与极值问题

国家自然科学基金

0+阅读 · 2015年12月31日

极限学习机拓展研究及其在近红外光谱分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

有限局部交换环与零化理想图

国家自然科学基金

0+阅读 · 2014年12月31日

变换结构方程模型的非参数贝叶斯分析

国家自然科学基金

4+阅读 · 2014年12月31日

图谱理论的研究及其在复杂网络中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

高维复杂结构数据降维

国家自然科学基金

10+阅读 · 2014年12月31日

$\texttt{SynC}$: Synergistic Boosting of Structure and Representation for Deep Graph Clustering

Arxiv

0+阅读 · 5月17日

Multi-layer Cross-Attention is Provably Optimal for Multi-modal In-context Learning

Arxiv

0+阅读 · 4月28日

Scalable and Adaptive Parallel Training of Graph Transformer on Large Graphs

Arxiv

0+阅读 · 4月17日

Ge$^\text{2}$mS-T: Multi-Dimensional Grouping for Ultra-High Energy Efficiency in Spiking Transformer

Arxiv

0+阅读 · 4月10日

Transformers Can Solve Non-Linear and Non-Markovian Filtering Problems in Continuous Time For Conditionally Gaussian Signals

Arxiv

0+阅读 · 4月2日

Inverse-Free Sparse Variational Gaussian Processes

Arxiv

0+阅读 · 4月1日

Pushing the limits of unconstrained machine-learned interatomic potentials

Arxiv

0+阅读 · 3月27日

State Space Model for New-Generation Network Alternative to Transformers: A Survey

Arxiv

14+阅读 · 2024年4月15日

The Expressive Power of Graph Neural Networks: A Survey

Arxiv

10+阅读 · 2023年8月16日

Full Stack Optimization of Transformer Inference: a Survey

Arxiv

19+阅读 · 2023年2月27日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

2+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

3+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

5+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

4+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

4+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

5+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

3+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

6+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

9+阅读 · 6月22日

相关VIP内容

【牛津大学博士论文】图高斯过程，134页pdf

【牛津大学博士论文】图高斯过程，134页pdf

专知会员服务

31+阅读 · 2024年10月3日

「图Transformers」综述

「图Transformers」综述

专知会员服务

28+阅读 · 2024年7月16日

【ICML2024】少即是多：论图Transformers的过度全局化问题

【ICML2024】少即是多：论图Transformers的过度全局化问题

专知会员服务

23+阅读 · 2024年5月12日

【IJCAI2024】Gradformer：具有指数衰减的图变换器

【IJCAI2024】Gradformer：具有指数衰减的图变换器

专知会员服务

17+阅读 · 2024年4月25日

结构保持图transformer综述

结构保持图transformer综述

专知会员服务

42+阅读 · 2024年2月19日

Transformer为什么有效？Google最新《揭示变换器中的台阶优化算法》解释

Transformer为什么有效？Google最新《揭示变换器中的台阶优化算法》解释

专知会员服务

34+阅读 · 2023年9月13日

【ICML2022】结构感知Transformer的图表示学习

【ICML2022】结构感知Transformer的图表示学习

专知会员服务

49+阅读 · 2022年6月17日

【斯坦福】距离编码-为结构表示学习设计更强大的GNN.

专知会员服务

45+阅读 · 2020年9月3日

系列教程GNN-algorithms之一：《图卷积网络（GCN）的前世今生》

专知会员服务

131+阅读 · 2020年8月2日

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

专知会员服务

63+阅读 · 2020年7月12日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

专知

55+阅读 · 2023年4月13日

【干货书】《Transformers 机器学习:深度探究》，284页pdf

【干货书】《Transformers 机器学习:深度探究》，284页pdf

专知

72+阅读 · 2022年4月21日

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

【MIT】最优传输图神经网络，Optimal Transport Graph Neural Networks

专知

18+阅读 · 2020年6月22日

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

专知

20+阅读 · 2020年3月1日

图神经网络开发必备组件，NetworkX、稀疏矩阵、稀疏Tensor等

图神经网络开发必备组件，NetworkX、稀疏矩阵、稀疏Tensor等

专知

48+阅读 · 2019年5月10日

专栏 | 深入理解图注意力机制

专栏 | 深入理解图注意力机制

机器之心

25+阅读 · 2019年2月19日

大讲堂 | 基于小波变换的图卷积神经网络

大讲堂 | 基于小波变换的图卷积神经网络

AI研习社

12+阅读 · 2019年1月3日

图神经网络最近这么火，不妨看看我们精选的这七篇

图神经网络最近这么火，不妨看看我们精选的这七篇

人工智能前沿讲习班

37+阅读 · 2018年12月10日

深度 | 一文概览图卷积网络基本结构和最新进展

深度 | 一文概览图卷积网络基本结构和最新进展

机器之心

17+阅读 · 2017年11月30日

图上的归纳表示学习

图上的归纳表示学习

科技创新与创业

23+阅读 · 2017年11月9日

相关论文

$\texttt{SynC}$: Synergistic Boosting of Structure and Representation for Deep Graph Clustering

Arxiv

0+阅读 · 5月17日

Multi-layer Cross-Attention is Provably Optimal for Multi-modal In-context Learning

Arxiv

0+阅读 · 4月28日

Scalable and Adaptive Parallel Training of Graph Transformer on Large Graphs

Arxiv

0+阅读 · 4月17日

Ge$^\text{2}$mS-T: Multi-Dimensional Grouping for Ultra-High Energy Efficiency in Spiking Transformer

Arxiv

0+阅读 · 4月10日

Transformers Can Solve Non-Linear and Non-Markovian Filtering Problems in Continuous Time For Conditionally Gaussian Signals

Arxiv

0+阅读 · 4月2日

Inverse-Free Sparse Variational Gaussian Processes

Arxiv

0+阅读 · 4月1日

Pushing the limits of unconstrained machine-learned interatomic potentials

Arxiv

0+阅读 · 3月27日

State Space Model for New-Generation Network Alternative to Transformers: A Survey

Arxiv

14+阅读 · 2024年4月15日

The Expressive Power of Graph Neural Networks: A Survey

Arxiv

10+阅读 · 2023年8月16日

Full Stack Optimization of Transformer Inference: a Survey

Arxiv

19+阅读 · 2023年2月27日

相关基金

图的距离矩阵的惯性及极端负特征值的研究

国家自然科学基金

0+阅读 · 2015年12月31日

含非正态及缺失数据的结构方程模型分析

国家自然科学基金

0+阅读 · 2015年12月31日

结构化压缩感知及其在盲信号处理中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

图信号滤波与估计的理论及应用研究

国家自然科学基金

3+阅读 · 2015年12月31日

图积和多项式理论中的图结构与极值问题

国家自然科学基金

0+阅读 · 2015年12月31日

极限学习机拓展研究及其在近红外光谱分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

有限局部交换环与零化理想图

国家自然科学基金

0+阅读 · 2014年12月31日

变换结构方程模型的非参数贝叶斯分析

国家自然科学基金

4+阅读 · 2014年12月31日

图谱理论的研究及其在复杂网络中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

高维复杂结构数据降维

国家自然科学基金

10+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员