Graph Neural Networks (GNNs) have become the standard method for learning from networks across fields ranging from biology to social systems, yet a principled understanding of what enables them to extract meaningful representations, or why performance varies drastically between similar models, remains elusive. These questions can be answered through the generalisation error, which measures the discrepancy between a model's predictions and the true values it is meant to recover. Although several works have derived generalisation error bounds, learning theoretical bounds are typically loose, restricted to a single architecture, and offer limited insight into what governs generalisation in practice. In this work, we take a fundamentally different approach by deriving the exact generalisation error for a broad range of linear GNNs, including convolutional, PageRank-based, and attention-based models, through the lens of signal processing. Our exact generalisation error exposes a strong benchmark bias in existing literature: commonly used datasets exhibit high alignment between node features and the graph structure, inherently favouring architectures that rely on it. We further show that the similarity between connected nodes (homophily) decisively governs which architectures are best suited for a given graph, thereby explaining how specific benchmark properties systematically shape the reported performance in the literature. Together, these results explain when and why GNNs can effectively leverage structure and feature information, supporting the reliable application of GNNs.


翻译:图神经网络(GNNs)已成为从生物学到社会系统等多个领域中从网络进行学习的标准方法,然而,对于是什么让它们能够提取有意义的表示,或者为什么相似模型之间的性能差异巨大,仍缺乏原理性的理解。这些问题可以通过泛化误差来回答,泛化误差衡量模型预测与其旨在恢复的真实值之间的差异。尽管已有若干研究推导出泛化误差界,但学习理论界通常较为松散,局限于单一架构,并且对实践中支配泛化过程的因素提供的见解有限。在本研究中,我们采取了一种根本不同的方法,通过信号处理的视角,为包括卷积型、基于PageRank型和注意力型模型在内的广泛线性GNNs推导出精确的泛化误差。我们的精确泛化误差揭示了现有文献中存在的强基准偏差:常用数据集在节点特征与图结构之间表现出高度对齐,这固有地偏好依赖图结构的架构。我们进一步表明,连接节点之间的相似性(同质性)决定性地支配着哪种架构最适合给定图,从而解释了特定的基准属性如何系统性地塑造文献中报告的性能。综合这些结果,本研究解释了GNNs何时以及为何能有效利用结构和特征信息,从而支持GNNs的可靠应用。

0
下载
关闭预览

相关内容

图机器学习的核心原理:表征、鲁棒性与泛化性
图神经网络泛化理论研究综述
专知会员服务
24+阅读 · 2025年3月22日
《图神经网络不确定性》最新综述
专知会员服务
28+阅读 · 2024年3月13日
【ICML2023】路径神经网络:具有表达能力的准确图神经网络
【ICML2023】图神经网络可以仅从图结构中恢复隐藏特征
专知会员服务
32+阅读 · 2023年4月27日
MIT《图神经网络的任务结构与泛化》,22页ppt
专知会员服务
24+阅读 · 2021年2月28日
【MIT-ICML2020】图神经网络的泛化与表示的局限
专知会员服务
43+阅读 · 2020年6月23日
【GNN】深度学习之上,图神经网络(GNN )崛起
产业智能官
16+阅读 · 2019年8月15日
图神经网络火了?谈下它的普适性与局限性
机器之心
22+阅读 · 2019年7月29日
掌握图神经网络GNN基本,看这篇文章就够了
新智元
164+阅读 · 2019年2月14日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
4+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
4+阅读 · 6月22日
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关VIP内容
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员