Generalizing GNNs with Tokenized Mixture of Experts - 专知论文

会员服务 ·

0

GNN · 泛化 · 令牌 · 混合 · 扰动 ·

Generalizing GNNs with Tokenized Mixture of Experts

翻译：泛化GNN的令牌化混合专家模型

Xiaoguang Guo,Zehong Wang,Jiazheng Li,Shawn Spitzel,Qi Yang,Kaize Ding,Jundong Li,Chuxu Zhang

from arxiv, Accepted to KDD 2026

Deployed graph neural networks (GNNs) are frozen at deployment yet must fit clean data, generalize under distribution shifts, and remain stable to perturbations. We show that static inference induces a fundamental tradeoff: improving stability requires reducing reliance on shift-sensitive features, leaving an irreducible worst-case generalization floor. Instance-conditional routing can break this ceiling, but is fragile because shifts can mislead routing and perturbations can make routing fluctuate. We capture these effects via two decompositions separating coverage vs selection, and base sensitivity vs fluctuation amplification. Based on these insights, we propose STEM-GNN, a pretrain-then-finetune framework with a mixture-of-experts encoder for diverse computation paths, a vector-quantized token interface to stabilize encoder-to-head signals, and a Lipschitz-regularized head to bound output amplification. Across nine node, link, and graph benchmarks, STEM-GNN achieves a stronger three-way balance, improving robustness to degree/homophily shifts and to feature/edge corruptions while remaining competitive on clean graphs.

翻译：部署后的图神经网络（GNN）处于冻结状态，却需同时适配干净数据、应对分布偏移下的泛化问题，并保持对扰动的稳定性。研究表明，静态推理存在根本性权衡：提升稳定性需降低对偏移敏感特征的依赖，这会导致一个不可约的最坏泛化下限。实例条件路由可突破该上限，但存在脆弱性——偏移可能误导路由决策，扰动可能引发路由波动。我们通过两个解耦分析（覆盖度与选择性的分离、基础敏感性与波动放大的分离）来刻画这些效应。基于上述发现，我们提出STEM-GNN框架：采用预训练-微调范式，集成混合专家编码器以产生多样化计算路径，设计向量量化令牌接口稳定编码器至输出头的信号传递，并引入Lipschitz正则化输出头以约束输出放大。在节点、连边、图三类共九个基准测试中，STEM-GNN展现出更优的三维平衡性：在保持干净图上竞争力同时，显著提升了对度/同质性偏移及特征/边扰动的鲁棒性。

0

相关内容

GNN

GNN如何建模因果性？港科大(广州)等最新《可信赖图神经网络: 因果视角》综述

GNN如何建模因果性？港科大(广州)等最新《可信赖图神经网络: 因果视角》综述

专知会员服务

35+阅读 · 2023年12月22日

GNN隐私如何建模？范德堡大学等最新《图神经网络隐私》综述，综述GNN隐私的攻击、保护和应用

GNN隐私如何建模？范德堡大学等最新《图神经网络隐私》综述，综述GNN隐私的攻击、保护和应用

专知会员服务

21+阅读 · 2023年9月1日

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

专知会员服务

41+阅读 · 2022年11月14日

GNN如何可解释？悉尼科大最新《可解释图神经网络研究》综述，全面阐述可解释GNN的方法与评价指标

GNN如何可解释？悉尼科大最新《可解释图神经网络研究》综述，全面阐述可解释GNN的方法与评价指标

专知会员服务

112+阅读 · 2022年7月28日

GNN如何泛化？这篇135页pdf博士论文《神经图推理与学习的泛化评估与改进》

GNN如何泛化？这篇135页pdf博士论文《神经图推理与学习的泛化评估与改进》

专知会员服务

43+阅读 · 2022年6月9日

GNN+IoT=？弗吉尼亚大学最新《图神经网络与物联网》综述论文，45页pdf全面阐述GNN在IoT中的进展，包括算法与代码数据

GNN+IoT=？弗吉尼亚大学最新《图神经网络与物联网》综述论文，45页pdf全面阐述GNN在IoT中的进展，包括算法与代码数据

专知会员服务

61+阅读 · 2022年4月2日

1000层的GNN效果如何？ICML2021论述训练1000层的图神经网络大模型！

专知会员服务

37+阅读 · 2021年6月16日

【NeurIPS 2020】图神经网络的参数化解释器，Parameterized Explainer for GNN

【NeurIPS 2020】图神经网络的参数化解释器，Parameterized Explainer for GNN

专知会员服务

22+阅读 · 2020年11月13日

【普渡大学】提升GNN表达能力的集体学习框架，Boost GNN Expressiveness

【普渡大学】提升GNN表达能力的集体学习框架，Boost GNN Expressiveness

专知会员服务

46+阅读 · 2020年3月30日

【Yoshua Bengio新论文】图神经网络基准构件化- 如何构建强大GNN模型？南洋理工大学

【Yoshua Bengio新论文】图神经网络基准构件化- 如何构建强大GNN模型？南洋理工大学

专知会员服务

59+阅读 · 2020年3月4日

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

专知

20+阅读 · 2020年10月5日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

17+阅读 · 2020年6月7日

Tensorflow GNN最佳实践：tf_geometric（附图自编码器GAE完整代码）

Tensorflow GNN最佳实践：tf_geometric（附图自编码器GAE完整代码）

图与推荐

130+阅读 · 2020年2月6日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

Graph Neural Network（GNN）最全资源整理分享

Graph Neural Network（GNN）最全资源整理分享

深度学习与NLP

339+阅读 · 2019年7月9日

【荟萃】图神经网络论文列表，包含GNN理论及其在NLP和CV等领域的应用

【荟萃】图神经网络论文列表，包含GNN理论及其在NLP和CV等领域的应用

专知

45+阅读 · 2019年3月26日

掌握图神经网络GNN基本，看这篇文章就够了

掌握图神经网络GNN基本，看这篇文章就够了

新智元

164+阅读 · 2019年2月14日

CNN已老，GNN来了！清华大学孙茂松组一文综述GNN

CNN已老，GNN来了！清华大学孙茂松组一文综述GNN

新智元

35+阅读 · 2018年12月26日

学界 | 图神经网络+池化模块，斯坦福等提出层级图表征学习

学界 | 图神经网络+池化模块，斯坦福等提出层级图表征学习

机器之心

30+阅读 · 2018年7月16日

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

6+阅读 · 2015年12月31日

复杂网络中部分同步斑图的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于Xampling的Gabor框架条件下的窄脉冲信号采集方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

GNSS仿真模型服务化共享关键技术研究

国家自然科学基金

9+阅读 · 2015年12月31日

随机广义纳什均衡问题的研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

面向异构信息网络中实体归类的模糊聚类

国家自然科学基金

1+阅读 · 2015年12月31日

基于新体制GNSS信号的模糊抑制捕获研究

国家自然科学基金

0+阅读 · 2015年12月31日

传感器非线性的模糊随机系统H无穷控制和滤波问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于分布式∑/△与扩展量化的红外焦平面阵列像素级/列级混合式模数转换方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

信号时频分析与包络的数学模型

国家自然科学基金

1+阅读 · 2014年12月31日

TreeGRNG: Binary Tree Gaussian Random Number Generator for Efficient Probabilistic AI Hardware

Arxiv

0+阅读 · 6月15日

ADAGE: Active Defenses Against GNN Extraction

Arxiv

0+阅读 · 6月5日

Beyond Soft Masks: Hard-Perturbation Mixup Explainer for Robust GNN Explainability

Arxiv

0+阅读 · 6月4日

TENP: Trapezoidal Expert Neuron Pruning For Mixture-of-Experts

Arxiv

0+阅读 · 6月3日

Generalizing Graph Foundation Models via Hyperbolic Retrieval-Augmented Generation

Arxiv

0+阅读 · 6月3日

Generalizing Graph Foundation Models via Hyperbolic Retrieval-Augmented Generation

Arxiv

0+阅读 · 6月2日

Random-Set Graph Neural Networks

Arxiv

0+阅读 · 5月12日

Efficient Hybrid CNN-GNN Architecture for Monocular Depth Estimation

Arxiv

0+阅读 · 5月11日

GraphNetz: Statistical Benchmarking of Graph Neural Networks with Paired Tests and Rank Aggregation

Arxiv

0+阅读 · 5月9日

Generalization Bounds of Spiking Neural Networks via Rademacher Complexity

Arxiv

0+阅读 · 4月26日

VIP会员

文章信息

相关主题

最新内容

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

7+阅读 · 今天2:06

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

5+阅读 · 今天1:37

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

3+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

5+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

4+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

6+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

4+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

6+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

6+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

5+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

4+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

多模态代码智能综述：从视觉输入到可执行代码系统

多模态代码智能综述：从视觉输入到可执行代码系统

专知会员服务

8+阅读 · 6月16日

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

专知会员服务

6+阅读 · 6月16日

相关VIP内容

GNN如何建模因果性？港科大(广州)等最新《可信赖图神经网络: 因果视角》综述

GNN如何建模因果性？港科大(广州)等最新《可信赖图神经网络: 因果视角》综述

专知会员服务

35+阅读 · 2023年12月22日

GNN隐私如何建模？范德堡大学等最新《图神经网络隐私》综述，综述GNN隐私的攻击、保护和应用

GNN隐私如何建模？范德堡大学等最新《图神经网络隐私》综述，综述GNN隐私的攻击、保护和应用

专知会员服务

21+阅读 · 2023年9月1日

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

GNN如何分布式？中科院计算所最新《图神经网络分布式训练》综述，阐述分布式GNN训练技术

专知会员服务

41+阅读 · 2022年11月14日

GNN如何可解释？悉尼科大最新《可解释图神经网络研究》综述，全面阐述可解释GNN的方法与评价指标

GNN如何可解释？悉尼科大最新《可解释图神经网络研究》综述，全面阐述可解释GNN的方法与评价指标

专知会员服务

112+阅读 · 2022年7月28日

GNN如何泛化？这篇135页pdf博士论文《神经图推理与学习的泛化评估与改进》

GNN如何泛化？这篇135页pdf博士论文《神经图推理与学习的泛化评估与改进》

专知会员服务

43+阅读 · 2022年6月9日

GNN+IoT=？弗吉尼亚大学最新《图神经网络与物联网》综述论文，45页pdf全面阐述GNN在IoT中的进展，包括算法与代码数据

GNN+IoT=？弗吉尼亚大学最新《图神经网络与物联网》综述论文，45页pdf全面阐述GNN在IoT中的进展，包括算法与代码数据

专知会员服务

61+阅读 · 2022年4月2日

1000层的GNN效果如何？ICML2021论述训练1000层的图神经网络大模型！

专知会员服务

37+阅读 · 2021年6月16日

【NeurIPS 2020】图神经网络的参数化解释器，Parameterized Explainer for GNN

【NeurIPS 2020】图神经网络的参数化解释器，Parameterized Explainer for GNN

专知会员服务

22+阅读 · 2020年11月13日

【普渡大学】提升GNN表达能力的集体学习框架，Boost GNN Expressiveness

【普渡大学】提升GNN表达能力的集体学习框架，Boost GNN Expressiveness

专知会员服务

46+阅读 · 2020年3月30日

【Yoshua Bengio新论文】图神经网络基准构件化- 如何构建强大GNN模型？南洋理工大学

【Yoshua Bengio新论文】图神经网络基准构件化- 如何构建强大GNN模型？南洋理工大学

专知会员服务

59+阅读 · 2020年3月4日

热门VIP内容

开通专知VIP会员享更多权益服务

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

相关资讯

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

专知

20+阅读 · 2020年10月5日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

17+阅读 · 2020年6月7日

Tensorflow GNN最佳实践：tf_geometric（附图自编码器GAE完整代码）

Tensorflow GNN最佳实践：tf_geometric（附图自编码器GAE完整代码）

图与推荐

130+阅读 · 2020年2月6日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

Graph Neural Network（GNN）最全资源整理分享

Graph Neural Network（GNN）最全资源整理分享

深度学习与NLP

339+阅读 · 2019年7月9日

【荟萃】图神经网络论文列表，包含GNN理论及其在NLP和CV等领域的应用

【荟萃】图神经网络论文列表，包含GNN理论及其在NLP和CV等领域的应用

专知

45+阅读 · 2019年3月26日

掌握图神经网络GNN基本，看这篇文章就够了

掌握图神经网络GNN基本，看这篇文章就够了

新智元

164+阅读 · 2019年2月14日

CNN已老，GNN来了！清华大学孙茂松组一文综述GNN

CNN已老，GNN来了！清华大学孙茂松组一文综述GNN

新智元

35+阅读 · 2018年12月26日

学界 | 图神经网络+池化模块，斯坦福等提出层级图表征学习

学界 | 图神经网络+池化模块，斯坦福等提出层级图表征学习

机器之心

30+阅读 · 2018年7月16日

相关论文

TreeGRNG: Binary Tree Gaussian Random Number Generator for Efficient Probabilistic AI Hardware

Arxiv

0+阅读 · 6月15日

ADAGE: Active Defenses Against GNN Extraction

Arxiv

0+阅读 · 6月5日

Beyond Soft Masks: Hard-Perturbation Mixup Explainer for Robust GNN Explainability

Arxiv

0+阅读 · 6月4日

TENP: Trapezoidal Expert Neuron Pruning For Mixture-of-Experts

Arxiv

0+阅读 · 6月3日

Generalizing Graph Foundation Models via Hyperbolic Retrieval-Augmented Generation

Arxiv

0+阅读 · 6月3日

Generalizing Graph Foundation Models via Hyperbolic Retrieval-Augmented Generation

Arxiv

0+阅读 · 6月2日

Random-Set Graph Neural Networks

Arxiv

0+阅读 · 5月12日

Efficient Hybrid CNN-GNN Architecture for Monocular Depth Estimation

Arxiv

0+阅读 · 5月11日

GraphNetz: Statistical Benchmarking of Graph Neural Networks with Paired Tests and Rank Aggregation

Arxiv

0+阅读 · 5月9日

Generalization Bounds of Spiking Neural Networks via Rademacher Complexity

Arxiv

0+阅读 · 4月26日

相关基金

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

6+阅读 · 2015年12月31日

复杂网络中部分同步斑图的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于Xampling的Gabor框架条件下的窄脉冲信号采集方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

GNSS仿真模型服务化共享关键技术研究

国家自然科学基金

9+阅读 · 2015年12月31日

随机广义纳什均衡问题的研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

面向异构信息网络中实体归类的模糊聚类

国家自然科学基金

1+阅读 · 2015年12月31日

基于新体制GNSS信号的模糊抑制捕获研究

国家自然科学基金

0+阅读 · 2015年12月31日

传感器非线性的模糊随机系统H无穷控制和滤波问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于分布式∑/△与扩展量化的红外焦平面阵列像素级/列级混合式模数转换方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

信号时频分析与包络的数学模型

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员