[ICML 2026] 图神经网络中的无分位数不确定性量化：QpiGNN

在医疗诊断、刑事司法等高风险决策领域，图神经网络（GNN）的输出如果只是一个孤零零的数值，而没有附带任何不确定性信息，其可信度将大打折扣。然而，让GNN学会说“我不确定”并非易事。传统的贝叶斯方法计算成本高昂，频率学派方法又往往依赖可交换性假设或繁琐的后处理步骤，在结构复杂的图上显得力不从心。更棘手的是，图上的消息传递机制可能会放大数据中的偏差，让错误的预测变得“自信满满”。针对这一痛点，来自忠南大学（Chungnam National University）和韩国科学技术院（KAIST）的研究人员——Soyoung Park、Hwanjun Song 和 Sungsu Lim，提出了一种全新的框架 QpiGNN（Quantile-free Prediction Interval GNN）。他们直指核心问题：能否绕过对分位数输入的依赖，让GNN直接学会生成既准确又紧凑的预测区间？QpiGNN 的答案是肯定的，它通过巧妙的设计，在不增加现成模型负担的前提下，实现了高效且鲁棒的不确定性量化。这项被 ICML 2026 接收的工作，其核心创新在于提出了一种无分位数（quantile-free）的联合损失函数和双头架构，使得模型无需额外的分位数输入或复杂的后处理，就能在达到理论保证的渐近覆盖率的同时，生成更窄（更精确）的预测区间。如果你正在为图上的不确定性问题发愁，或者对量化回归在图上的困境有所耳闻，这篇论文值得深入研读。

论文基本信息

英文题目 Quantile-Free Uncertainty Quantification in Graph Neural Networks 作者 Soyoung park, Hwanjun Song, Sungsu Lim arXiv ID 2605.04847v1 类别 cs.LG, cs.AI Comments/接收信息 Accepted at the 43rd International Conference on Machine Learning (ICML 2026) 原文链接 http://arxiv.org/abs/2605.04847v1

摘要

图神经网络的不确定性量化在高风险领域至关重要，但面临巨大挑战。在图上，消息传递通常依赖于诸如可交换性（exchangeability）之类的强假设，而这些假设在实践中很少被满足。此外，实现可靠的不确定性量化通常需要高昂的重采样或后处理步骤。为了解决这些问题，本文提出了无分位数预测区间图神经网络（QpiGNN），这是一个基于分位数回归（QR）的框架，它通过直接优化覆盖率和区间宽度，无需分位数输入或后处理，就实现了基于GNN的不确定性量化。QpiGNN采用双头架构来解耦预测和不确定性，并通过无分位数联合损失，仅使用标签进行监督训练。这种设计不仅允许高效的训练，还能产生鲁棒的预测区间，并在温和假设下提供了渐近覆盖率和近最优宽度的理论保证。在19个合成和真实基准数据集上的实验表明，与基线相比，QpiGNN的平均覆盖率高出22%，区间宽度窄了50%，同时确保了对噪声和结构偏移的高效与鲁棒性。

引言：论文要解决什么问题

大多数现有的图神经网络在节点回归任务中只输出点估计（point estimate），即一个具体的预测数值。这种确定性架构在应用于医疗或法律等高风险领域时存在显著风险。因为GNN的消息传递机制不仅会传播信息，也可能传播和放大数据中的偏差，使得错误的预测在缺乏不确定性的情况下被直接用于决策，从而增加潜在风险。为了给预测附上置信区间，研究人员尝试了贝叶斯方法和频率学派方法，但二者在图上都遇到了不小的麻烦。贝叶斯方法（如变分推断）虽然能输出后验分布，但面临着可扩展性差、对先验设定敏感等问题。频率学派方法则通常依赖于重采样（如引导法）或后处理校准（如保形预测），这些方法要么需要重复推断，计算成本高昂；要么需要额外的校准集，且对图上普遍存在的结构依赖性（即数据不独立同分布）假设脆弱，使得可交换性这一核心假设常常被违反。鉴于此，分位数回归（QR）被看作一个有潜力的替代方案。它能直接估计条件分位数，无需假设数据符合特定的分布，对异方差性也较为鲁棒，且避免了重采样和后处理步骤。然而，将标准QR直接应用于GNN也并非坦途。标准QR要求模型输入分位数参数τ（例如τ=0.05或0.95）作为输入，或者为每个分位数训练独立的预测器。这带来了两个主要问题：一是模型复杂度增加；二是可能引发“分位数交叉”问题（即预测的0.95分位数低于0.05分位数，违反数学常识）。在图的上下文中，分位数监督还会使节点表示发生纠缠，导致区间校准不佳且不够紧凑。因此，论文的动机非常明确：开发一种新的、适用于GNN的频率学派框架，它既不需要强假设（如可交换性），也不需要繁琐的后处理。QpiGNN正是为了填补这一空白而提出的解决方案。

方法：核心思路与技术路线

QpiGNN的核心思想是绕过对显式分位数输入的依赖，让模型直接学习一个既满足目标覆盖率又尽可能紧凑的预测区间。其框架主要由两个关键组件构成：双头架构和无分位数联合损失。 1. 双头架构：解耦预测与不确定性

QpiGNN采用了一个包含两个输出头的GNN架构。这两个头共享底层的图卷积特征提取器，但各自负责不同的任务：

预测头（Prediction head） 输出节点的目标预测值 ŷ。这个头相当于一个标准的回归头，负责给出最可能的点估计。
宽度头（Width head） 输出预测区间的宽度 ˆd。这个头负责学习不确定性的大小。对于一个目标覆盖率 1−α（例如90%），模型输出的是一个区间 [ŷ − ˆd, ŷ + ˆd]。

这种设计的精妙之处在于“解耦”。通过将点预测和不确定性的估计分离开来，可以避免二者在特征空间中的相互干扰，减少了类似量化回归中节点表示纠缠的问题，并且能够有效缓解图神经网络中常见的过平滑现象。 2. 无分位数联合损失：直接优化目标

QpiGNN摒弃了传统的分位数损失函数，转而使用一个联合损失函数来训练整个网络。这个损失函数由两项组成，通过一个超参数λ来平衡，直接量化了最终预测区间的两个关键属性：覆盖率和宽度。

覆盖项（Coverage Term, L_coverage） 此项鼓励区间尽可能地包含真实值 y。其核心思想是：如果真实值落在预测区间之外，就产生一个惩罚。惩罚的大小通常与区间宽度和真实值偏离区间边界的距离有关。它激励模型生成足够宽的区间以维持覆盖率。
宽度项（Width Term, L_width） 此项鼓励预测区间尽可能窄。它是对所有节点预测宽度的直接惩罚，促使模型不要仅仅为了高覆盖率而生成一个无限宽的、没有信息量的区间。

这个联合损失函数是“无分位数”的，因为它只依赖于标签 y 和模型输出的预测区间，而无需指定任何分位数级别。通过反向传播，模型学会了在覆盖率和区间宽度之间寻求一个最优的折中。正如原论文中Figure 1所展示的，仅使用覆盖项训练的模型会产生过宽的区间，而联合损失则能生成更紧、更具自适应性且满足目标覆盖率的区间。 3. 理论保证

除了高效的训练流程，QpiGNN还在温和的假设下提供了理论保证。论文证明了随着训练数据的增加，生成的预测区间能够达到渐近覆盖率（即实际覆盖率趋近于目标1−α），并且区间的宽度渐近地接近于理论上的最优宽度。这为模型在实际应用中的可靠性提供了数学支撑。

配图：方法结构

图 1 无分位数预测区间图神经网络（QpiGNN）概览。QpiGNN 使用双头 GNN 估计节点级预测区间，并通过无分位数联合损失在覆盖率与区间紧凑性之间进行权衡。一个预测头输出目标值 ˆy，另一个预测头输出区间宽度 ˆd。损失函数包含覆盖率项 Lcoverage，用于鼓励区间足够宽以维持覆盖率；也包含宽度项 Lwidth，用于鼓励更紧的区间。如图所示，仅使用覆盖率项训练的模型会产生过宽区间，而完整联合损失能够得到更紧、更具局部自适应性的区间，同时仍满足目标覆盖率 1 − α。来源：原论文 PDF 第 3 页。图 2 合成数据集上的损失收敛轨迹。路径展示了训练过程从 ✗（起点）到 ●（终点）的演化。来源：原论文 PDF 第 5 页。

实验：设置、指标与结果

为了验证QpiGNN的有效性和鲁棒性，作者在19个不同的数据集上进行了实验，包括合成图和真实世界图。 1. 数据集与基线

实验覆盖了9个合成图数据集（用于分析不同数据特性下模型的表现）以及10个真实世界基准数据集（如数据集A、B等，原文虽未明确命名，但其来源覆盖了各种节点回归场景）。基线方法选择了两个具有代表性的、适用于图的分位数方法：SQR (Standard Quantile Regression) 和 RQR (Robust Quantile Regression)。 2. 评价指标

实验采用了两个标准指标来评估预测区间的质量：

PICP (Prediction Interval Coverage Probability) 实际预测区间包含真实标签的比例，衡量区间的准确性。
MPIW (Mean Prediction Interval Width) 所有节点预测区间宽度的平均值，衡量区间的紧凑性（或信息量）。

理想的情况是：PICP高（接近目标覆盖率），同时MPIW低（区间窄）。 3. 主要结果与对比

实验结果显示，QpiGNN在所有19个数据集上的表现显著优于SQR和RQR两个基线。具体量化结果为：

覆盖率提升 QpiGNN的平均PICP比现有最好的基线方法高出22%。
区间宽度优化 在达到更高覆盖率的同时，QpiGNN的MPIW平均比基线窄了50%。这说明QpiGNN不仅在统计上更准确，还提供了信息量更大的预测区间。

4. 鲁棒性分析

作者还测试了QpiGNN对图结构偏移和数据噪声的鲁棒性。通过雷达图（Figure 3）可视化展示了在不同类型的结构扰动下，QpiGNN的PICP和MPIW指标依然保持了优异的性能，而基线方法则出现了明显的退化。这证实了QpiGNN在处理现实世界中普遍存在的非理想图结构时的优越性。 5. 消融与收敛分析

虽然原文未明确细分为“消融实验”章节，但通过对图2（损失收敛轨迹）和图4（在9个合成数据集上的PICP-MPIW权衡图）的分析，可以归纳出模型的内部工作机制。图4的系统性比较清晰地表明，使用完整的联合损失（覆盖项+宽度项）训练的模型在覆盖率-宽度帕累托前沿上远超仅使用单项损失的变体。图2则展示了损失函数在训练过程中有效且稳定的收敛。

配图：实验结果

图 4 九个合成数据集上的 PICP–MPIW 权衡，对比了作者的消融设置与 SQR、RQR 方法。来源：原论文 PDF 第 7 页。图 3 QpiGNN 在合成图上的性能雷达图，展示 PICP 与 MPIW 指标，并体现其对结构分布变化的鲁棒性。来源：原论文 PDF 第 7 页。

结论：贡献、局限与启发

贡献总结：

QpiGNN为图神经网络中的节点回归任务提供了一个新颖、高效且理论扎实的不确定性量化框架。其主要贡献包括：

首个无分位数UQ框架：它避开了传统分位数回归在图上应用的种种限制（需要分位数输入、分位数交叉等），成为首个专门为GNN设计、无需分位数输入或后处理的频率学派区间估计方法。
设计的有效性与理论严谨性：双头架构和联合损失的设计巧妙地解耦了预测与不确定性，并能在温和假设下提供渐近覆盖率和近最优宽度的理论保证。
卓越的实验表现：在19个不同数据集的详尽实验中，QpiGNN在覆盖率和区间宽度上均实现了对基线的压倒性优势（覆盖率+22%，宽度-50%），且展示了对噪声和结构偏移的鲁棒性。

局限性（原文未明确说明）：

原文在“局限性”部分没有进行独立的、明确的阐述。通常，这类具有理论保证的方法可能会面临如何在大规模、动态图中实时更新的挑战，或者对双头架构中的超参数λ（平衡覆盖率和宽度的权重）较为敏感。具体局限性请读者参考原论文的最新版本或附录。 启发：

这项工作的启发是深远的。它表明，在结构化数据的不确定性量化中，不一定要拘泥于传统的统计范式（如贝叶斯或分位数回归）。通过精心设计贴合实际目标的损失函数（如联合优化覆盖率和宽度）和模型架构（如解耦的双头设计），可以取得比传统方法更好的实际效果。这种方法学思路，即“直接优化最终指标”，对于未来其他领域中“可学习的不确定性量化”设计有着很强的借鉴意义。对于从业者而言，QpiGNN是一个可以直接落地、提升模型可靠性的实用工具。

成为VIP会员查看完整内容