PLGC: Pseudo-Labeled Graph Condensation - 专知论文

会员服务 ·

0

图压缩 · 监督 · 噪声 · 潜在 · 嵌入 ·

PLGC: Pseudo-Labeled Graph Condensation

翻译：PLGC：伪标签图压缩

Jay Nandy,Arnab Kumar Mondal,Anuj Rathore,Mahesh Chandran

Large graph datasets make training graph neural networks (GNNs) computationally costly. Graph condensation methods address this by generating small synthetic graphs that approximate the original data. However, existing approaches rely on clean, supervised labels, which limits their reliability when labels are scarce, noisy, or inconsistent. We propose Pseudo-Labeled Graph Condensation (PLGC), a self-supervised framework that constructs latent pseudo-labels from node embeddings and optimizes condensed graphs to match the original graph's structural and feature statistics -- without requiring ground-truth labels. PLGC offers three key contributions: (1) A diagnosis of why supervised condensation fails under label noise and distribution shift. (2) A label-free condensation method that jointly learns latent prototypes and node assignments. (3) Theoretical guarantees showing that pseudo-labels preserve latent structural statistics of the original graph and ensure accurate embedding alignment. Empirically, across node classification and link prediction tasks, PLGC achieves competitive performance with state-of-the-art supervised condensation methods on clean datasets and exhibits substantial robustness under label noise, often outperforming all baselines by a significant margin. Our findings highlight the practical and theoretical advantages of self-supervised graph condensation in noisy or weakly-labeled environments.

翻译：大规模图数据集使得图神经网络（GNNs）的训练计算成本高昂。图压缩方法通过生成近似原始数据的小型合成图来解决这一问题。然而，现有方法依赖于干净、有监督的标签，这在标签稀缺、噪声较大或不一致时限制了其可靠性。我们提出伪标签图压缩（PLGC），这是一种自监督框架，它从节点嵌入中构建潜在伪标签，并优化压缩图以匹配原始图的结构和特征统计量——无需真实标签。PLGC提供了三个关键贡献：（1）诊断了有监督压缩在标签噪声和分布偏移下失效的原因。（2）一种无标签压缩方法，能够联合学习潜在原型和节点分配。（3）理论保证表明伪标签能够保留原始图的潜在结构统计量，并确保准确的嵌入对齐。实证研究表明，在节点分类和链接预测任务中，PLGC在干净数据集上达到了与最先进的有监督压缩方法相竞争的性能，并在标签噪声下表现出显著的鲁棒性，通常以较大优势超越所有基线方法。我们的发现凸显了自监督图压缩在噪声或弱标签环境中的实践与理论优势。

0

相关内容

图压缩

【ICML2024】超图增强的双半监督图分类

【ICML2024】超图增强的双半监督图分类

专知会员服务

15+阅读 · 2024年5月9日

【ICML2023】图神经网络可以仅从图结构中恢复隐藏特征

【ICML2023】图神经网络可以仅从图结构中恢复隐藏特征

专知会员服务

32+阅读 · 2023年4月27日

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

专知会员服务

74+阅读 · 2023年4月12日

图上知识蒸馏怎么做？中科院计算所等最新《基于图的知识蒸馏:调查与实验评价》，

图上知识蒸馏怎么做？中科院计算所等最新《基于图的知识蒸馏:调查与实验评价》，

专知会员服务

44+阅读 · 2023年3月3日

“小”标记图数据如何学习？KDD2022最新《图最小监督学习》教程，125页ppt阐述图学习的弱监督学习、少样本学习和自监督学习

“小”标记图数据如何学习？KDD2022最新《图最小监督学习》教程，125页ppt阐述图学习的弱监督学习、少样本学习和自监督学习

专知会员服务

56+阅读 · 2022年8月20日

GNN如何可解释？悉尼科大最新《可解释图神经网络研究》综述，全面阐述可解释GNN的方法与评价指标

GNN如何可解释？悉尼科大最新《可解释图神经网络研究》综述，全面阐述可解释GNN的方法与评价指标

专知会员服务

112+阅读 · 2022年7月28日

【KDD2022】基于对抗性知识蒸馏的深度图神经网络压缩

【KDD2022】基于对抗性知识蒸馏的深度图神经网络压缩

专知会员服务

24+阅读 · 2022年6月10日

Facebook@ICLR2021 比GNN快100倍的标签传播

专知会员服务

33+阅读 · 2021年2月21日

【NeurIPS 2020】图神经网络的参数化解释器，Parameterized Explainer for GNN

【NeurIPS 2020】图神经网络的参数化解释器，Parameterized Explainer for GNN

专知会员服务

22+阅读 · 2020年11月13日

【Google-CMU】元伪标签的元学习，Meta Pseudo Labels

【Google-CMU】元伪标签的元学习，Meta Pseudo Labels

专知会员服务

32+阅读 · 2020年3月30日

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

专知

55+阅读 · 2023年4月13日

Kaggle知识点：伪标签Pseudo Label

Kaggle知识点：伪标签Pseudo Label

AINLP

40+阅读 · 2020年8月9日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

17+阅读 · 2020年6月7日

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

专知

12+阅读 · 2020年3月31日

【Google-CMU】元伪标签的元学习，Meta Pseudo Labels

【Google-CMU】元伪标签的元学习，Meta Pseudo Labels

专知

48+阅读 · 2020年3月30日

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

专知

41+阅读 · 2020年3月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

Github上热门图深度学习（GraphDL）源码与工业级框架

Github上热门图深度学习（GraphDL）源码与工业级框架

专知

15+阅读 · 2019年3月15日

图分类：结合胶囊网络Capsule和图卷积GCN（附代码）

图分类：结合胶囊网络Capsule和图卷积GCN（附代码）

中国人工智能学会

36+阅读 · 2019年2月26日

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

GAN生成式对抗网络

10+阅读 · 2018年4月25日

基于压缩感知理论的图像采样、编码和重建研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于随机相位调制的自然场景压缩成像方法与实现研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向CELP语音压缩域的通用隐写分析方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

网络图像标注中多视图半监督稀疏特征选择算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于线性规划感知的压缩高光谱遥感图像快速重建

国家自然科学基金

0+阅读 · 2015年12月31日

基于Spark的大图数据最优子模式匹配查询方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于成像环境约束的低质量图像篡改取证研究

国家自然科学基金

1+阅读 · 2015年12月31日

图的边覆盖染色

国家自然科学基金

1+阅读 · 2014年12月31日

GraphFM: A generalist graph transformer that learns transferable representations across diverse domains

Arxiv

0+阅读 · 2月14日

PLESS: Pseudo-Label Enhancement with Spreading Scribbles for Weakly Supervised Segmentation

Arxiv

0+阅读 · 2月12日

HoGS: Homophily-Oriented Graph Synthesis for Local Differentially Private GNN Training

Arxiv

0+阅读 · 2月9日

CFRecs: Counterfactual Recommendations on Real Estate User Listing Interaction Graphs

Arxiv

0+阅读 · 2月5日

SPGCL: Simple yet Powerful Graph Contrastive Learning via SVD-Guided Structural Perturbation

Arxiv

0+阅读 · 2月3日

Scalable Topology-Preserving Graph Coarsening with Graph Collapse

Arxiv

0+阅读 · 1月30日

PULSE: Socially-Aware User Representation Modeling Toward Parameter-Efficient Graph Collaborative Filtering

Arxiv

0+阅读 · 1月28日

CondenseGraph: Communication-Efficient Distributed GNN Training via On-the-Fly Graph Condensation

Arxiv

0+阅读 · 1月25日

LoRAP: Low-Rank Aggregation Prompting for Quantized Graph Neural Networks Training

Arxiv

0+阅读 · 1月21日

Using Subgraph GNNs for Node Classification:an Overlooked Potential Approach

Arxiv

0+阅读 · 1月13日

VIP会员

文章信息

相关主题

最新内容

大语言模型平台在国防情报应用中的对比

大语言模型平台在国防情报应用中的对比

专知会员服务

3+阅读 · 今天3:12

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

专知会员服务

4+阅读 · 今天3:00

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

专知会员服务

2+阅读 · 今天2:56

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

专知会员服务

2+阅读 · 今天2:44

《仿真互操作性标准：实时平台参考联邦对象模型指南、原理与互操作性模式标准》300页

《仿真互操作性标准：实时平台参考联邦对象模型指南、原理与互操作性模式标准》300页

专知会员服务

4+阅读 · 今天2:37

《自主远程巡飞弹药打击系统的嵌入式人工智能感知框架》

《自主远程巡飞弹药打击系统的嵌入式人工智能感知框架》

专知会员服务

3+阅读 · 今天2:22

美海军“超配项目”

美海军“超配项目”

专知会员服务

4+阅读 · 今天2:13

《美陆军条例：陆军指挥政策（2026版）》

《美陆军条例：陆军指挥政策（2026版）》

专知会员服务

10+阅读 · 4月21日

《提升美军全域城市作战训练最佳实践的案例研究》366页

《提升美军全域城市作战训练最佳实践的案例研究》366页

专知会员服务

13+阅读 · 4月21日

《军用自主人工智能系统的治理与安全》

《军用自主人工智能系统的治理与安全》

专知会员服务

7+阅读 · 4月21日

美海军数字作战负责人：如何利用数据快速生成战斗力

美海军数字作战负责人：如何利用数据快速生成战斗力

专知会员服务

8+阅读 · 4月21日

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

11+阅读 · 4月20日

《系统簇式多域作战规划范畴论框架》

《系统簇式多域作战规划范畴论框架》

专知会员服务

10+阅读 · 4月20日

《美国防部指令6130.03，第2卷服役医疗标准：保留》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

专知会员服务

6+阅读 · 4月20日

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

专知会员服务

4+阅读 · 4月20日

相关VIP内容

【ICML2024】超图增强的双半监督图分类

【ICML2024】超图增强的双半监督图分类

专知会员服务

15+阅读 · 2024年5月9日

【ICML2023】图神经网络可以仅从图结构中恢复隐藏特征

【ICML2023】图神经网络可以仅从图结构中恢复隐藏特征

专知会员服务

32+阅读 · 2023年4月27日

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

专知会员服务

74+阅读 · 2023年4月12日

图上知识蒸馏怎么做？中科院计算所等最新《基于图的知识蒸馏:调查与实验评价》，

图上知识蒸馏怎么做？中科院计算所等最新《基于图的知识蒸馏:调查与实验评价》，

专知会员服务

44+阅读 · 2023年3月3日

“小”标记图数据如何学习？KDD2022最新《图最小监督学习》教程，125页ppt阐述图学习的弱监督学习、少样本学习和自监督学习

“小”标记图数据如何学习？KDD2022最新《图最小监督学习》教程，125页ppt阐述图学习的弱监督学习、少样本学习和自监督学习

专知会员服务

56+阅读 · 2022年8月20日

GNN如何可解释？悉尼科大最新《可解释图神经网络研究》综述，全面阐述可解释GNN的方法与评价指标

GNN如何可解释？悉尼科大最新《可解释图神经网络研究》综述，全面阐述可解释GNN的方法与评价指标

专知会员服务

112+阅读 · 2022年7月28日

【KDD2022】基于对抗性知识蒸馏的深度图神经网络压缩

【KDD2022】基于对抗性知识蒸馏的深度图神经网络压缩

专知会员服务

24+阅读 · 2022年6月10日

Facebook@ICLR2021 比GNN快100倍的标签传播

专知会员服务

33+阅读 · 2021年2月21日

【NeurIPS 2020】图神经网络的参数化解释器，Parameterized Explainer for GNN

【NeurIPS 2020】图神经网络的参数化解释器，Parameterized Explainer for GNN

专知会员服务

22+阅读 · 2020年11月13日

【Google-CMU】元伪标签的元学习，Meta Pseudo Labels

【Google-CMU】元伪标签的元学习，Meta Pseudo Labels

专知会员服务

32+阅读 · 2020年3月30日

热门VIP内容

开通专知VIP会员享更多权益服务

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

大语言模型平台在国防情报应用中的对比

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

相关资讯

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

专知

55+阅读 · 2023年4月13日

Kaggle知识点：伪标签Pseudo Label

Kaggle知识点：伪标签Pseudo Label

AINLP

40+阅读 · 2020年8月9日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

17+阅读 · 2020年6月7日

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

专知

12+阅读 · 2020年3月31日

【Google-CMU】元伪标签的元学习，Meta Pseudo Labels

【Google-CMU】元伪标签的元学习，Meta Pseudo Labels

专知

48+阅读 · 2020年3月30日

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

专知

41+阅读 · 2020年3月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

Github上热门图深度学习（GraphDL）源码与工业级框架

Github上热门图深度学习（GraphDL）源码与工业级框架

专知

15+阅读 · 2019年3月15日

图分类：结合胶囊网络Capsule和图卷积GCN（附代码）

图分类：结合胶囊网络Capsule和图卷积GCN（附代码）

中国人工智能学会

36+阅读 · 2019年2月26日

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

【学界】极端图像压缩的生成对抗网络，可生成低码率的高质量图像

GAN生成式对抗网络

10+阅读 · 2018年4月25日

相关论文

GraphFM: A generalist graph transformer that learns transferable representations across diverse domains

Arxiv

0+阅读 · 2月14日

PLESS: Pseudo-Label Enhancement with Spreading Scribbles for Weakly Supervised Segmentation

Arxiv

0+阅读 · 2月12日

HoGS: Homophily-Oriented Graph Synthesis for Local Differentially Private GNN Training

Arxiv

0+阅读 · 2月9日

CFRecs: Counterfactual Recommendations on Real Estate User Listing Interaction Graphs

Arxiv

0+阅读 · 2月5日

SPGCL: Simple yet Powerful Graph Contrastive Learning via SVD-Guided Structural Perturbation

Arxiv

0+阅读 · 2月3日

Scalable Topology-Preserving Graph Coarsening with Graph Collapse

Arxiv

0+阅读 · 1月30日

PULSE: Socially-Aware User Representation Modeling Toward Parameter-Efficient Graph Collaborative Filtering

Arxiv

0+阅读 · 1月28日

CondenseGraph: Communication-Efficient Distributed GNN Training via On-the-Fly Graph Condensation

Arxiv

0+阅读 · 1月25日

LoRAP: Low-Rank Aggregation Prompting for Quantized Graph Neural Networks Training

Arxiv

0+阅读 · 1月21日

Using Subgraph GNNs for Node Classification:an Overlooked Potential Approach

Arxiv

0+阅读 · 1月13日

相关基金

基于压缩感知理论的图像采样、编码和重建研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于图的半监督学习算法研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于随机相位调制的自然场景压缩成像方法与实现研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向CELP语音压缩域的通用隐写分析方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

网络图像标注中多视图半监督稀疏特征选择算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于线性规划感知的压缩高光谱遥感图像快速重建

国家自然科学基金

0+阅读 · 2015年12月31日

基于Spark的大图数据最优子模式匹配查询方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于成像环境约束的低质量图像篡改取证研究

国家自然科学基金

1+阅读 · 2015年12月31日

图的边覆盖染色

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员