GraspLLM: Towards Zero-Shot Generalization on Text-Attributed Graphs with LLMs - 专知论文

会员服务 ·

0

泛化 · 结构 · 数据集 · 样本 · 属性 ·

GraspLLM: Towards Zero-Shot Generalization on Text-Attributed Graphs with LLMs

翻译：GraspLLM：面向零样本泛化的文本属性图与大型语言模型方法

Hengyi Feng,Zeang Sheng,Meiyi Qiang,Li Yang,Wentao Zhang

Research on Text-Attributed Graphs (TAGs) has gained significant attention recently due to its broad applications across various real-world data scenarios, such as citation networks, e-commerce platforms, social media, and web pages. Inspired by the remarkable semantic understanding ability of Large Language Models (LLMs), there have been numerous attempts to integrate LLMs into TAGs. However, existing methods still struggle to generalize across diverse graphs and tasks, and their ability to capture transferable graph structural patterns remains limited. To address this, we introduce the GraspLLM, a framework that combines Graph structural comprehension with semantic understanding prowess of LLMs to enhance the cross-dataset and cross-task generalizability. Specifically, we represent node texts from different graphs in a unified semantic space with a frozen general embedding model, on top of which we perform motif-aware contrastive learning across multiple motif-induced adjacency matrices to extract dataset-agnostic structural information. Then, with our proposed optimal contextual subgraph, we extract the most contextually relevant subgraph for each target node and align these subgraphs to the token space of LLM via an alignment projector. Extensive experiments on TAG benchmark datasets spanning diverse domains reveal that GraspLLM consistently outperforms previous LLM-based methods for TAGs, especially in zero-shot scenarios, highlighting its strong generalizability across different datasets and tasks. Our code is available at https://github.com/Heinz217/GraspLLM.

翻译：近年来，文本属性图（TAGs）因其在引文网络、电子商务平台、社交媒体及网页等真实世界数据场景中的广泛应用而受到显著关注。受大型语言模型（LLMs）卓越语义理解能力的启发，已有诸多尝试将LLMs融入TAGs。然而，现有方法仍难以跨不同图结构与任务进行泛化，其对可迁移图结构模式的捕捉能力有限。为此，我们提出了GraspLLM框架，该框架将图结构理解与LLMs的语义理解能力相结合，以增强跨数据集与跨任务的泛化能力。具体而言，我们通过冻结的通用嵌入模型将不同图的节点文本映射至统一语义空间，并在此基础上，基于多个模体诱导的邻接矩阵执行模体感知对比学习，以提取与数据集无关的结构信息。随后，利用我们提出的最优上下文子图方法，为每个目标节点提取最相关的上下文子图，并通过对齐投影器将这些子图映射至LLM的令牌空间。在跨多样领域的TAG基准数据集上的大量实验表明，GraspLLM始终优于以往基于LLM的TAG方法，尤其在零样本场景下表现突出，突显了其在不同数据集与任务间的强泛化能力。我们的代码已开源：https://github.com/Heinz217/GraspLLM。

0

相关内容

大型语言模型遇上文本属性图：一种融合框架与应用的综述

大型语言模型遇上文本属性图：一种融合框架与应用的综述

专知会员服务

10+阅读 · 2025年10月27日

大型语言模型（LLM）赋能的知识图谱构建：综述

大型语言模型（LLM）赋能的知识图谱构建：综述

专知会员服务

56+阅读 · 2025年10月24日

【新书】设计大型语言模型应用：一种面向LLMs的整体方法

【新书】设计大型语言模型应用：一种面向LLMs的整体方法

专知会员服务

56+阅读 · 2025年3月16日

带入您自己的知识：大型语言模型（LLM）知识扩展方法综述

带入您自己的知识：大型语言模型（LLM）知识扩展方法综述

专知会员服务

38+阅读 · 2025年2月21日

【CIKM2024】LLM蒸馏到GNN，性能提升6.2%！Emory提出大模型蒸馏到文本图｜CIKM 2024

【CIKM2024】LLM蒸馏到GNN，性能提升6.2%！Emory提出大模型蒸馏到文本图｜CIKM 2024

专知会员服务

23+阅读 · 2024年8月22日

图+大模型如何结合？港理工最新《大语言模型（LLMs）时代的图机器学习》综述

图+大模型如何结合？港理工最新《大语言模型（LLMs）时代的图机器学习》综述

专知会员服务

58+阅读 · 2024年4月24日

【WWW2024】GNN能成为LLMs的良好适配器吗？

【WWW2024】GNN能成为LLMs的良好适配器吗？

专知会员服务

35+阅读 · 2024年2月24日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

111+阅读 · 2023年12月19日

图上大模型怎么做？UIUC最新《图上大型语言模型》综述，详述LLM在图上作为预测器、编码器和对齐器的技术

图上大模型怎么做？UIUC最新《图上大型语言模型》综述，详述LLM在图上作为预测器、编码器和对齐器的技术

专知会员服务

67+阅读 · 2023年12月7日

大模型和图如何结合？最新《图遇见大型语言模型》综述，详述最新进展

大模型和图如何结合？最新《图遇见大型语言模型》综述，详述最新进展

专知会员服务

81+阅读 · 2023年11月25日

图怎么用强化学习？东北大学最新《图强化学习》综述论文，54页pdf阐述GRL方法、数据与应用

图怎么用强化学习？东北大学最新《图强化学习》综述论文，54页pdf阐述GRL方法、数据与应用

专知

12+阅读 · 2022年4月14日

【微软ICLR2020提交论文】多模态预训练表示UNITER：通用图像-文本语言表示学习

【微软ICLR2020提交论文】多模态预训练表示UNITER：通用图像-文本语言表示学习

专知

50+阅读 · 2019年10月20日

图卷积神经网络(GCN)文本分类详述

图卷积神经网络(GCN)文本分类详述

专知

280+阅读 · 2019年4月5日

【GitHub项目推荐】文本分类最好的几个深度学习方法 TensorFlow 实践

【GitHub项目推荐】文本分类最好的几个深度学习方法 TensorFlow 实践

专知

39+阅读 · 2018年11月27日

动态可视化指南：一步步拆解LSTM和GRU

动态可视化指南：一步步拆解LSTM和GRU

论智

17+阅读 · 2018年10月25日

ML通用指南：文本分类详细教程（上）

ML通用指南：文本分类详细教程（上）

论智

19+阅读 · 2018年7月29日

基于深度学习的文本分类6大算法-原理、结构、论文、源码打包分享

基于深度学习的文本分类6大算法-原理、结构、论文、源码打包分享

深度学习与NLP

25+阅读 · 2018年7月18日

深度学习文本分类方法综述（代码）

深度学习文本分类方法综述（代码）

中国人工智能学会

28+阅读 · 2018年6月16日

【论文笔记】用图卷积网络( GCN)来做语义角色标注

【论文笔记】用图卷积网络( GCN)来做语义角色标注

专知

61+阅读 · 2018年5月26日

Tensorflow实战系列：手把手教你使用LSTM进行文本分类（附完整代码）

Tensorflow实战系列：手把手教你使用LSTM进行文本分类（附完整代码）

专知

58+阅读 · 2018年3月31日

基于多源语义表示学习的社交媒体文本属性情感分类研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

多标记文本数据流分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于非独立同分布学习理论的图模型词义消歧及领域适应方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

动态异质大图匹配模型及算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于概率语义分析的多关系图多类标分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于复杂语义的个性化图像集摘要研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于Spark的大图数据最优子模式匹配查询方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

随机文法作为通用统计模型的扩展

国家自然科学基金

1+阅读 · 2015年12月31日

基于概率图的文本检索模型及算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

Formalizing and Mitigating Structural Distortion in LLM Attention for Graph Reasoning

Arxiv

0+阅读 · 6月17日

Formalizing and Mitigating Structural Distortion in LLM Attention for Zero-Shot Graph Reasoning

Arxiv

0+阅读 · 6月14日

Integrating Reasoning and Generalization in Text-to-SQL via Self-Enhanced Fine-Tuning

Arxiv

0+阅读 · 6月14日

GraphInfer-Bench: Benchmarking LLM's Inference Capability on Graphs

Arxiv

0+阅读 · 6月10日

LLMs+Graphs: Toward Graph-Native, Synergistic AI Systems

Arxiv

0+阅读 · 6月10日

ERAlign: Energy-based Representation Alignment of GNNs and LLMs on Text-attributed Graphs

Arxiv

0+阅读 · 6月9日

A Methodological Guide on Using Large Language Models for Reproducible Text Annotation in the Social Sciences and Humanities with Python and R

Arxiv

0+阅读 · 5月27日

GraphInstruct: A Progressive Benchmark for Diagnosing Capability Gaps in LLM Graph Generation

Arxiv

0+阅读 · 5月19日

GraphOmni: A Comprehensive and Extensible Benchmark Framework for Large Language Models on Graph-theoretic Tasks

Arxiv

0+阅读 · 3月25日

Graph Machine Learning in the Era of Large Language Models (LLMs)

Arxiv

13+阅读 · 2024年4月23日

VIP会员

文章信息

相关主题

最新内容

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

5+阅读 · 今天4:35

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

3+阅读 · 今天4:24

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

3+阅读 · 今天4:18

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 今天4:15

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 今天4:08

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

7+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

7+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

7+阅读 · 7月31日

“史诗怒火”行动：现代多域作战的重要节点

“史诗怒火”行动：现代多域作战的重要节点

专知会员服务

8+阅读 · 7月30日

《下一代无线网络中的多无人机通信资源管理》

《下一代无线网络中的多无人机通信资源管理》

专知会员服务

8+阅读 · 7月30日

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

专知会员服务

9+阅读 · 7月30日

《人机协同在安全关键型操作决策中的应用》120页

《人机协同在安全关键型操作决策中的应用》120页

专知会员服务

8+阅读 · 7月30日

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

专知会员服务

6+阅读 · 7月30日

相关VIP内容

大型语言模型遇上文本属性图：一种融合框架与应用的综述

大型语言模型遇上文本属性图：一种融合框架与应用的综述

专知会员服务

10+阅读 · 2025年10月27日

大型语言模型（LLM）赋能的知识图谱构建：综述

大型语言模型（LLM）赋能的知识图谱构建：综述

专知会员服务

56+阅读 · 2025年10月24日

【新书】设计大型语言模型应用：一种面向LLMs的整体方法

【新书】设计大型语言模型应用：一种面向LLMs的整体方法

专知会员服务

56+阅读 · 2025年3月16日

带入您自己的知识：大型语言模型（LLM）知识扩展方法综述

带入您自己的知识：大型语言模型（LLM）知识扩展方法综述

专知会员服务

38+阅读 · 2025年2月21日

【CIKM2024】LLM蒸馏到GNN，性能提升6.2%！Emory提出大模型蒸馏到文本图｜CIKM 2024

【CIKM2024】LLM蒸馏到GNN，性能提升6.2%！Emory提出大模型蒸馏到文本图｜CIKM 2024

专知会员服务

23+阅读 · 2024年8月22日

图+大模型如何结合？港理工最新《大语言模型（LLMs）时代的图机器学习》综述

图+大模型如何结合？港理工最新《大语言模型（LLMs）时代的图机器学习》综述

专知会员服务

58+阅读 · 2024年4月24日

【WWW2024】GNN能成为LLMs的良好适配器吗？

【WWW2024】GNN能成为LLMs的良好适配器吗？

专知会员服务

35+阅读 · 2024年2月24日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

111+阅读 · 2023年12月19日

图上大模型怎么做？UIUC最新《图上大型语言模型》综述，详述LLM在图上作为预测器、编码器和对齐器的技术

图上大模型怎么做？UIUC最新《图上大型语言模型》综述，详述LLM在图上作为预测器、编码器和对齐器的技术

专知会员服务

67+阅读 · 2023年12月7日

大模型和图如何结合？最新《图遇见大型语言模型》综述，详述最新进展

大模型和图如何结合？最新《图遇见大型语言模型》综述，详述最新进展

专知会员服务

81+阅读 · 2023年11月25日

热门VIP内容

开通专知VIP会员享更多权益服务

隐身技术前沿综述：物理机理、工程实践与战略展望

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

相关资讯

图怎么用强化学习？东北大学最新《图强化学习》综述论文，54页pdf阐述GRL方法、数据与应用

图怎么用强化学习？东北大学最新《图强化学习》综述论文，54页pdf阐述GRL方法、数据与应用

专知

12+阅读 · 2022年4月14日

【微软ICLR2020提交论文】多模态预训练表示UNITER：通用图像-文本语言表示学习

【微软ICLR2020提交论文】多模态预训练表示UNITER：通用图像-文本语言表示学习

专知

50+阅读 · 2019年10月20日

图卷积神经网络(GCN)文本分类详述

图卷积神经网络(GCN)文本分类详述

专知

280+阅读 · 2019年4月5日

【GitHub项目推荐】文本分类最好的几个深度学习方法 TensorFlow 实践

【GitHub项目推荐】文本分类最好的几个深度学习方法 TensorFlow 实践

专知

39+阅读 · 2018年11月27日

动态可视化指南：一步步拆解LSTM和GRU

动态可视化指南：一步步拆解LSTM和GRU

论智

17+阅读 · 2018年10月25日

ML通用指南：文本分类详细教程（上）

ML通用指南：文本分类详细教程（上）

论智

19+阅读 · 2018年7月29日

基于深度学习的文本分类6大算法-原理、结构、论文、源码打包分享

基于深度学习的文本分类6大算法-原理、结构、论文、源码打包分享

深度学习与NLP

25+阅读 · 2018年7月18日

深度学习文本分类方法综述（代码）

深度学习文本分类方法综述（代码）

中国人工智能学会

28+阅读 · 2018年6月16日

【论文笔记】用图卷积网络( GCN)来做语义角色标注

【论文笔记】用图卷积网络( GCN)来做语义角色标注

专知

61+阅读 · 2018年5月26日

Tensorflow实战系列：手把手教你使用LSTM进行文本分类（附完整代码）

Tensorflow实战系列：手把手教你使用LSTM进行文本分类（附完整代码）

专知

58+阅读 · 2018年3月31日

相关论文

Formalizing and Mitigating Structural Distortion in LLM Attention for Graph Reasoning

Arxiv

0+阅读 · 6月17日

Formalizing and Mitigating Structural Distortion in LLM Attention for Zero-Shot Graph Reasoning

Arxiv

0+阅读 · 6月14日

Integrating Reasoning and Generalization in Text-to-SQL via Self-Enhanced Fine-Tuning

Arxiv

0+阅读 · 6月14日

GraphInfer-Bench: Benchmarking LLM's Inference Capability on Graphs

Arxiv

0+阅读 · 6月10日

LLMs+Graphs: Toward Graph-Native, Synergistic AI Systems

Arxiv

0+阅读 · 6月10日

ERAlign: Energy-based Representation Alignment of GNNs and LLMs on Text-attributed Graphs

Arxiv

0+阅读 · 6月9日

A Methodological Guide on Using Large Language Models for Reproducible Text Annotation in the Social Sciences and Humanities with Python and R

Arxiv

0+阅读 · 5月27日

GraphInstruct: A Progressive Benchmark for Diagnosing Capability Gaps in LLM Graph Generation

Arxiv

0+阅读 · 5月19日

GraphOmni: A Comprehensive and Extensible Benchmark Framework for Large Language Models on Graph-theoretic Tasks

Arxiv

0+阅读 · 3月25日

Graph Machine Learning in the Era of Large Language Models (LLMs)

Arxiv

13+阅读 · 2024年4月23日

相关基金

基于多源语义表示学习的社交媒体文本属性情感分类研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

多标记文本数据流分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于非独立同分布学习理论的图模型词义消歧及领域适应方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

动态异质大图匹配模型及算法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于概率语义分析的多关系图多类标分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于复杂语义的个性化图像集摘要研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于Spark的大图数据最优子模式匹配查询方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

随机文法作为通用统计模型的扩展

国家自然科学基金

1+阅读 · 2015年12月31日

基于概率图的文本检索模型及算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员