Towards Foundation Models for Relational Databases with Language Models and Graph Neural Networks - 专知论文

会员服务 ·

0

数据库 · 关系数据 · 基座模型 · 融合 · GNN ·

Towards Foundation Models for Relational Databases with Language Models and Graph Neural Networks

翻译：面向关系数据库的基座模型：语言模型与图神经网络的融合

Jingcheng Wu,Ratan Bahadur Thapa,Mojtaba Nayyeri,Lucas Etteldorf,Max Finkenbeiner,Fabian Leeske,Steffen Staab

from arxiv, 15 pages, 7 figures, 4 tables. Preprint of a paper accepted at the 1st Workshop on Extraction from Triplet Text-Table-Knowledge Graph and associated Challenge (TRIPLET), co-located with ESWC 2026

Relational databases store much of the world's structured information, and they are essential for driving complex predictive applications. However, deep learning progress on relational data remains limited, as conventional approaches flatten databases into single tables via manual feature engineering, discarding relational context. Relational deep learning (RDL) addresses this by modeling databases as relational entity graphs (REGs) for graph neural networks (GNNs), but remains task- and database-specific. To combine the strengths of both paradigms, we propose a hybrid architecture combining a fine-tuned BART encoder to capture intra-row semantics with a GraphSAGE-based GNN over REGs to inject relational context. Experiments on RelBench show that the GNN substantially enriches BART's row embeddings, achieving a ROC-AUC of 67.40 on the driver-dnf task from the rel-f1 dataset. This performance is competitive with supervised baselines such as LightGBM (68.86) and narrows the gap to RDL (72.62) to within 5.22 points, though a substantial gap remains to state-of-the-art foundation models such as KumoRFM (82.63). These results suggest that lightweight hybrid LM-GNN architectures offer a promising and resource-efficient path towards foundation models for relational databases.

翻译：关系数据库存储了全球大部分结构化信息，是驱动复杂预测应用的关键。然而，深度学习在关系数据上的进展仍然有限，因为传统方法通过手动特征工程将数据库扁平化为单一表格，丢弃了关系上下文。关系深度学习通过将数据库建模为关系实体图，用于图神经网络，解决了这一问题，但仍局限于特定任务和数据库。为融合两种范式的优势，我们提出一种混合架构，结合微调后的BART编码器捕获行内语义，以及基于GraphSAGE的GNN在关系实体图上注入关系上下文。在RelBench上的实验表明，GNN显著丰富了BART的行嵌入，在rel-f1数据集的driver-dnf任务上实现了67.40的ROC-AUC。该性能与LightGBM（68.86）等监督基线相当，并将与关系深度学习的差距缩小至5.22分以内，但仍与KumoRFM（82.63）等最先进的基座模型存在显著差距。这些结果表明，轻量级混合LM-GNN架构为构建关系数据库基座模型提供了一条有前景且资源高效的路径。

0

相关内容

数据库

数据库( Database )或数据库管理系统( Database management systems )是按照数据结构来组织、存储和管理数据的仓库。目前数据管理不再仅仅是存储和管理数据，而转变成用户所需要的各种数据管理的方式。

图数据库综述

图数据库综述

专知会员服务

18+阅读 · 2025年6月2日

图基础模型：全面综述

图基础模型：全面综述

专知会员服务

38+阅读 · 2025年5月22日

图与基础模型：多模态基础模型关系推理能力概述

图与基础模型：多模态基础模型关系推理能力概述

专知会员服务

30+阅读 · 2023年12月23日

什么是关系深度学习？斯坦福Jure Leskovec《关系深度学习：关系数据库上的图表示学习》最新报告与论文

什么是关系深度学习？斯坦福Jure Leskovec《关系深度学习：关系数据库上的图表示学习》最新报告与论文

专知会员服务

36+阅读 · 2023年11月30日

什么神经图数据库？斯坦福Renhongyu博士论文《神经图数据库研究》，207页pdf详述神经图查询技术

什么神经图数据库？斯坦福Renhongyu博士论文《神经图数据库研究》，207页pdf详述神经图查询技术

专知会员服务

47+阅读 · 2023年9月6日

「图神经网络GNN:模型与应用」最新SDM2021-Tutorial，附视频与203页ppt

专知会员服务

93+阅读 · 2021年5月1日

【AAAI2021-Tutorial】图神经网络GNN:模型与应用，附视频与291页ppt

【AAAI2021-Tutorial】图神经网络GNN:模型与应用，附视频与291页ppt

专知会员服务

178+阅读 · 2021年2月6日

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

专知会员服务

137+阅读 · 2020年7月29日

具有组合核的图神经网络，Graph Neural Networks with Composite Kernels

具有组合核的图神经网络，Graph Neural Networks with Composite Kernels

专知会员服务

59+阅读 · 2020年5月20日

【剑桥大学博士论文】深层神经网络结构的复兴，147页pdf，The resurgence of structure in deep neural networks

【剑桥大学博士论文】深层神经网络结构的复兴，147页pdf，The resurgence of structure in deep neural networks

专知会员服务

20+阅读 · 2020年5月14日

基于深度学习的数据融合方法研究综述

基于深度学习的数据融合方法研究综述

专知

37+阅读 · 2020年12月10日

基于图神经网络的知识图谱研究进展

基于图神经网络的知识图谱研究进展

AI科技评论

21+阅读 · 2020年8月31日

神经网络图的简介（基本概念，DeepWalk以及GraphSage算法）

神经网络图的简介（基本概念，DeepWalk以及GraphSage算法）

AI研习社

12+阅读 · 2019年3月5日

图神经网络综述：模型与应用

图神经网络综述：模型与应用

PaperWeekly

198+阅读 · 2018年12月26日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

图神经网络最近这么火，不妨看看我们精选的这七篇

图神经网络最近这么火，不妨看看我们精选的这七篇

人工智能前沿讲习班

37+阅读 · 2018年12月10日

大讲堂 | 神经关系抽取模型

大讲堂 | 神经关系抽取模型

AI研习社

24+阅读 · 2018年9月11日

【深度学习基础】4. Recurrent Neural Networks

【深度学习基础】4. Recurrent Neural Networks

微信AI

16+阅读 · 2017年7月19日

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

机器人圈

35+阅读 · 2017年7月18日

干货｜基于图卷积网络的图深度学习

干货｜基于图卷积网络的图深度学习

DataCanvas大数据云平台

10+阅读 · 2017年6月8日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

基于深度卷积神经网络的多源遥感图像时空融合方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向异构数据库的查询语言设计及其基础理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

面向多源遥感图像的深度学习技术与系统研究

国家自然科学基金

17+阅读 · 2014年12月31日

新型统计模型在精神疾病的基因、脑影像和行为数据整合中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

Mapping Scientific Literature with Large Language Models and Topic Modeling

Arxiv

0+阅读 · 6月9日

Rel-MOSS: Towards Imbalanced Relational Deep Learning on Relational Databases

Arxiv

0+阅读 · 5月28日

Is Fixing Schema Graphs Necessary? Full-Resolution Graph Structure Learning for Relational Deep Learning

Arxiv

0+阅读 · 5月20日

Neural Network Models for Contextual Regression

Arxiv

0+阅读 · 5月19日

Expressive Power of Deep Homomorphism Networks over Relational Databases

Arxiv

0+阅读 · 5月18日

From Schema to Signal: Retrieval-Augmented Modeling for Relational Data Analytics

Arxiv

0+阅读 · 5月14日

Survey on Trustworthy Graph Neural Networks: From A Causal Perspective

Arxiv

10+阅读 · 2023年12月19日

A Review and Roadmap of Deep Causal Model from Different Causal Structures and Representations

Arxiv

13+阅读 · 2023年11月2日

Deep Model Fusion: A Survey

Arxiv

14+阅读 · 2023年9月27日

Graph Neural Networks for Text Classification: A Survey

Arxiv

34+阅读 · 2023年4月27日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

2+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

4+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

7+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

4+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

6+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

5+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

3+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

8+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

6+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

9+阅读 · 6月22日

相关VIP内容

图数据库综述

图数据库综述

专知会员服务

18+阅读 · 2025年6月2日

图基础模型：全面综述

图基础模型：全面综述

专知会员服务

38+阅读 · 2025年5月22日

图与基础模型：多模态基础模型关系推理能力概述

图与基础模型：多模态基础模型关系推理能力概述

专知会员服务

30+阅读 · 2023年12月23日

什么是关系深度学习？斯坦福Jure Leskovec《关系深度学习：关系数据库上的图表示学习》最新报告与论文

什么是关系深度学习？斯坦福Jure Leskovec《关系深度学习：关系数据库上的图表示学习》最新报告与论文

专知会员服务

36+阅读 · 2023年11月30日

什么神经图数据库？斯坦福Renhongyu博士论文《神经图数据库研究》，207页pdf详述神经图查询技术

什么神经图数据库？斯坦福Renhongyu博士论文《神经图数据库研究》，207页pdf详述神经图查询技术

专知会员服务

47+阅读 · 2023年9月6日

「图神经网络GNN:模型与应用」最新SDM2021-Tutorial，附视频与203页ppt

专知会员服务

93+阅读 · 2021年5月1日

【AAAI2021-Tutorial】图神经网络GNN:模型与应用，附视频与291页ppt

【AAAI2021-Tutorial】图神经网络GNN:模型与应用，附视频与291页ppt

专知会员服务

178+阅读 · 2021年2月6日

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

最新《图神经网络知识图谱补全综述论文》A Survey on Graph Neural Networks for Knowledge Graph Completion

专知会员服务

137+阅读 · 2020年7月29日

具有组合核的图神经网络，Graph Neural Networks with Composite Kernels

具有组合核的图神经网络，Graph Neural Networks with Composite Kernels

专知会员服务

59+阅读 · 2020年5月20日

【剑桥大学博士论文】深层神经网络结构的复兴，147页pdf，The resurgence of structure in deep neural networks

【剑桥大学博士论文】深层神经网络结构的复兴，147页pdf，The resurgence of structure in deep neural networks

专知会员服务

20+阅读 · 2020年5月14日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

基于深度学习的数据融合方法研究综述

基于深度学习的数据融合方法研究综述

专知

37+阅读 · 2020年12月10日

基于图神经网络的知识图谱研究进展

基于图神经网络的知识图谱研究进展

AI科技评论

21+阅读 · 2020年8月31日

神经网络图的简介（基本概念，DeepWalk以及GraphSage算法）

神经网络图的简介（基本概念，DeepWalk以及GraphSage算法）

AI研习社

12+阅读 · 2019年3月5日

图神经网络综述：模型与应用

图神经网络综述：模型与应用

PaperWeekly

198+阅读 · 2018年12月26日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

图神经网络最近这么火，不妨看看我们精选的这七篇

图神经网络最近这么火，不妨看看我们精选的这七篇

人工智能前沿讲习班

37+阅读 · 2018年12月10日

大讲堂 | 神经关系抽取模型

大讲堂 | 神经关系抽取模型

AI研习社

24+阅读 · 2018年9月11日

【深度学习基础】4. Recurrent Neural Networks

【深度学习基础】4. Recurrent Neural Networks

微信AI

16+阅读 · 2017年7月19日

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

孪生网络实现小数据学习！看神经网络如何找出两张图片的相似点

机器人圈

35+阅读 · 2017年7月18日

干货｜基于图卷积网络的图深度学习

干货｜基于图卷积网络的图深度学习

DataCanvas大数据云平台

10+阅读 · 2017年6月8日

相关论文

Mapping Scientific Literature with Large Language Models and Topic Modeling

Arxiv

0+阅读 · 6月9日

Rel-MOSS: Towards Imbalanced Relational Deep Learning on Relational Databases

Arxiv

0+阅读 · 5月28日

Is Fixing Schema Graphs Necessary? Full-Resolution Graph Structure Learning for Relational Deep Learning

Arxiv

0+阅读 · 5月20日

Neural Network Models for Contextual Regression

Arxiv

0+阅读 · 5月19日

Expressive Power of Deep Homomorphism Networks over Relational Databases

Arxiv

0+阅读 · 5月18日

From Schema to Signal: Retrieval-Augmented Modeling for Relational Data Analytics

Arxiv

0+阅读 · 5月14日

Survey on Trustworthy Graph Neural Networks: From A Causal Perspective

Arxiv

10+阅读 · 2023年12月19日

A Review and Roadmap of Deep Causal Model from Different Causal Structures and Representations

Arxiv

13+阅读 · 2023年11月2日

Deep Model Fusion: A Survey

Arxiv

14+阅读 · 2023年9月27日

Graph Neural Networks for Text Classification: A Survey

Arxiv

34+阅读 · 2023年4月27日

相关基金

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

基于深度卷积神经网络的多源遥感图像时空融合方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向异构数据库的查询语言设计及其基础理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

面向多源遥感图像的深度学习技术与系统研究

国家自然科学基金

17+阅读 · 2014年12月31日

新型统计模型在精神疾病的基因、脑影像和行为数据整合中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员