Relational databases store much of the world's structured information, and they are essential for driving complex predictive applications. However, deep learning progress on relational data remains limited, as conventional approaches flatten databases into single tables via manual feature engineering, discarding relational context. Relational deep learning (RDL) addresses this by modeling databases as relational entity graphs (REGs) for graph neural networks (GNNs), but remains task- and database-specific. To combine the strengths of both paradigms, we propose a hybrid architecture combining a fine-tuned BART encoder to capture intra-row semantics with a GraphSAGE-based GNN over REGs to inject relational context. Experiments on RelBench show that the GNN substantially enriches BART's row embeddings, achieving a ROC-AUC of 67.40 on the driver-dnf task from the rel-f1 dataset. This performance is competitive with supervised baselines such as LightGBM (68.86) and narrows the gap to RDL (72.62) to within 5.22 points, though a substantial gap remains to state-of-the-art foundation models such as KumoRFM (82.63). These results suggest that lightweight hybrid LM-GNN architectures offer a promising and resource-efficient path towards foundation models for relational databases.


翻译:关系数据库存储了全球大部分结构化信息,是驱动复杂预测应用的关键。然而,深度学习在关系数据上的进展仍然有限,因为传统方法通过手动特征工程将数据库扁平化为单一表格,丢弃了关系上下文。关系深度学习通过将数据库建模为关系实体图,用于图神经网络,解决了这一问题,但仍局限于特定任务和数据库。为融合两种范式的优势,我们提出一种混合架构,结合微调后的BART编码器捕获行内语义,以及基于GraphSAGE的GNN在关系实体图上注入关系上下文。在RelBench上的实验表明,GNN显著丰富了BART的行嵌入,在rel-f1数据集的driver-dnf任务上实现了67.40的ROC-AUC。该性能与LightGBM(68.86)等监督基线相当,并将与关系深度学习的差距缩小至5.22分以内,但仍与KumoRFM(82.63)等最先进的基座模型存在显著差距。这些结果表明,轻量级混合LM-GNN架构为构建关系数据库基座模型提供了一条有前景且资源高效的路径。

0
下载
关闭预览

相关内容

数据库( Database )或数据库管理系统( Database management systems )是按照数据结构来组织、存储和管理数据的仓库。目前数据管理不再仅仅是存储和管理数据,而转变成用户所需要的各种数据管理的方式。
图数据库综述
专知会员服务
18+阅读 · 2025年6月2日
图基础模型:全面综述
专知会员服务
38+阅读 · 2025年5月22日
图与基础模型:多模态基础模型关系推理能力概述
专知会员服务
30+阅读 · 2023年12月23日
基于深度学习的数据融合方法研究综述
专知
37+阅读 · 2020年12月10日
基于图神经网络的知识图谱研究进展
AI科技评论
21+阅读 · 2020年8月31日
图神经网络综述:模型与应用
PaperWeekly
198+阅读 · 2018年12月26日
深度学习时代的图模型,清华发文综述图网络
GAN生成式对抗网络
13+阅读 · 2018年12月23日
图神经网络最近这么火,不妨看看我们精选的这七篇
人工智能前沿讲习班
37+阅读 · 2018年12月10日
大讲堂 | 神经关系抽取模型
AI研习社
24+阅读 · 2018年9月11日
【深度学习基础】4. Recurrent Neural Networks
微信AI
16+阅读 · 2017年7月19日
干货|基于图卷积网络的图深度学习
DataCanvas大数据云平台
10+阅读 · 2017年6月8日
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2014年12月31日
Arxiv
14+阅读 · 2023年9月27日
VIP会员
最新内容
综述 | 世界动作模型:少做梦,多行动
专知会员服务
4+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
7+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
4+阅读 · 6月23日
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关资讯
基于深度学习的数据融合方法研究综述
专知
37+阅读 · 2020年12月10日
基于图神经网络的知识图谱研究进展
AI科技评论
21+阅读 · 2020年8月31日
图神经网络综述:模型与应用
PaperWeekly
198+阅读 · 2018年12月26日
深度学习时代的图模型,清华发文综述图网络
GAN生成式对抗网络
13+阅读 · 2018年12月23日
图神经网络最近这么火,不妨看看我们精选的这七篇
人工智能前沿讲习班
37+阅读 · 2018年12月10日
大讲堂 | 神经关系抽取模型
AI研习社
24+阅读 · 2018年9月11日
【深度学习基础】4. Recurrent Neural Networks
微信AI
16+阅读 · 2017年7月19日
干货|基于图卷积网络的图深度学习
DataCanvas大数据云平台
10+阅读 · 2017年6月8日
相关基金
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员