Knowledge graphs (KGs) have become the core backbone of numerous downstream tasks such as question answering and recommender systems. However, despite all this, KGs are often very incomplete. To perform zero-shot knowledge graph completion in unseen KGs, which have different relational vocabularies from those used for pre-training, KG foundation models (KGFMs) receive a wide range of attention. Existing KGFMs often perform training using random negative triples, which are constructed by replacing the head or tail entity of a positive triple with a random entity. However, these negative triples are often constructed with limited quality, providing weak supervision for KGFM training. In this paper, we propose a simple yet effective adaptive negative sampling approach, KMAS, to enhance existing KGFMs. KMAS constructs hard negative triples through the updated relation embeddings generated from the existing KGFM's relation encoder. To further adaptively align with the evolving capability of the KGFM during the training process, KMAS adjusts the ratio of hard negative triples dynamically throughout the whole training process: after a warmup phrase, it increases the ratio linearly and then decreases linearly. Extensive experiments are conducted over 44 data sets. Experimental results demonstrate that our proposed negative sampling method can enhance many SOTA KGFMs without requiring excessive additional time or memory consumption.


翻译:知识图谱已成为问答、推荐系统等众多下游任务的核心支撑。然而尽管如此,知识图谱通常非常不完整。为了在未见过的知识图谱(这些图谱的关系词汇与预训练所用不同)中执行零样本知识图谱补全,知识图谱基础模型受到了广泛关注。现有知识图谱基础模型通常使用随机负三元组进行训练,这些负三元组通过替换正三元组的头实体或尾实体为随机实体构建而成。然而,这些负三元组质量有限,为知识图谱基础模型训练提供的监督信号较弱。本文提出一种简单而有效的自适应负采样方法KMAS,用于增强现有知识图谱基础模型。KMAS通过从现有知识图谱基础模型关系编码器生成的更新关系嵌入构建困难负三元组。为进一步自适应地配合训练过程中知识图谱基础模型不断演进的能力,KMAS在整个训练过程中动态调整困难负三元组的比例:经过预热阶段后,该比例先线性增加再线性减少。我们在44个数据集上开展了广泛实验。实验结果表明,所提出的负采样方法能在不显著增加额外时间或内存消耗的情况下增强多种最先进知识图谱基础模型。

0
下载
关闭预览

相关内容

知识图谱基础模型的数学基础
专知会员服务
41+阅读 · 2025年1月12日
基于强化学习的知识图谱综述
专知会员服务
205+阅读 · 2022年8月20日
面向知识图谱的图嵌入学习研究进展
专知会员服务
61+阅读 · 2021年11月3日
最新《知识图谱表示学习补全》综述论文,16页pdf
专知会员服务
68+阅读 · 2020年10月29日
最新《图神经网络知识图谱补全》综述论文
专知会员服务
158+阅读 · 2020年7月29日
「知识增强预训练语言模型」最新研究综述
专知
18+阅读 · 2022年11月18日
大讲堂 | 知识图谱的嵌入:更好更快的负采样
AI研习社
13+阅读 · 2019年3月6日
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
4+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
6+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
3+阅读 · 6月17日
相关基金
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员