Datasets for the experimental evaluation of knowledge graph refinement algorithms typically contain only ground facts, retaining very limited schema level knowledge even when such information is available in the source knowledge graphs. This limits the evaluation of methods that rely on rich ontological constraints, reasoning or neurosymbolic techniques and ultimately prevents assessing their performance in large-scale, real-world knowledge graphs. In this paper, we present \resource{} the first resource that provides a workflow for extracting datasets including both schema and ground facts, ready for machine learning and reasoning services, along with the resulting curated suite of datasets. The workflow also handles inconsistencies detected when keeping both schema and facts and also leverage reasoning for entailing implicit knowledge. The suite includes newly extracted datasets from KGs with expressive schemas while simultaneously enriching existing datasets with schema information. Each dataset is serialized in OWL making it ready for reasoning services. Moreover, we provide utilities for loading datasets in tensor representations typical of standard machine learning libraries.


翻译:知识图谱精化算法的实验评估数据集通常仅包含事实性知识,即使源知识图谱中存在模式层面的信息,也仅保留极其有限的模式知识。这限制了依赖丰富本体约束、推理或神经符号技术的方法评估,并最终阻碍了在大规模真实世界知识图谱中评估其性能。本文提出\resource{}——首个提供包含模式与事实的完整数据集提取流程的资源,该流程同时产出经过系统整理的成套数据集,可直接用于机器学习与推理服务。该工作流能够处理同时保留模式与事实时检测到的不一致性问题,并利用推理机制推导隐含知识。该数据集套件既包含从具有丰富表达模式的知识图谱中新提取的数据集,同时也为现有数据集补充了模式信息。每个数据集均以OWL格式序列化,可直接用于推理服务。此外,我们提供了将数据集加载为典型机器学习库所需张量表示的工具集。

0
下载
关闭预览

相关内容

知识图谱基础模型的数学基础
专知会员服务
41+阅读 · 2025年1月12日
多模态知识图谱表示学习综述
专知会员服务
72+阅读 · 2024年7月4日
时序知识图谱表示学习
专知会员服务
154+阅读 · 2022年9月17日
基于强化学习的知识图谱综述
专知会员服务
205+阅读 · 2022年8月20日
最新《知识图谱表示学习补全》综述论文,16页pdf
专知会员服务
68+阅读 · 2020年10月29日
基于知识图谱的问答系统
PaperWeekly
21+阅读 · 2021年2月8日
基于图神经网络的知识图谱研究进展
AI科技评论
21+阅读 · 2020年8月31日
知识图谱的行业落地实现
竹间智能Emotibot
51+阅读 · 2019年9月16日
如何独立实现一个基于知识图谱的问答系统
PaperWeekly
11+阅读 · 2019年6月13日
【知识图谱】从知识工程到知识图谱全面回顾
产业智能官
20+阅读 · 2019年5月31日
如何将知识图谱特征学习应用到推荐系统?
人工智能头条
12+阅读 · 2018年6月10日
综述 | 知识图谱向量化表示
PaperWeekly
19+阅读 · 2017年10月25日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Arxiv
181+阅读 · 2023年3月24日
VIP会员
相关资讯
基于知识图谱的问答系统
PaperWeekly
21+阅读 · 2021年2月8日
基于图神经网络的知识图谱研究进展
AI科技评论
21+阅读 · 2020年8月31日
知识图谱的行业落地实现
竹间智能Emotibot
51+阅读 · 2019年9月16日
如何独立实现一个基于知识图谱的问答系统
PaperWeekly
11+阅读 · 2019年6月13日
【知识图谱】从知识工程到知识图谱全面回顾
产业智能官
20+阅读 · 2019年5月31日
如何将知识图谱特征学习应用到推荐系统?
人工智能头条
12+阅读 · 2018年6月10日
综述 | 知识图谱向量化表示
PaperWeekly
19+阅读 · 2017年10月25日
相关基金
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员