The initial adoption of knowledge graphs by Google and later by big companies has increased their adoption and popularity. In this paper we present a formal model for three different types of knowledge graphs which we call RDF-based graphs, property graphs and wikibase graphs. In order to increase the quality of Knowledge Graphs, several approaches have appeared to describe and validate their contents. Shape Expressions (ShEx) has been proposed as concise language for RDF validation. We give a brief introduction to ShEx and present two extensions that can also be used to describe and validate property graphs (PShEx) and wikibase graphs (WShEx). One problem of knowledge graphs is the large amount of data they contain, which jeopardizes their practical application. In order to palliate this problem, one approach is to create subsets of those knowledge graphs for some domains. We propose the following approaches to generate those subsets: Entity-matching, simple matching, ShEx matching, ShEx plus Slurp and ShEx plus Pregel which are based on declaratively defining the subsets by either matching some content or by Shape Expressions. The last approach is based on a novel validation algorithm for ShEx based on the Pregel algorithm that can handle big data graphs and has been implemented on Apache Spark GraphX.


翻译:Google和大公司最初采用知识图表的做法提高了它们的采用率和受欢迎度。在本文中,我们为三种不同类型的知识图表提供了一个正式模型,我们称之为RDF的图形、属性图和维基数据库图。为了提高知识图表的质量,似乎有几种方法可以描述和验证其内容。形状表达(ShEx)已被提议为RDF验证的简明语言。我们向 ShEx 简要介绍并提供了两个扩展,这些扩展也可用于描述和验证属性图表(PshEx)和维基数据库图表(WashEx) 。一个知识图表的问题在于它们所包含的大量数据,这危及它们的实际应用。为了勾画这一问题,一种方法是为某些领域创建这些知识图表的子集。我们建议了以下方法来生成这些子集:实体匹配、简单匹配、ShEx匹配、ShEx加Slurrp和ShEx加Pregel,这些扩展也可以用来描述和校验属性图(Pregel)。一个知识图表的问题是它们所包含的数据是大量数据图,它们中含有某些内容,或者由ShapeX Preal Ex 分析算法,这是基于S realalalalalalal的Sligal 进行的最新验证。最后的Sex Ex 和Slippalalalgalalal 。根据一个基于一个基于SHR Ex 和Appalus的Slippalalalalalalalal 。

0
下载
关闭预览

相关内容

【知识图谱@EMNLP2020】Knowledge Graphs in NLP @ EMNLP 2020
专知会员服务
43+阅读 · 2020年11月22日
【知识图谱@ACL2020】Knowledge Graphs in Natural Language Processing
专知会员服务
66+阅读 · 2020年7月12日
因果图,Causal Graphs,52页ppt
专知会员服务
254+阅读 · 2020年4月19日
【电子书】机器学习实战(Machine Learning in Action),附PDF
专知会员服务
132+阅读 · 2019年11月25日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
105+阅读 · 2019年10月9日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
41+阅读 · 2019年10月9日
学术报告|港科大助理教授宋阳秋博士
科技创新与创业
7+阅读 · 2019年7月19日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
已删除
将门创投
5+阅读 · 2018年1月24日
Arxiv
102+阅读 · 2020年3月4日
Arxiv
4+阅读 · 2019年2月8日
Arxiv
8+阅读 · 2018年3月17日
VIP会员
最新内容
超越网格:作战环境对炮兵的影响
专知会员服务
0+阅读 · 今天15:35
KDD 2026 | MixRAGRec:面向LLM推荐的混合专家KG-RAG框架
BES:让语言模型通过双向进化搜索自我改进
专知会员服务
4+阅读 · 5月30日
以色列-美国-伊朗战争中的无人机:关键要点
专知会员服务
4+阅读 · 5月30日
《Palantir任务保障性软件安全标准(MA-S2)》
专知会员服务
14+阅读 · 5月30日
基于声学的无人机检测技术综述
专知会员服务
8+阅读 · 5月30日
《当代混合战争分析框架:俄乌战争经验教训》
相关资讯
学术报告|港科大助理教授宋阳秋博士
科技创新与创业
7+阅读 · 2019年7月19日
Transferring Knowledge across Learning Processes
CreateAMind
29+阅读 · 2019年5月18日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
已删除
将门创投
5+阅读 · 2018年1月24日
Top
微信扫码咨询专知VIP会员