Link Traversal-based Query Processing (ltqp), in which a sparql query is evaluated over a web of documents rather than a single dataset, is often seen as a theoretically interesting yet impractical technique. However, in a time where the hypercentralization of data has increasingly come under scrutiny, a decentralized Web of Data with a simple document-based interface is appealing, as it enables data publishers to control their data and access rights. While ltqp allows evaluating complex queries over such webs, it suffers from performance issues (due to the high number of documents containing data) as well as information quality concerns (due to the many sources providing such documents). In existing ltqp approaches, the burden of finding sources to query is entirely in the hands of the data consumer. In this paper, we argue that to solve these issues, data publishers should also be able to suggest sources of interest and guide the data consumer towards relevant and trustworthy data. We introduce a theoretical framework that enables such guided link traversal and study its properties. We illustrate with a theoretic example that this can improve query results and reduce the number of network requests. We evaluate our proposal experimentally on a virtual linked web with specifications and indeed observe that not just the data quality but also the efficiency of querying improves. Under consideration in Theory and Practice of Logic Programming (TPLP).


翻译:基于链接遍历的查询处理(Link Traversal-based Query Processing, ltqp)通过在文档网络而非单一数据集上执行SPARQL查询,常被视为一项理论上有趣但实用性不足的技术。然而,在数据高度集中化日益受到质疑的当下,采用简单文档接口的分散式数据网络颇具吸引力,因为它能使数据发布者掌控数据及其访问权限。尽管ltqp能在此类网络上评估复杂查询,但该技术面临性能问题(由于包含数据的高文档数量)以及信息质量隐患(由于提供这些文档的来源众多)。在现有ltqp方法中,查找查询来源的负担完全落在数据消费者身上。本文认为,为解决这些问题,数据发布者亦应能够建议感兴趣的数据来源,引导数据消费者获取相关且可信的数据。我们提出了一套可实现此类引导式链接遍历的理论框架,并研究了其性质。通过理论示例说明,该方法能改善查询结果并减少网络请求次数。我们在一个包含规范的虚拟链接网络上通过实验评估了所提方案,实际观察到不仅数据质量得到提升,查询效率也有所改善。本文正在《逻辑编程理论与实践》(Theory and Practice of Logic Programming, TPLP)审稿中。

0
下载
关闭预览

相关内容

《逻辑程序设计理论与实践》是一本国际性的期刊,它发表的论著涵盖了逻辑程序设计的理论与实践。逻辑适用于人工智能和计算机科学的所有领域。逻辑编程是这些领域的基础。其中包括使用逻辑编程的人工智能应用程序、逻辑编程方法、系统规范、分析和验证、归纳逻辑编程、多关系数据挖掘、自然语言处理、知识表示、非单调推理、语义web推理、数据库,实现和架构以及约束逻辑编程。 官网链接:https://www.cambridge.org/core/journals/theory-and-practice-of-logic-programming
【2022新书】高效深度学习,Efficient Deep Learning Book
专知会员服务
128+阅读 · 2022年4月21日
【2020新书】Kafka实战:Kafka in Action,209页pdf
专知会员服务
69+阅读 · 2020年3月9日
强化学习最新教程,17页pdf
专知会员服务
182+阅读 · 2019年10月11日
GNN 新基准!Long Range Graph Benchmark
图与推荐
0+阅读 · 2022年10月18日
浅聊对比学习(Contrastive Learning)
极市平台
3+阅读 · 2022年7月26日
浅聊对比学习(Contrastive Learning)第一弹
PaperWeekly
1+阅读 · 2022年6月10日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
逆强化学习-学习人先验的动机
CreateAMind
16+阅读 · 2019年1月18日
无监督元学习表示学习
CreateAMind
27+阅读 · 2019年1月4日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
NetworkMiner - 网络取证分析工具
黑白之道
16+阅读 · 2018年6月29日
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2023年5月15日
Arxiv
16+阅读 · 2022年11月1日
Arxiv
13+阅读 · 2022年8月16日
Arxiv
19+阅读 · 2020年7月13日
VIP会员
最新内容
ICML 2026 | SARDI:扩散语言模型的自增强检索
专知会员服务
0+阅读 · 今天14:33
长时程具身智能安全综述:机器人操作的跨层分析
《国防领域安全采用大语言模型的战略蓝图》
专知会员服务
2+阅读 · 今天13:55
ICML 2026 | 演化选择的因果建模
专知会员服务
4+阅读 · 6月5日
综述|学习式3D表征最新进展与趋势
专知会员服务
4+阅读 · 6月5日
人工智能重塑威慑:算法优势的兴起
专知会员服务
7+阅读 · 6月5日
AgentOps综述:智能体系统运维框架
专知会员服务
16+阅读 · 6月4日
《美陆军最新条令:兵力防护》
专知会员服务
13+阅读 · 6月4日
相关基金
国家自然科学基金
3+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2010年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员