With the increasing use of RDF graphs, storing and querying such data using SPARQL remains a critical problem. Current mainstream solutions rely on cloud-based data management architectures, but often suffer from performance bottlenecks in environments with limited bandwidth or high system load. To address this issue, this paper explores for the first time the integration of edge computing to move graph data storage and processing to edge environments, thereby improving query performance. This approach requires offloading query processing to edge servers, which involves addressing two challenges: data localization and network scheduling. First, the data localization challenge lies in computing the subgraphs maintained on edge servers to quickly identify the servers that can handle specific queries. To address this challenge, we introduce a new concept of pattern-induced subgraphs. Second, the network scheduling challenge involves efficiently assigning queries to edge and cloud servers to optimize overall system performance. We tackle this by constructing a overall system model that jointly captures data distribution, query characteristics, network communication, and computational resources. Accordingly, we further propose a joint formulation of query assignment and computational resource allocation, modeling it as a Mixed Integer Nonlinear Programming (MINLP) problem and solve this problem using a modified branch-and-bound algorithm. Experimental results on real datasets under a real cloud platform demonstrate that our proposed method outperforms the state-of-the-art baseline methods in terms of efficiency. The codes are available on GitHub


翻译:随着RDF图的日益广泛应用,基于SPARQL的数据存储与查询仍是关键难题。当前主流解决方案依赖云端数据管理架构,但在带宽受限或系统负载较高的环境中常面临性能瓶颈。为应对这一问题,本文首次探索通过边缘计算集成将图数据存储与处理迁移至边缘环境,从而提升查询性能。该方法需将查询处理卸载至边缘服务器,这涉及两个核心挑战:数据本地化与网络调度。首先,数据本地化挑战在于计算边缘服务器维护的子图,以快速识别能够处理特定查询的服务器。为此,我们引入了模式诱导子图的新概念。其次,网络调度挑战涉及如何高效地将查询分配至边缘与云端服务器以优化整体系统性能。我们通过构建一个统一系统模型来解决该问题,该模型同时涵盖数据分布、查询特征、网络通信与计算资源。基于此,我们进一步提出查询分配与计算资源分配的联合建模方案,将其表述为混合整数非线性规划问题,并采用改进的分支定界算法进行求解。在真实云平台环境下基于实际数据集的实验表明,所提方法在效率方面优于当前最先进的基准方法。相关代码已在GitHub开源。

0
下载
关闭预览

相关内容

《面向边缘AI应用的高性能高能效架构探索》156页
专知会员服务
34+阅读 · 2025年4月12日
大规模图神经网络研究综述
专知会员服务
85+阅读 · 2023年8月25日
字节跳动自研万亿级图数据库ByteGraph及其应用与挑战
专知会员服务
32+阅读 · 2022年6月1日
北大邹磊:图数据库中的子图匹配算法
专知会员服务
21+阅读 · 2022年4月21日
面向端边云协同架构的区块链技术综述
专知会员服务
49+阅读 · 2021年12月24日
《“边缘计算+”技术白皮书》,82页pdf
专知
11+阅读 · 2022年8月28日
基于MySQL Binlog的Elasticsearch数据同步实践
DBAplus社群
15+阅读 · 2019年9月3日
边缘计算应用:传感数据异常实时检测算法
计算机研究与发展
11+阅读 · 2018年4月10日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员