As one of the most fundamental problems in graph processing, the Single-Source Shortest Path (SSSP) problem plays a critical role in numerous application scenarios. However, existing GPU-based solutions remain inefficient, as they typically rely on a single, fixed queue design that incurs severe synchronization overhead, high memory latency, and poor adaptivity to diverse inputs. To address these inefficiencies, we propose MultiLevelMultiQueue (MLMQ), a novel data structure that distributes multiple queues across the GPU's multi-level parallelism and memory hierarchy. To realize MLMQ, we introduce a cache-like collaboration mechanism for efficient inter-queue coordination, and develop a modular queue design based on unified Read and Write primitives. Within this framework, we expand the optimization space by designing a set of GPU-friendly queues, composing them across multiple levels, and further providing an input-adaptive MLMQ configuration scheme. Our MLMQ design achieves average speedups of 1.87x to 17.13x over state-of-the-art implementations. Our code is open-sourced at https://github.com/Leo9660/MLMQ.git.


翻译:作为图处理中最基本的问题之一,单源最短路径(SSSP)问题在众多应用场景中扮演着关键角色。然而,现有的基于GPU的解决方案效率仍然低下,因为它们通常依赖于单一、固定的队列设计,导致严重的同步开销、高内存延迟以及对多样化输入的适应性差。为解决这些低效问题,我们提出了多级多队列(MLMQ),这是一种新颖的数据结构,它将多个队列分布在GPU的多级并行性和内存层次结构中。为实现MLMQ,我们引入了一种类似缓存的协作机制以实现高效的队列间协调,并开发了一种基于统一读写原语的模块化队列设计。在此框架内,我们通过设计一组GPU友好的队列、在多个级别上组合它们,并进一步提供一种输入自适应的MLMQ配置方案,从而扩展了优化空间。我们的MLMQ设计相比最先进的实现,平均加速比达到1.87倍至17.13倍。我们的代码已在https://github.com/Leo9660/MLMQ.git开源。

0
下载
关闭预览

相关内容

设计是对现有状的一种重新认识和打破重组的过程,设计让一切变得更美。
非Transformer不可?最新《状态空间模型(SSM)》综述
专知会员服务
75+阅读 · 2024年4月16日
面向多GPU的图神经网络训练加速
专知会员服务
24+阅读 · 2023年1月19日
西电TKDE 2021 | 可解释高效的异质图卷积神经网络
专知会员服务
27+阅读 · 2021年11月14日
专知会员服务
41+阅读 · 2021年9月30日
盘点来自工业界的GPU共享方案
计算机视觉life
12+阅读 · 2021年9月2日
最新《图嵌入组合优化》综述论文,40页pdf
标签间相关性在多标签分类问题中的应用
人工智能前沿讲习班
23+阅读 · 2019年6月5日
图卷积网络到底怎么做,这是一份极简的Numpy实现
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
VIP会员
相关VIP内容
非Transformer不可?最新《状态空间模型(SSM)》综述
专知会员服务
75+阅读 · 2024年4月16日
面向多GPU的图神经网络训练加速
专知会员服务
24+阅读 · 2023年1月19日
西电TKDE 2021 | 可解释高效的异质图卷积神经网络
专知会员服务
27+阅读 · 2021年11月14日
专知会员服务
41+阅读 · 2021年9月30日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员