Graph Convolutional Networks (GCNs) are widely adopted for tasks involving relational or graph-structured data and can be formulated as two-stage sparse-dense matrix multiplication (SpMM) during inference. However, existing accelerators often struggle with the irregular workloads induced by power-law node degree distributions. In this work, we propose FlexVector, a vector-processor-based architecture that efficiently accelerates SpMM for GCN inference. To address irregular computation patterns, FlexVector adopts a row-wise, product-based dataflow that regularizes SpMM execution and exposes vector parallelism through full-row access to vector registers, eliminating the need for multi-banked register file designs. Building on this dataflow, it introduces software-managed, flexible vector register files (VRFs) that adapt to irregular data access patterns, without sacrificing memory access efficiency. To further exploit these architectural capabilities, we develop a graph-aware preprocessing and node partitioning strategy that restructures irregular graph workloads to better match the row-wise dataflow and VRF capacity. This hardware-software co-design reduces memory traffic, leading to significant performance and energy efficiency gains on real-world GCN workloads. Experimental results on five real-world GCN datasets show that the VRF-centric FlexVector achieves a 3.78x speedup and 40.5% lower energy at comparable area cost relative to a state-of-the-art cache-centric baseline with buffers of the same size.


翻译:图卷积网络(GCN)被广泛应用于涉及关系型或图结构数据的任务,在推理过程中可形式化为两阶段稀疏-稠密矩阵乘法(SpMM)。然而,现有加速器通常难以应对幂律节点度分布带来的不规则工作负载。本文提出FlexVector——一种基于向量处理器的架构,可高效加速GCN推理中的SpMM计算。为处理不规则计算模式,FlexVector采用面向行、基于乘积的数据流,该数据流通过全行访问向量寄存器以规范化SpMM执行并暴露向量级并行性,从而消除对多存储体寄存器文件设计的需求。基于此数据流,它引入软件可管理的灵活向量寄存器文件(VRF),在保持访存效率的前提下适应不规则数据访问模式。为充分利用这些架构能力,我们开发了一种图感知预处理与节点分区策略,通过重构不规则图工作负载来适配行式数据流与VRF容量。这种软硬件协同设计可减少内存流量,在真实GCN工作负载上实现显著的性能提升与能效增益。在五个真实GCN数据集上的实验结果表明:相较于采用相同大小缓冲区的先进以缓存为中心的基准架构,以VRF为核心的FlexVector在相当面积成本下实现了3.78倍加速比与40.5%的能耗降低。

0
下载
关闭预览

相关内容

图卷积网络(简称GCN),由Thomas Kpif于2017年在论文Semi-supervised classification with graph convolutional networks中提出。它为图(graph)结构数据的处理提供了一个崭新的思路,将深度学习中常用于图像的卷积神经网络应用到图数据上。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
19+阅读 · 2020年9月11日
KDD20 | AM-GCN:自适应多通道图卷积网络
专知会员服务
40+阅读 · 2020年8月26日
【CVPR2020】L2 ^GCN:图卷积网络的分层学习高效训练
专知会员服务
40+阅读 · 2020年3月31日
【论文笔记】图卷积的解释性技术
专知
18+阅读 · 2019年9月28日
GraphSAGE: GCN落地必读论文
AI100
29+阅读 · 2019年8月15日
专栏 | 深入理解图注意力机制
机器之心
25+阅读 · 2019年2月19日
图卷积神经网络的变种与挑战【附PPT与视频资料】
人工智能前沿讲习班
28+阅读 · 2018年12月28日
基于注意力机制的图卷积网络
科技创新与创业
74+阅读 · 2017年11月8日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
6+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关资讯
【论文笔记】图卷积的解释性技术
专知
18+阅读 · 2019年9月28日
GraphSAGE: GCN落地必读论文
AI100
29+阅读 · 2019年8月15日
专栏 | 深入理解图注意力机制
机器之心
25+阅读 · 2019年2月19日
图卷积神经网络的变种与挑战【附PPT与视频资料】
人工智能前沿讲习班
28+阅读 · 2018年12月28日
基于注意力机制的图卷积网络
科技创新与创业
74+阅读 · 2017年11月8日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员