FlexVector: A SpMM Vector Processor with Flexible VRF for GCNs on Varying-Sparsity Graphs - 专知论文

会员服务 ·

0

图卷积网络 · 数据流 · 稀疏 · 图卷积 · 卷积 ·

FlexVector: A SpMM Vector Processor with Flexible VRF for GCNs on Varying-Sparsity Graphs

翻译：FlexVector：一种适用于变稀疏度图卷积网络的灵活向量寄存器文件SpMM向量处理器

Bohan Li,Shengmin Li,Xinyu Shi,Enyi Yao,Francky Catthoor,Simei Yang

from arxiv, 14 pages, 13 figures

Graph Convolutional Networks (GCNs) are widely adopted for tasks involving relational or graph-structured data and can be formulated as two-stage sparse-dense matrix multiplication (SpMM) during inference. However, existing accelerators often struggle with the irregular workloads induced by power-law node degree distributions. In this work, we propose FlexVector, a vector-processor-based architecture that efficiently accelerates SpMM for GCN inference. To address irregular computation patterns, FlexVector adopts a row-wise, product-based dataflow that regularizes SpMM execution and exposes vector parallelism through full-row access to vector registers, eliminating the need for multi-banked register file designs. Building on this dataflow, it introduces software-managed, flexible vector register files (VRFs) that adapt to irregular data access patterns, without sacrificing memory access efficiency. To further exploit these architectural capabilities, we develop a graph-aware preprocessing and node partitioning strategy that restructures irregular graph workloads to better match the row-wise dataflow and VRF capacity. This hardware-software co-design reduces memory traffic, leading to significant performance and energy efficiency gains on real-world GCN workloads. Experimental results on five real-world GCN datasets show that the VRF-centric FlexVector achieves a 3.78x speedup and 40.5% lower energy at comparable area cost relative to a state-of-the-art cache-centric baseline with buffers of the same size.

翻译：图卷积网络（GCN）被广泛应用于涉及关系型或图结构数据的任务，在推理过程中可形式化为两阶段稀疏-稠密矩阵乘法（SpMM）。然而，现有加速器通常难以应对幂律节点度分布带来的不规则工作负载。本文提出FlexVector——一种基于向量处理器的架构，可高效加速GCN推理中的SpMM计算。为处理不规则计算模式，FlexVector采用面向行、基于乘积的数据流，该数据流通过全行访问向量寄存器以规范化SpMM执行并暴露向量级并行性，从而消除对多存储体寄存器文件设计的需求。基于此数据流，它引入软件可管理的灵活向量寄存器文件（VRF），在保持访存效率的前提下适应不规则数据访问模式。为充分利用这些架构能力，我们开发了一种图感知预处理与节点分区策略，通过重构不规则图工作负载来适配行式数据流与VRF容量。这种软硬件协同设计可减少内存流量，在真实GCN工作负载上实现显著的性能提升与能效增益。在五个真实GCN数据集上的实验结果表明：相较于采用相同大小缓冲区的先进以缓存为中心的基准架构，以VRF为核心的FlexVector在相当面积成本下实现了3.78倍加速比与40.5%的能耗降低。

0

相关内容

图卷积网络

图卷积网络

图卷积网络（简称GCN），由Thomas Kpif于2017年在论文Semi-supervised classification with graph convolutional networks中提出。它为图（graph）结构数据的处理提供了一个崭新的思路，将深度学习中常用于图像的卷积神经网络应用到图数据上。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【AAAI2024】异质图上精炼潜在同质结构以增强图卷积网络的鲁棒性

【AAAI2024】异质图上精炼潜在同质结构以增强图卷积网络的鲁棒性

专知会员服务

21+阅读 · 2024年1月6日

【WSDM2021】双向图卷积：一种新的图卷积框架用于富文本网络

【WSDM2021】双向图卷积：一种新的图卷积框架用于富文本网络

专知会员服务

18+阅读 · 2021年1月29日

【CIKM2020】研究和减轻图卷积网络中度相关的偏差

专知会员服务

19+阅读 · 2020年9月11日

KDD20 | AM-GCN：自适应多通道图卷积网络

KDD20 | AM-GCN：自适应多通道图卷积网络

专知会员服务

40+阅读 · 2020年8月26日

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

专知会员服务

63+阅读 · 2020年7月12日

具有组合核的图神经网络，Graph Neural Networks with Composite Kernels

具有组合核的图神经网络，Graph Neural Networks with Composite Kernels

专知会员服务

59+阅读 · 2020年5月20日

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

专知会员服务

40+阅读 · 2020年3月31日

【ICLR 2020】基于组合的多关系图卷积网络 Composition-Based Multi-Relational Graph Convolutional Networks

【ICLR 2020】基于组合的多关系图卷积网络 Composition-Based Multi-Relational Graph Convolutional Networks

专知会员服务

108+阅读 · 2020年3月29日

【论文推荐】几何图形卷积网络，GEOM-GCN: GEOMETRIC GRAPH CONVOLUTIONAL NETWORKS

【论文推荐】几何图形卷积网络，GEOM-GCN: GEOMETRIC GRAPH CONVOLUTIONAL NETWORKS

专知会员服务

77+阅读 · 2020年2月5日

【论文】双曲图卷积神经网络（Hyperbolic Graph Convolutional Neural Networks），斯坦福大学| Ines Chami，斯坦福大学| Rex Ying

【论文】双曲图卷积神经网络（Hyperbolic Graph Convolutional Neural Networks），斯坦福大学| Ines Chami，斯坦福大学| Rex Ying

专知会员服务

116+阅读 · 2019年12月30日

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

专知

20+阅读 · 2020年10月5日

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

专知

12+阅读 · 2020年3月31日

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

专知

41+阅读 · 2020年3月25日

【论文笔记】图卷积的解释性技术

【论文笔记】图卷积的解释性技术

专知

18+阅读 · 2019年9月28日

GraphSAGE: GCN落地必读论文

GraphSAGE: GCN落地必读论文

AI100

29+阅读 · 2019年8月15日

入门学习 | 什么是图卷积网络？行为识别领域新星

入门学习 | 什么是图卷积网络？行为识别领域新星

AI100

18+阅读 · 2019年6月7日

关系图注意力网络-Relational Graph Attention Networks

关系图注意力网络-Relational Graph Attention Networks

专知

142+阅读 · 2019年4月22日

专栏 | 深入理解图注意力机制

专栏 | 深入理解图注意力机制

机器之心

25+阅读 · 2019年2月19日

图卷积神经网络的变种与挑战【附PPT与视频资料】

图卷积神经网络的变种与挑战【附PPT与视频资料】

人工智能前沿讲习班

28+阅读 · 2018年12月28日

基于注意力机制的图卷积网络

基于注意力机制的图卷积网络

科技创新与创业

74+阅读 · 2017年11月8日

基于深度卷积神经网络的多源遥感图像时空融合方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

张量分析及其在高维信息处理中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

基于径向基函数无网格离散的快速多水平算法

国家自然科学基金

0+阅读 · 2015年12月31日

基于紧支径向基函数的支持向量机多尺度反演算法及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

云计算环境下基于图模型的海量RDF数据管理关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

图像复原中非凸稀疏优化问题的快速算法

国家自然科学基金

0+阅读 · 2015年12月31日

基于动态匹配的高能量利用率多层堆叠结构静态随机存储器（SRAM）关键技术

国家自然科学基金

0+阅读 · 2015年12月31日

基于张量网络算法研究低维量子系统中的非局域关联和量子相变的标度行为

国家自然科学基金

0+阅读 · 2015年12月31日

任意网络中的可分数据处理研究

国家自然科学基金

0+阅读 · 2015年12月31日

几类典型稀疏优化问题的算法、理论及应用

国家自然科学基金

3+阅读 · 2014年12月31日

SDSL-Solver: Scalable Distributed Sparse Linear Solvers for Large-Scale Interior Point Methods

Arxiv

0+阅读 · 4月30日

FloatSOM: GPU-Accelerated, Distributed, Topology-Flexible Self-Organizing Maps

Arxiv

0+阅读 · 4月29日

Momentum-Conserving Graph Neural Networks for Deformable Objects

Arxiv

0+阅读 · 4月28日

SDSL-Solver: Scalable Distributed Sparse Linear Solvers for Large-Scale Interior Point Methods

Arxiv

0+阅读 · 4月27日

PackSELL: A Sparse Matrix Format for Precision-Agnostic High-Performance SpMV

Arxiv

0+阅读 · 4月15日

A stable and accurate X-FFT solver for linear elastic homogenization problems in 3D

Arxiv

0+阅读 · 4月8日

FlatAttention: Dataflow and Fabric Collectives Co-Optimization for Large Attention-Based Model Inference on Tile-Based Accelerators

Arxiv

0+阅读 · 4月2日

flexvec: SQL Vector Retrieval with Programmatic Embedding Modulation

Arxiv

0+阅读 · 3月23日

Communication-Avoiding SpGEMM via Trident Partitioning on Hierarchical GPU Interconnects

Arxiv

0+阅读 · 3月22日

TENSURE: Fuzzing Sparse Tensor Compilers (Registered Report)

Arxiv

0+阅读 · 3月19日

VIP会员

文章信息

相关主题

图卷积网络

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

2+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

3+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

5+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

4+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

4+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

5+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

3+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

6+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

9+阅读 · 6月22日

相关VIP内容

【AAAI2024】异质图上精炼潜在同质结构以增强图卷积网络的鲁棒性

【AAAI2024】异质图上精炼潜在同质结构以增强图卷积网络的鲁棒性

专知会员服务

21+阅读 · 2024年1月6日

【WSDM2021】双向图卷积：一种新的图卷积框架用于富文本网络

【WSDM2021】双向图卷积：一种新的图卷积框架用于富文本网络

专知会员服务

18+阅读 · 2021年1月29日

【CIKM2020】研究和减轻图卷积网络中度相关的偏差

专知会员服务

19+阅读 · 2020年9月11日

KDD20 | AM-GCN：自适应多通道图卷积网络

KDD20 | AM-GCN：自适应多通道图卷积网络

专知会员服务

40+阅读 · 2020年8月26日

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

可解释高效异构图卷积网络，Interpretable and Efficient Heterogeneous Graph Convolutional Network

专知会员服务

63+阅读 · 2020年7月12日

具有组合核的图神经网络，Graph Neural Networks with Composite Kernels

具有组合核的图神经网络，Graph Neural Networks with Composite Kernels

专知会员服务

59+阅读 · 2020年5月20日

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

专知会员服务

40+阅读 · 2020年3月31日

【ICLR 2020】基于组合的多关系图卷积网络 Composition-Based Multi-Relational Graph Convolutional Networks

【ICLR 2020】基于组合的多关系图卷积网络 Composition-Based Multi-Relational Graph Convolutional Networks

专知会员服务

108+阅读 · 2020年3月29日

【论文推荐】几何图形卷积网络，GEOM-GCN: GEOMETRIC GRAPH CONVOLUTIONAL NETWORKS

【论文推荐】几何图形卷积网络，GEOM-GCN: GEOMETRIC GRAPH CONVOLUTIONAL NETWORKS

专知会员服务

77+阅读 · 2020年2月5日

【论文】双曲图卷积神经网络（Hyperbolic Graph Convolutional Neural Networks），斯坦福大学| Ines Chami，斯坦福大学| Rex Ying

【论文】双曲图卷积神经网络（Hyperbolic Graph Convolutional Neural Networks），斯坦福大学| Ines Chami，斯坦福大学| Rex Ying

专知会员服务

116+阅读 · 2019年12月30日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

专知

20+阅读 · 2020年10月5日

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

专知

12+阅读 · 2020年3月31日

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

专知

41+阅读 · 2020年3月25日

【论文笔记】图卷积的解释性技术

【论文笔记】图卷积的解释性技术

专知

18+阅读 · 2019年9月28日

GraphSAGE: GCN落地必读论文

GraphSAGE: GCN落地必读论文

AI100

29+阅读 · 2019年8月15日

入门学习 | 什么是图卷积网络？行为识别领域新星

入门学习 | 什么是图卷积网络？行为识别领域新星

AI100

18+阅读 · 2019年6月7日

关系图注意力网络-Relational Graph Attention Networks

关系图注意力网络-Relational Graph Attention Networks

专知

142+阅读 · 2019年4月22日

专栏 | 深入理解图注意力机制

专栏 | 深入理解图注意力机制

机器之心

25+阅读 · 2019年2月19日

图卷积神经网络的变种与挑战【附PPT与视频资料】

图卷积神经网络的变种与挑战【附PPT与视频资料】

人工智能前沿讲习班

28+阅读 · 2018年12月28日

基于注意力机制的图卷积网络

基于注意力机制的图卷积网络

科技创新与创业

74+阅读 · 2017年11月8日

相关论文

SDSL-Solver: Scalable Distributed Sparse Linear Solvers for Large-Scale Interior Point Methods

Arxiv

0+阅读 · 4月30日

FloatSOM: GPU-Accelerated, Distributed, Topology-Flexible Self-Organizing Maps

Arxiv

0+阅读 · 4月29日

Momentum-Conserving Graph Neural Networks for Deformable Objects

Arxiv

0+阅读 · 4月28日

SDSL-Solver: Scalable Distributed Sparse Linear Solvers for Large-Scale Interior Point Methods

Arxiv

0+阅读 · 4月27日

PackSELL: A Sparse Matrix Format for Precision-Agnostic High-Performance SpMV

Arxiv

0+阅读 · 4月15日

A stable and accurate X-FFT solver for linear elastic homogenization problems in 3D

Arxiv

0+阅读 · 4月8日

FlatAttention: Dataflow and Fabric Collectives Co-Optimization for Large Attention-Based Model Inference on Tile-Based Accelerators

Arxiv

0+阅读 · 4月2日

flexvec: SQL Vector Retrieval with Programmatic Embedding Modulation

Arxiv

0+阅读 · 3月23日

Communication-Avoiding SpGEMM via Trident Partitioning on Hierarchical GPU Interconnects

Arxiv

0+阅读 · 3月22日

TENSURE: Fuzzing Sparse Tensor Compilers (Registered Report)

Arxiv

0+阅读 · 3月19日

相关基金

基于深度卷积神经网络的多源遥感图像时空融合方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

张量分析及其在高维信息处理中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

基于径向基函数无网格离散的快速多水平算法

国家自然科学基金

0+阅读 · 2015年12月31日

基于紧支径向基函数的支持向量机多尺度反演算法及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

云计算环境下基于图模型的海量RDF数据管理关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

图像复原中非凸稀疏优化问题的快速算法

国家自然科学基金

0+阅读 · 2015年12月31日

基于动态匹配的高能量利用率多层堆叠结构静态随机存储器（SRAM）关键技术

国家自然科学基金

0+阅读 · 2015年12月31日

基于张量网络算法研究低维量子系统中的非局域关联和量子相变的标度行为

国家自然科学基金

0+阅读 · 2015年12月31日

任意网络中的可分数据处理研究

国家自然科学基金

0+阅读 · 2015年12月31日

几类典型稀疏优化问题的算法、理论及应用

国家自然科学基金

3+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员