StreamTGN: A GPU-Efficient Serving System for Streaming Temporal Graph Neural Networks - 专知论文

会员服务 ·

0

时序 · 系统 · GPU · 时序图神经网络 · 推理系统 ·

StreamTGN: A GPU-Efficient Serving System for Streaming Temporal Graph Neural Networks

翻译：[translated title in Chinese] StreamTGN：面向流式时序图神经网络的高效GPU推理系统

Lingling Zhang,Pengpeng Qiao,Zhiwei Zhang,Ye Yuan,Guoren Wang

Temporal Graph Neural Networks (TGNs) achieve state-of-the-art performance on dynamic graph tasks, yet existing systems focus exclusively on accelerating training -- at inference time, every new edge triggers $O(|V|)$ embedding updates even though only a small fraction of nodes are affected. We present \textbf{StreamTGN}, the first streaming TGN inference system exploiting the inherent locality of temporal graph updates: in an $L$-layer TGN, a new edge affects only nodes within $L$ hops of the endpoints, typically less than 0.2\% on million-node graphs. StreamTGN maintains persistent GPU-resident node memory and uses dirty-flag propagation to identify the affected set $\mathcal{A}$, reducing per-batch complexity from $O(|V|)$ to $O(|\mathcal{A}|)$ with zero accuracy loss. Drift-aware adaptive rebuild scheduling and batched streaming with relaxed ordering further maximize throughput. Experiments on eight temporal graphs (2K--2.6M nodes) show 4.5$\times$--739$\times$ speedup for TGN and up to 4,207$\times$ for TGAT, with identical accuracy. StreamTGN is orthogonal to training optimizations: combining SWIFT with StreamTGN yields 24$\times$ end-to-end speedup across three architectures (TGN, TGAT, DySAT).

翻译：[translated abstract in Chinese] 时序图神经网络（TGNs）在动态图任务中取得了最先进的性能，然而现有系统仅专注于加速训练过程——在推理阶段，每条新边都会触发$O(|V|)$量级的嵌入更新，尽管实际受影响的节点仅占极小比例。本文提出\textbf{StreamTGN}，这是首个利用时序图更新固有局部性的流式TGN推理系统：在$L$层TGN中，新边仅影响端点$L$跳范围内的节点，对于百万节点规模的图，这一比例通常低于0.2%。StreamTGN维护持久驻留GPU的节点内存，并通过脏标志传播机制识别受影响节点集$\mathcal{A}$，将每批处理复杂度从$O(|V|)$降至$O(|\mathcal{A}|)$，且保证零精度损失。通过漂移感知的自适应重建调度与松弛排序的批量流式处理，进一步提升了吞吐量。在八个时序图（含2K至2.6M节点）上的实验表明：TGN获得4.5倍至739倍加速，TGAT最高获得4207倍加速，且精度保持一致。StreamTGN与训练优化方法正交：将SWIFT与StreamTGN结合，可在TGN、TGAT、DySAT三种架构上实现24倍的端到端加速。

0

相关内容

时空图神经网络模型在时间序列预测和分类中的系统文献综述

时空图神经网络模型在时间序列预测和分类中的系统文献综述

专知会员服务

32+阅读 · 2024年11月9日

GNN如何建模时空？伦敦玛丽女王大学《时空图神经网络》综述，简明阐述时空图神经网络方法

GNN如何建模时空？伦敦玛丽女王大学《时空图神经网络》综述，简明阐述时空图神经网络方法

专知会员服务

74+阅读 · 2023年2月1日

计算机视觉中的图神经网络和图Transformers研究综述:面向任务的视角

计算机视觉中的图神经网络和图Transformers研究综述:面向任务的视角

专知会员服务

88+阅读 · 2022年9月28日

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知会员服务

122+阅读 · 2021年1月24日

【Twitter】时序图神经网络

【Twitter】时序图神经网络

专知会员服务

95+阅读 · 2020年10月15日

宾大最新《图神经网络》课程，附视频与课件（33页ppt））下载

宾大最新《图神经网络》课程，附视频与课件（33页ppt））下载

专知会员服务

74+阅读 · 2020年9月18日

如何建模动态图？看这份《时序图神经网络》26页ppt

如何建模动态图？看这份《时序图神经网络》26页ppt

专知会员服务

142+阅读 · 2020年7月25日

图神经网络推理，27页ppt精炼讲解

图神经网络推理，27页ppt精炼讲解

专知会员服务

117+阅读 · 2020年4月24日

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

专知会员服务

29+阅读 · 2020年3月1日

图卷积神经网络及其应用，中国科学院计算技术研究所沈华伟研究员，第八届全国社会媒体处理大会SMP2019

图卷积神经网络及其应用，中国科学院计算技术研究所沈华伟研究员，第八届全国社会媒体处理大会SMP2019

专知会员服务

67+阅读 · 2019年10月21日

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知

17+阅读 · 2021年1月24日

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

专知

20+阅读 · 2020年10月5日

如何建模动态图？看这个《时序图神经网络》视频讲解，26页ppt

如何建模动态图？看这个《时序图神经网络》视频讲解，26页ppt

专知

22+阅读 · 2020年7月25日

【ICML2020】持续图神经网络，Continuous Graph Neural Networks

【ICML2020】持续图神经网络，Continuous Graph Neural Networks

专知

75+阅读 · 2020年6月29日

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

专知

20+阅读 · 2020年3月1日

【论文笔记】用于Web级推荐系统的图卷积神经网络

【论文笔记】用于Web级推荐系统的图卷积神经网络

专知

20+阅读 · 2019年9月30日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

入门学习 | 什么是图卷积网络？行为识别领域新星

入门学习 | 什么是图卷积网络？行为识别领域新星

AI100

18+阅读 · 2019年6月7日

LeCun推荐：最新PyTorch图神经网络库，速度快15倍（GitHub+论文）

LeCun推荐：最新PyTorch图神经网络库，速度快15倍（GitHub+论文）

未来产业促进会

18+阅读 · 2019年3月10日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

基于略图挖掘的在不同时空域的网络流式数据实时处理

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度卷积神经网络的多源遥感图像时空融合方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

稀疏信号驱动的时间序列信号盲分离优化模型及算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

人体行为识别的时空耦合随机图模型及其高效推理算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

混沌时间序列Volterra建模及其在语音信号处理中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的高时效并行计算机系统结构与技术

国家自然科学基金

0+阅读 · 2014年12月31日

神经元网络系统的斑图动力学行为分析及控制

国家自然科学基金

0+阅读 · 2014年12月31日

面向时空变化的GIS数据模型

国家自然科学基金

6+阅读 · 2014年12月31日

NeuroRing: Scaling Spiking Neural Networks via Multi-FPGA Bidirectional Ring Topologies and Stream-Dataflow Architectures

Arxiv

0+阅读 · 4月30日

GraphLeap: Decoupling Graph Construction and Convolution for Vision GNN Acceleration on FPGA

Arxiv

0+阅读 · 4月23日

An LLM-Guided Query-Aware Inference System for GNN Models on Large Knowledge Graphs

Arxiv

0+阅读 · 4月20日

OpenGLT: A Comprehensive Benchmark of Graph Neural Networks for Graph-Level Tasks

Arxiv

0+阅读 · 4月9日

TRAPTI: Time-Resolved Analysis for SRAM Banking and Power Gating Optimization in Embedded Transformer Inference

Arxiv

0+阅读 · 4月8日

GPU-Accelerated Optimization of Transformer-Based Neural Networks for Real-Time Inference

Arxiv

0+阅读 · 3月30日

StreamGaze: Gaze-Guided Temporal Reasoning and Proactive Understanding in Streaming Videos

Arxiv

0+阅读 · 3月27日

Incremental GNN Embedding Computation on Streaming Graphs

Arxiv

0+阅读 · 3月21日

DGNNFlow: A Streaming Dataflow Architecture for Real-Time Edge-based Dynamic GNN Inference in HL-LHC Trigger Systems

Arxiv

0+阅读 · 3月20日

The Expressive Power of Graph Neural Networks: A Survey

Arxiv

10+阅读 · 2023年8月16日

VIP会员

文章信息

相关主题

时序图神经网络

最新内容

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

1+阅读 · 今天15:03

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

0+阅读 · 今天14:31

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

0+阅读 · 今天14:29

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

12+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

4+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

7+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

8+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

11+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

12+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

8+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

21+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

10+阅读 · 6月17日

相关VIP内容

时空图神经网络模型在时间序列预测和分类中的系统文献综述

时空图神经网络模型在时间序列预测和分类中的系统文献综述

专知会员服务

32+阅读 · 2024年11月9日

GNN如何建模时空？伦敦玛丽女王大学《时空图神经网络》综述，简明阐述时空图神经网络方法

GNN如何建模时空？伦敦玛丽女王大学《时空图神经网络》综述，简明阐述时空图神经网络方法

专知会员服务

74+阅读 · 2023年2月1日

计算机视觉中的图神经网络和图Transformers研究综述:面向任务的视角

计算机视觉中的图神经网络和图Transformers研究综述:面向任务的视角

专知会员服务

88+阅读 · 2022年9月28日

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知会员服务

122+阅读 · 2021年1月24日

【Twitter】时序图神经网络

【Twitter】时序图神经网络

专知会员服务

95+阅读 · 2020年10月15日

宾大最新《图神经网络》课程，附视频与课件（33页ppt））下载

宾大最新《图神经网络》课程，附视频与课件（33页ppt））下载

专知会员服务

74+阅读 · 2020年9月18日

如何建模动态图？看这份《时序图神经网络》26页ppt

如何建模动态图？看这份《时序图神经网络》26页ppt

专知会员服务

142+阅读 · 2020年7月25日

图神经网络推理，27页ppt精炼讲解

图神经网络推理，27页ppt精炼讲解

专知会员服务

117+阅读 · 2020年4月24日

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

专知会员服务

29+阅读 · 2020年3月1日

图卷积神经网络及其应用，中国科学院计算技术研究所沈华伟研究员，第八届全国社会媒体处理大会SMP2019

图卷积神经网络及其应用，中国科学院计算技术研究所沈华伟研究员，第八届全国社会媒体处理大会SMP2019

专知会员服务

67+阅读 · 2019年10月21日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

美国从乌克兰无人机战争中学习经验

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

相关资讯

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

图神经网络如何时序化？看Twitter最新《动态图深度学习:时序图网络TGN》研究，附论文与PPT下载

专知

17+阅读 · 2021年1月24日

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

图神经网络模型集合GraphGallery，TensorFLow&PyTorch一并实现

专知

20+阅读 · 2020年10月5日

如何建模动态图？看这个《时序图神经网络》视频讲解，26页ppt

如何建模动态图？看这个《时序图神经网络》视频讲解，26页ppt

专知

22+阅读 · 2020年7月25日

【ICML2020】持续图神经网络，Continuous Graph Neural Networks

【ICML2020】持续图神经网络，Continuous Graph Neural Networks

专知

75+阅读 · 2020年6月29日

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

专知

20+阅读 · 2020年3月1日

【论文笔记】用于Web级推荐系统的图卷积神经网络

【论文笔记】用于Web级推荐系统的图卷积神经网络

专知

20+阅读 · 2019年9月30日

图神经网络GNN最新理论进展和应用探索，附报告下载

图神经网络GNN最新理论进展和应用探索，附报告下载

专知

70+阅读 · 2019年8月25日

【GNN】深度学习之上，图神经网络（GNN ）崛起

【GNN】深度学习之上，图神经网络（GNN ）崛起

产业智能官

16+阅读 · 2019年8月15日

入门学习 | 什么是图卷积网络？行为识别领域新星

入门学习 | 什么是图卷积网络？行为识别领域新星

AI100

18+阅读 · 2019年6月7日

LeCun推荐：最新PyTorch图神经网络库，速度快15倍（GitHub+论文）

LeCun推荐：最新PyTorch图神经网络库，速度快15倍（GitHub+论文）

未来产业促进会

18+阅读 · 2019年3月10日

相关论文

NeuroRing: Scaling Spiking Neural Networks via Multi-FPGA Bidirectional Ring Topologies and Stream-Dataflow Architectures

Arxiv

0+阅读 · 4月30日

GraphLeap: Decoupling Graph Construction and Convolution for Vision GNN Acceleration on FPGA

Arxiv

0+阅读 · 4月23日

An LLM-Guided Query-Aware Inference System for GNN Models on Large Knowledge Graphs

Arxiv

0+阅读 · 4月20日

OpenGLT: A Comprehensive Benchmark of Graph Neural Networks for Graph-Level Tasks

Arxiv

0+阅读 · 4月9日

TRAPTI: Time-Resolved Analysis for SRAM Banking and Power Gating Optimization in Embedded Transformer Inference

Arxiv

0+阅读 · 4月8日

GPU-Accelerated Optimization of Transformer-Based Neural Networks for Real-Time Inference

Arxiv

0+阅读 · 3月30日

StreamGaze: Gaze-Guided Temporal Reasoning and Proactive Understanding in Streaming Videos

Arxiv

0+阅读 · 3月27日

Incremental GNN Embedding Computation on Streaming Graphs

Arxiv

0+阅读 · 3月21日

DGNNFlow: A Streaming Dataflow Architecture for Real-Time Edge-based Dynamic GNN Inference in HL-LHC Trigger Systems

Arxiv

0+阅读 · 3月20日

The Expressive Power of Graph Neural Networks: A Survey

Arxiv

10+阅读 · 2023年8月16日

相关基金

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

基于略图挖掘的在不同时空域的网络流式数据实时处理

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度卷积神经网络的多源遥感图像时空融合方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

稀疏信号驱动的时间序列信号盲分离优化模型及算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

人体行为识别的时空耦合随机图模型及其高效推理算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

混沌时间序列Volterra建模及其在语音信号处理中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

多尺度模块网络下的储备池神经计算模型及算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的高时效并行计算机系统结构与技术

国家自然科学基金

0+阅读 · 2014年12月31日

神经元网络系统的斑图动力学行为分析及控制

国家自然科学基金

0+阅读 · 2014年12月31日

面向时空变化的GIS数据模型

国家自然科学基金

6+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员