GraphMend: Code Transformations for Fixing Graph Breaks in PyTorch 2 - 专知论文

会员服务 ·

0

PyTorch · 代码 · 变换 · 动态控制 · 动态控制流 ·

GraphMend: Code Transformations for Fixing Graph Breaks in PyTorch 2

翻译：GraphMend：修复PyTorch 2中图断裂问题的代码变换

Savini Kashmira,Jayanaka Dantanarayana,Thamirawaran Sathiyalogeswaran,Krisztian Flautner,Lingjia Tang,Jason Mars

This paper presents GRAPHMEND, a high-level compiler technique that eliminates FX graph breaks in PyTorch 2 programs. Although PyTorch 2 introduced TorchDynamo and TorchInductor to enable just-in-time graph compilation, unresolved dynamic control flow and unsupported Python constructs often fragment models into multiple FX graphs. These fragments force frequent fallbacks to eager mode, introduce costly CPU-to-GPU synchronizations, and reduce optimization opportunities. GRAPHMEND addresses this limitation by analyzing and transforming source code before execution. Built on the Jaseci compilation framework, GRAPHMEND introduces two code transformations that remove graph breaks due to dynamic control flow and Python side effects. This design allows PyTorch's compilation pipeline to capture larger, uninterrupted FX graphs without requiring manual refactoring by developers. Evaluation across eight Hugging Face models shows that GRAPHMEND removes graph breaks due to dynamic control flow and Python side effects, reducing the break count to 0 in 6 models and reducing it from 5 to 2 in another model. On NVIDIA RTX 3090 and A40 GPUs, GRAPHMEND achieves up to 75% latency reductions and up to 8% higher end-to-end throughput. These results demonstrate that high-level code transformation is an effective complement to PyTorch's dynamic JIT compilation pipeline, substantially improving both usability and performance.

翻译：本文提出了GRAPHMEND，一种消除PyTorch 2程序中FX图断裂的高层编译器技术。尽管PyTorch 2引入了TorchDynamo和TorchInductor以实现即时图编译，但未解析的动态控制流与不支持的Python构造常导致模型被分割为多个FX图。这些碎片会强制频繁回退至即时模式、引发昂贵的CPU到GPU同步开销，并削减优化机会。GRAPHMEND通过在程序执行前分析和变换源代码来解决此限制。该技术基于Jaseci编译框架构建，引入两种代码变换，分别消除因动态控制流和Python副作用导致的图断裂。此设计使PyTorch的编译管线能够捕获更大且无中断的FX图，而无需开发者手动重构。在八个Hugging Face模型上的评估显示，GRAPHMEND消除了由动态控制流和Python副作用引起的图断裂：使6个模型的断裂计数降为0，并将另一模型的断裂数从5减少至2。在NVIDIA RTX 3090和A40 GPU上，GRAPHMEND最高可实现75%的延迟缩减与8%的端到端吞吐量提升。这些结果表明，高层代码变换是PyTorch动态JIT编译管线的有效补充，显著提升了可用性与性能。

0

相关内容

PyTorch

PyTorch

图增强生成（GraphRAG）

图增强生成（GraphRAG）

专知会员服务

35+阅读 · 2025年1月4日

【IJCAI2024】Gradformer：具有指数衰减的图变换器

【IJCAI2024】Gradformer：具有指数衰减的图变换器

专知会员服务

17+阅读 · 2024年4月25日

Graph Transformer近期进展

Graph Transformer近期进展

专知会员服务

65+阅读 · 2023年1月5日

如何重构图神经网络？98页LoG2022《图重连:从理论到应用》教程，附代码

如何重构图神经网络？98页LoG2022《图重连:从理论到应用》教程，附代码

专知会员服务

44+阅读 · 2022年12月13日

【CVPR 2022】利用变分图信息瓶颈改进子图识别，Improving Subgraph Recognition with Variational Graph Information Bottleneck

【CVPR 2022】利用变分图信息瓶颈改进子图识别，Improving Subgraph Recognition with Variational Graph Information Bottleneck

专知会员服务

11+阅读 · 2022年3月12日

【干货书】深度学习Pytorch快速入门，150页pdf，Deep Learning with PyTorch

【干货书】深度学习Pytorch快速入门，150页pdf，Deep Learning with PyTorch

专知会员服务

156+阅读 · 2021年4月4日

GRAPH-BERT ：学习图表示只需要注意力，GRAPH-BERT : Only Attention is Needed for Learning Graph Representations

GRAPH-BERT ：学习图表示只需要注意力，GRAPH-BERT : Only Attention is Needed for Learning Graph Representations

专知会员服务

78+阅读 · 2020年5月31日

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

专知会员服务

28+阅读 · 2019年12月19日

基于图的word2vec负采样( GNEG:Graph-Based Negative Sampling for word2vec)

基于图的word2vec负采样( GNEG:Graph-Based Negative Sampling for word2vec)

专知会员服务

40+阅读 · 2019年11月23日

【CIKM 2019论文】重力启发式图自编码器定向链路预测（Gravity-Inspired Graph Autoencoders for Directed Link Prediction），Guillaume Salha，Stratis Limnios

【CIKM 2019论文】重力启发式图自编码器定向链路预测（Gravity-Inspired Graph Autoencoders for Directed Link Prediction），Guillaume Salha，Stratis Limnios

专知会员服务

28+阅读 · 2019年11月20日

GPT-4 让 Python 程序实现自修复 Bug，国外小哥将工具命名为“金刚狼”，并开源！

GPT-4 让 Python 程序实现自修复 Bug，国外小哥将工具命名为“金刚狼”，并开源！

CSDN

12+阅读 · 2023年4月13日

【Code】GraphSAGE 源码解析

【Code】GraphSAGE 源码解析

AINLP

31+阅读 · 2020年6月22日

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

专知

20+阅读 · 2020年3月1日

LeCun推荐：最新PyTorch图神经网络库，速度快15倍（GitHub+论文）

LeCun推荐：最新PyTorch图神经网络库，速度快15倍（GitHub+论文）

未来产业促进会

18+阅读 · 2019年3月10日

加入Transformer-XL，这个PyTorch包能调用各种NLP预训练模型

加入Transformer-XL，这个PyTorch包能调用各种NLP预训练模型

机器之心

15+阅读 · 2019年2月13日

Github 项目推荐 | 论文的代码实现：可变形ConvNets v2的PyTorch实现

Github 项目推荐 | 论文的代码实现：可变形ConvNets v2的PyTorch实现

AI研习社

22+阅读 · 2019年1月10日

快速上手笔记，PyTorch模型训练实用教程（附代码）

快速上手笔记，PyTorch模型训练实用教程（附代码）

机器之心

22+阅读 · 2018年12月20日

使用Python进行图像增强

使用Python进行图像增强

AI研习社

17+阅读 · 2018年9月30日

教程 | PyTorch经验指南：技巧与陷阱

教程 | PyTorch经验指南：技巧与陷阱

机器之心

16+阅读 · 2018年7月30日

用PyTorch实现各种GANs（附论文和代码地址）

用PyTorch实现各种GANs（附论文和代码地址）

论智

23+阅读 · 2018年4月24日

曲面上图像处理的非局部变分模型与算法

国家自然科学基金

0+阅读 · 2017年12月31日

基于部件结构的图像协同分割方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于形状信息和结果反馈的多图谱图像分割方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于非监督决策树的模糊图割模型的彩色图像分割研究

国家自然科学基金

0+阅读 · 2015年12月31日

图像修补中结构矩阵的预处理方法与理论

国家自然科学基金

1+阅读 · 2015年12月31日

图像复原中非凸稀疏优化问题的快速算法

国家自然科学基金

0+阅读 · 2015年12月31日

基于框架提升变换的多源图像融合研究

国家自然科学基金

2+阅读 · 2015年12月31日

图像分割中若干图论问题的研究

国家自然科学基金

0+阅读 · 2014年12月31日

非局部总变差正则化图像恢复模型的快速子空间校正算法

国家自然科学基金

0+阅读 · 2014年12月31日

图的边覆盖染色

国家自然科学基金

1+阅读 · 2014年12月31日

Graphify: Automated Synthesis of Type-Safe Graph Backends via $O(S)$ GraphQL-to-Gremlin Transpilation

Arxiv

0+阅读 · 4月29日

SyncFix: Fixing 3D Reconstructions via Multi-View Synchronization

Arxiv

0+阅读 · 4月13日

gMatch: Fine-Grained and Hardware-Efficient Subgraph Matching on GPUs

Arxiv

0+阅读 · 4月12日

EditCaption: Human-Aligned Instruction Synthesis for Image Editing via Supervised Fine-Tuning and Direct Preference Optimization

Arxiv

0+阅读 · 4月9日

Graph-PiT: Enhancing Structural Coherence in Part-Based Image Synthesis via Graph Priors

Arxiv

0+阅读 · 4月7日

TRACE: High-Fidelity 3D Scene Editing via Tangible Reconstruction and Geometry-Aligned Contextual Video Masking

Arxiv

0+阅读 · 4月1日

Histropy: A Computer Program for Quantifications of Histograms of 2D Gray-scale Images

Arxiv

0+阅读 · 3月31日

DiffBMP: Differentiable Rendering with Bitmap Primitives

Arxiv

0+阅读 · 3月24日

Enhancing a Hierarchical Graph Rewriting Language based on MELL Cut Elimination

Arxiv

0+阅读 · 3月19日

Using weakest application conditions to rank graph transformations for graph repair

Arxiv

0+阅读 · 2月26日

VIP会员

文章信息

相关主题

动态控制流

最新内容

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

4+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

5+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

5+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

5+阅读 · 7月20日

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

3+阅读 · 7月20日

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

5+阅读 · 7月20日

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

专知会员服务

5+阅读 · 7月20日

深入Project Maven：为何人工智能在战场上依然失灵

深入Project Maven：为何人工智能在战场上依然失灵

专知会员服务

14+阅读 · 7月19日

锻造未来士兵：外骨骼、基因工程与赛博格

锻造未来士兵：外骨骼、基因工程与赛博格

专知会员服务

7+阅读 · 7月19日

《无人机系统（UAS）通信网状网络试验性部署》50页报告

《无人机系统（UAS）通信网状网络试验性部署》50页报告

专知会员服务

7+阅读 · 7月19日

《无人机蜂群通信技术研究》50页

《无人机蜂群通信技术研究》50页

专知会员服务

8+阅读 · 7月19日

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

专知会员服务

12+阅读 · 7月18日

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

专知会员服务

8+阅读 · 7月18日

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

专知会员服务

13+阅读 · 7月18日

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

专知会员服务

10+阅读 · 7月18日

相关VIP内容

图增强生成（GraphRAG）

图增强生成（GraphRAG）

专知会员服务

35+阅读 · 2025年1月4日

【IJCAI2024】Gradformer：具有指数衰减的图变换器

【IJCAI2024】Gradformer：具有指数衰减的图变换器

专知会员服务

17+阅读 · 2024年4月25日

Graph Transformer近期进展

Graph Transformer近期进展

专知会员服务

65+阅读 · 2023年1月5日

如何重构图神经网络？98页LoG2022《图重连:从理论到应用》教程，附代码

如何重构图神经网络？98页LoG2022《图重连:从理论到应用》教程，附代码

专知会员服务

44+阅读 · 2022年12月13日

【CVPR 2022】利用变分图信息瓶颈改进子图识别，Improving Subgraph Recognition with Variational Graph Information Bottleneck

【CVPR 2022】利用变分图信息瓶颈改进子图识别，Improving Subgraph Recognition with Variational Graph Information Bottleneck

专知会员服务

11+阅读 · 2022年3月12日

【干货书】深度学习Pytorch快速入门，150页pdf，Deep Learning with PyTorch

【干货书】深度学习Pytorch快速入门，150页pdf，Deep Learning with PyTorch

专知会员服务

156+阅读 · 2021年4月4日

GRAPH-BERT ：学习图表示只需要注意力，GRAPH-BERT : Only Attention is Needed for Learning Graph Representations

GRAPH-BERT ：学习图表示只需要注意力，GRAPH-BERT : Only Attention is Needed for Learning Graph Representations

专知会员服务

78+阅读 · 2020年5月31日

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

专知会员服务

28+阅读 · 2019年12月19日

基于图的word2vec负采样( GNEG:Graph-Based Negative Sampling for word2vec)

基于图的word2vec负采样( GNEG:Graph-Based Negative Sampling for word2vec)

专知会员服务

40+阅读 · 2019年11月23日

【CIKM 2019论文】重力启发式图自编码器定向链路预测（Gravity-Inspired Graph Autoencoders for Directed Link Prediction），Guillaume Salha，Stratis Limnios

【CIKM 2019论文】重力启发式图自编码器定向链路预测（Gravity-Inspired Graph Autoencoders for Directed Link Prediction），Guillaume Salha，Stratis Limnios

专知会员服务

28+阅读 · 2019年11月20日

热门VIP内容

开通专知VIP会员享更多权益服务

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

印度精确打击与指挥架构的断层

美空军AI完成F-16战斗机自主空战历史性试飞

相关资讯

GPT-4 让 Python 程序实现自修复 Bug，国外小哥将工具命名为“金刚狼”，并开源！

GPT-4 让 Python 程序实现自修复 Bug，国外小哥将工具命名为“金刚狼”，并开源！

CSDN

12+阅读 · 2023年4月13日

【Code】GraphSAGE 源码解析

【Code】GraphSAGE 源码解析

AINLP

31+阅读 · 2020年6月22日

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

专知

20+阅读 · 2020年3月1日

LeCun推荐：最新PyTorch图神经网络库，速度快15倍（GitHub+论文）

LeCun推荐：最新PyTorch图神经网络库，速度快15倍（GitHub+论文）

未来产业促进会

18+阅读 · 2019年3月10日

加入Transformer-XL，这个PyTorch包能调用各种NLP预训练模型

加入Transformer-XL，这个PyTorch包能调用各种NLP预训练模型

机器之心

15+阅读 · 2019年2月13日

Github 项目推荐 | 论文的代码实现：可变形ConvNets v2的PyTorch实现

Github 项目推荐 | 论文的代码实现：可变形ConvNets v2的PyTorch实现

AI研习社

22+阅读 · 2019年1月10日

快速上手笔记，PyTorch模型训练实用教程（附代码）

快速上手笔记，PyTorch模型训练实用教程（附代码）

机器之心

22+阅读 · 2018年12月20日

使用Python进行图像增强

使用Python进行图像增强

AI研习社

17+阅读 · 2018年9月30日

教程 | PyTorch经验指南：技巧与陷阱

教程 | PyTorch经验指南：技巧与陷阱

机器之心

16+阅读 · 2018年7月30日

用PyTorch实现各种GANs（附论文和代码地址）

用PyTorch实现各种GANs（附论文和代码地址）

论智

23+阅读 · 2018年4月24日

相关论文

Graphify: Automated Synthesis of Type-Safe Graph Backends via $O(S)$ GraphQL-to-Gremlin Transpilation

Arxiv

0+阅读 · 4月29日

SyncFix: Fixing 3D Reconstructions via Multi-View Synchronization

Arxiv

0+阅读 · 4月13日

gMatch: Fine-Grained and Hardware-Efficient Subgraph Matching on GPUs

Arxiv

0+阅读 · 4月12日

EditCaption: Human-Aligned Instruction Synthesis for Image Editing via Supervised Fine-Tuning and Direct Preference Optimization

Arxiv

0+阅读 · 4月9日

Graph-PiT: Enhancing Structural Coherence in Part-Based Image Synthesis via Graph Priors

Arxiv

0+阅读 · 4月7日

TRACE: High-Fidelity 3D Scene Editing via Tangible Reconstruction and Geometry-Aligned Contextual Video Masking

Arxiv

0+阅读 · 4月1日

Histropy: A Computer Program for Quantifications of Histograms of 2D Gray-scale Images

Arxiv

0+阅读 · 3月31日

DiffBMP: Differentiable Rendering with Bitmap Primitives

Arxiv

0+阅读 · 3月24日

Enhancing a Hierarchical Graph Rewriting Language based on MELL Cut Elimination

Arxiv

0+阅读 · 3月19日

Using weakest application conditions to rank graph transformations for graph repair

Arxiv

0+阅读 · 2月26日

相关基金

曲面上图像处理的非局部变分模型与算法

国家自然科学基金

0+阅读 · 2017年12月31日

基于部件结构的图像协同分割方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于形状信息和结果反馈的多图谱图像分割方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于非监督决策树的模糊图割模型的彩色图像分割研究

国家自然科学基金

0+阅读 · 2015年12月31日

图像修补中结构矩阵的预处理方法与理论

国家自然科学基金

1+阅读 · 2015年12月31日

图像复原中非凸稀疏优化问题的快速算法

国家自然科学基金

0+阅读 · 2015年12月31日

基于框架提升变换的多源图像融合研究

国家自然科学基金

2+阅读 · 2015年12月31日

图像分割中若干图论问题的研究

国家自然科学基金

0+阅读 · 2014年12月31日

非局部总变差正则化图像恢复模型的快速子空间校正算法

国家自然科学基金

0+阅读 · 2014年12月31日

图的边覆盖染色

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员