torch-sla：支持伴随求解器与稀疏张量并行的PyTorch可微稀疏线性代数库 (torch-sla: Differentiable Sparse Linear Algebra with Adjoint Solvers and Sparse Tensor Parallelism for PyTorch) - 专知论文

会员服务 ·

0

稀疏 · PyTorch · GPU · Torch · SLA ·

torch-sla: Differentiable Sparse Linear Algebra with Adjoint Solvers and Sparse Tensor Parallelism for PyTorch

翻译：torch-sla：支持伴随求解器与稀疏张量并行的PyTorch可微稀疏线性代数库

Industrial scientific computing predominantly uses sparse matrices to represent unstructured data -- finite element meshes, graphs, point clouds. We present \torchsla{}, an open-source PyTorch library that enables GPU-accelerated, scalable, and differentiable sparse linear algebra. The library addresses three fundamental challenges: (1) GPU acceleration for sparse linear solves, nonlinear solves (Newton, Picard, Anderson), and eigenvalue computation; (2) Multi-GPU scaling via domain decomposition with halo exchange, reaching \textbf{400 million DOF linear solve on 3 GPUs}; and (3) Adjoint-based differentiation} achieving $\mathcal{O}(1)$ computational graph nodes (for autograd) and $\mathcal{O}(\text{nnz})$ memory -- independent of solver iterations. \torchsla{} supports multiple backends (SciPy, cuDSS, PyTorch-native) and seamlessly integrates with PyTorch autograd for end-to-end differentiable simulations. Code is available at https://github.com/walkerchi/torch-sla.

翻译：工业科学计算主要使用稀疏矩阵表示非结构化数据——有限元网格、图结构、点云。本文介绍\torchsla{}：一个开源PyTorch库，支持GPU加速、可扩展且可微分的稀疏线性代数运算。该库解决了三个核心挑战：(1) 为稀疏线性求解、非线性求解（牛顿法、皮卡德法、安德森法）及特征值计算提供GPU加速；(2) 通过带边界交换的域分解实现多GPU扩展，在3块GPU上达成\textbf{4亿自由度线性求解}；(3) 基于伴随法的微分技术实现$\mathcal{O}(1)$计算图节点（用于自动微分）与$\mathcal{O}(\text{nnz})$内存占用——其复杂度与求解器迭代次数无关。\torchsla{}支持多后端（SciPy、cuDSS、PyTorch原生）并与PyTorch自动微分系统无缝集成，可实现端到端可微模拟。代码发布于https://github.com/walkerchi/torch-sla。

0

相关内容

【博士论文】利用图结构加速稀疏计算

【博士论文】利用图结构加速稀疏计算

专知会员服务

18+阅读 · 2025年3月6日

《PyTorch几何图神经网络》最新教程，附Slides与视频，69页ppt

《PyTorch几何图神经网络》最新教程，附Slides与视频，69页ppt

专知会员服务

72+阅读 · 2022年9月21日

【Pytorch官方书】PyTorch 深度学习, 三部分15章节，522页pdf, 必备宝典, 通俗易懂

【Pytorch官方书】PyTorch 深度学习, 三部分15章节，522页pdf, 必备宝典, 通俗易懂

专知会员服务

211+阅读 · 2022年1月12日

tf_geometric — 基于TensorFlow的友好高效的图神经网络（GNN）库

tf_geometric — 基于TensorFlow的友好高效的图神经网络（GNN）库

专知会员服务

26+阅读 · 2021年8月9日

TensorFlow GNN框架tf_geometric发布0.0.58版，支持稀疏节点特征

TensorFlow GNN框架tf_geometric发布0.0.58版，支持稀疏节点特征

专知会员服务

12+阅读 · 2021年8月9日

【干货书】深度学习Pytorch快速入门，150页pdf，Deep Learning with PyTorch

【干货书】深度学习Pytorch快速入门，150页pdf，Deep Learning with PyTorch

专知会员服务

156+阅读 · 2021年4月4日

【干货书】PyTorch 深度学习，255页pdf

【干货书】PyTorch 深度学习，255页pdf

专知会员服务

281+阅读 · 2021年4月3日

图机器学习-图拉普拉斯算子的离散正则性，141页ppt，Discrete regularity graph Laplacians

专知会员服务

29+阅读 · 2020年6月4日

【电子书|交互式线性代数】《Interactive Linear Algebra》by Dan Margalit, Joseph Rabinoff（附455页pdf）

【电子书|交互式线性代数】《Interactive Linear Algebra》by Dan Margalit, Joseph Rabinoff（附455页pdf）

专知会员服务

69+阅读 · 2019年11月30日

PyTorch深度学习零基础入门《First steps towards Deep Learning with pyTorch》

PyTorch深度学习零基础入门《First steps towards Deep Learning with pyTorch》

专知会员服务

120+阅读 · 2019年10月28日

哈工大博士历时半年整理的《Pytorch常用函数函数手册》开放下载！内含200余个函数!

哈工大博士历时半年整理的《Pytorch常用函数函数手册》开放下载！内含200余个函数!

夕小瑶的卖萌屋

10+阅读 · 2022年3月23日

17种深度强化学习算法用Pytorch实现

17种深度强化学习算法用Pytorch实现

新智元

31+阅读 · 2019年9月16日

Github库分享：超全的PyTorch学习资源汇总

Github库分享：超全的PyTorch学习资源汇总

专知

25+阅读 · 2019年5月9日

基于PyTorch/TorchText的自然语言处理库

基于PyTorch/TorchText的自然语言处理库

专知

28+阅读 · 2019年4月22日

LeCun推荐：最新PyTorch图神经网络库，速度快15倍（GitHub+论文）

LeCun推荐：最新PyTorch图神经网络库，速度快15倍（GitHub+论文）

新智元

17+阅读 · 2019年3月10日

一份超全的PyTorch资源列表（Github 2.2K星）

一份超全的PyTorch资源列表（Github 2.2K星）

黑龙江大学自然语言处理实验室

25+阅读 · 2018年10月26日

【干货】库、教程、论文实现，这是一份超全的PyTorch资源列表（Github 2.2K星）

【干货】库、教程、论文实现，这是一份超全的PyTorch资源列表（Github 2.2K星）

GAN生成式对抗网络

10+阅读 · 2018年10月21日

【收藏】机器学习的Pytorch实现资源集合【附下载链接】

【收藏】机器学习的Pytorch实现资源集合【附下载链接】

机器学习算法与Python学习

10+阅读 · 2018年9月8日

机器学习的Pytorch实现资源集合

机器学习的Pytorch实现资源集合

专知

11+阅读 · 2018年9月1日

干货| PyTorch相比TensorFlow，存在哪些自身优势？

干货| PyTorch相比TensorFlow，存在哪些自身优势？

全球人工智能

15+阅读 · 2017年10月4日

非凸稀疏优化的恢复条件与低复杂度算法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于异构体系结构的稀疏矩阵分解算法并行化研究

国家自然科学基金

1+阅读 · 2015年12月31日

数据内在结构和稀疏保持的大间隔分类方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

图像复原中非凸稀疏优化问题的快速算法

国家自然科学基金

0+阅读 · 2015年12月31日

求解一类大规模稀疏线性矩阵方程的高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于L21范数约束的非负矩阵分解模型及其拓展

国家自然科学基金

1+阅读 · 2014年12月31日

带稀疏约束不适定问题的算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

几类典型稀疏优化问题的算法、理论及应用

国家自然科学基金

3+阅读 · 2014年12月31日

强非线性偏微分方程基于梯度重构的新型算法

国家自然科学基金

0+阅读 · 2014年12月31日

奇异线性方程组和具有特定结构的非线性问题的研究与应用

国家自然科学基金

0+阅读 · 2014年12月31日

Graphical model for factorization and completion of relatively high rank tensors by sparse sampling

Arxiv

0+阅读 · 2月18日

Parallel Sparse and Data-Sparse Factorization-based Linear Solvers

Arxiv

0+阅读 · 2月15日

SLA2: Sparse-Linear Attention with Learnable Routing and QAT

Arxiv

0+阅读 · 2月13日

Learning, Solving and Optimizing PDEs with TensorGalerkin: an efficient high-performance Galerkin assembly algorithm

Arxiv

0+阅读 · 2月11日

Locality-Aware Automatic Differentiation on the GPU for Mesh-Based Computations

Arxiv

0+阅读 · 1月31日

Fast Sparse Matrix Permutation for Mesh-Based Direct Solvers

Arxiv

0+阅读 · 1月31日

MiniTensor: A Lightweight, High-Performance Tensor Operations Library

Arxiv

0+阅读 · 1月27日

FuseFlow: A Fusion-Centric Compilation Framework for Sparse Deep Learning on Streaming Dataflow

Arxiv

0+阅读 · 1月25日

Differentiable Logic Synthesis: Spectral Coefficient Selection via Sinkhorn-Constrained Composition

Arxiv

0+阅读 · 1月20日

A Surrogate-Informed Framework for Sparse Grid Interpolation

Arxiv

0+阅读 · 1月18日

VIP会员

文章信息

相关主题

相关VIP内容

【博士论文】利用图结构加速稀疏计算

【博士论文】利用图结构加速稀疏计算

专知会员服务

18+阅读 · 2025年3月6日

《PyTorch几何图神经网络》最新教程，附Slides与视频，69页ppt

《PyTorch几何图神经网络》最新教程，附Slides与视频，69页ppt

专知会员服务

72+阅读 · 2022年9月21日

【Pytorch官方书】PyTorch 深度学习, 三部分15章节，522页pdf, 必备宝典, 通俗易懂

【Pytorch官方书】PyTorch 深度学习, 三部分15章节，522页pdf, 必备宝典, 通俗易懂

专知会员服务

211+阅读 · 2022年1月12日

tf_geometric — 基于TensorFlow的友好高效的图神经网络（GNN）库

tf_geometric — 基于TensorFlow的友好高效的图神经网络（GNN）库

专知会员服务

26+阅读 · 2021年8月9日

TensorFlow GNN框架tf_geometric发布0.0.58版，支持稀疏节点特征

TensorFlow GNN框架tf_geometric发布0.0.58版，支持稀疏节点特征

专知会员服务

12+阅读 · 2021年8月9日

【干货书】深度学习Pytorch快速入门，150页pdf，Deep Learning with PyTorch

【干货书】深度学习Pytorch快速入门，150页pdf，Deep Learning with PyTorch

专知会员服务

156+阅读 · 2021年4月4日

【干货书】PyTorch 深度学习，255页pdf

【干货书】PyTorch 深度学习，255页pdf

专知会员服务

281+阅读 · 2021年4月3日

图机器学习-图拉普拉斯算子的离散正则性，141页ppt，Discrete regularity graph Laplacians

专知会员服务

29+阅读 · 2020年6月4日

【电子书|交互式线性代数】《Interactive Linear Algebra》by Dan Margalit, Joseph Rabinoff（附455页pdf）

【电子书|交互式线性代数】《Interactive Linear Algebra》by Dan Margalit, Joseph Rabinoff（附455页pdf）

专知会员服务

69+阅读 · 2019年11月30日

PyTorch深度学习零基础入门《First steps towards Deep Learning with pyTorch》

PyTorch深度学习零基础入门《First steps towards Deep Learning with pyTorch》

专知会员服务

120+阅读 · 2019年10月28日

热门VIP内容

开通专知VIP会员享更多权益服务

《可信人工智能赋能系统的支柱》

《从经典神经网络到不确定性下的拓扑神经网络：军事应用》2026最新40页报告

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

《人工智能：对战略与力量的影响》slides

相关资讯

哈工大博士历时半年整理的《Pytorch常用函数函数手册》开放下载！内含200余个函数!

哈工大博士历时半年整理的《Pytorch常用函数函数手册》开放下载！内含200余个函数!

夕小瑶的卖萌屋

10+阅读 · 2022年3月23日

17种深度强化学习算法用Pytorch实现

17种深度强化学习算法用Pytorch实现

新智元

31+阅读 · 2019年9月16日

Github库分享：超全的PyTorch学习资源汇总

Github库分享：超全的PyTorch学习资源汇总

专知

25+阅读 · 2019年5月9日

基于PyTorch/TorchText的自然语言处理库

基于PyTorch/TorchText的自然语言处理库

专知

28+阅读 · 2019年4月22日

LeCun推荐：最新PyTorch图神经网络库，速度快15倍（GitHub+论文）

LeCun推荐：最新PyTorch图神经网络库，速度快15倍（GitHub+论文）

新智元

17+阅读 · 2019年3月10日

一份超全的PyTorch资源列表（Github 2.2K星）

一份超全的PyTorch资源列表（Github 2.2K星）

黑龙江大学自然语言处理实验室

25+阅读 · 2018年10月26日

【干货】库、教程、论文实现，这是一份超全的PyTorch资源列表（Github 2.2K星）

【干货】库、教程、论文实现，这是一份超全的PyTorch资源列表（Github 2.2K星）

GAN生成式对抗网络

10+阅读 · 2018年10月21日

【收藏】机器学习的Pytorch实现资源集合【附下载链接】

【收藏】机器学习的Pytorch实现资源集合【附下载链接】

机器学习算法与Python学习

10+阅读 · 2018年9月8日

机器学习的Pytorch实现资源集合

机器学习的Pytorch实现资源集合

专知

11+阅读 · 2018年9月1日

干货| PyTorch相比TensorFlow，存在哪些自身优势？

干货| PyTorch相比TensorFlow，存在哪些自身优势？

全球人工智能

15+阅读 · 2017年10月4日

相关论文

Graphical model for factorization and completion of relatively high rank tensors by sparse sampling

Arxiv

0+阅读 · 2月18日

Parallel Sparse and Data-Sparse Factorization-based Linear Solvers

Arxiv

0+阅读 · 2月15日

SLA2: Sparse-Linear Attention with Learnable Routing and QAT

Arxiv

0+阅读 · 2月13日

Learning, Solving and Optimizing PDEs with TensorGalerkin: an efficient high-performance Galerkin assembly algorithm

Arxiv

0+阅读 · 2月11日

Locality-Aware Automatic Differentiation on the GPU for Mesh-Based Computations

Arxiv

0+阅读 · 1月31日

Fast Sparse Matrix Permutation for Mesh-Based Direct Solvers

Arxiv

0+阅读 · 1月31日

MiniTensor: A Lightweight, High-Performance Tensor Operations Library

Arxiv

0+阅读 · 1月27日

FuseFlow: A Fusion-Centric Compilation Framework for Sparse Deep Learning on Streaming Dataflow

Arxiv

0+阅读 · 1月25日

Differentiable Logic Synthesis: Spectral Coefficient Selection via Sinkhorn-Constrained Composition

Arxiv

0+阅读 · 1月20日

A Surrogate-Informed Framework for Sparse Grid Interpolation

Arxiv

0+阅读 · 1月18日

相关基金

非凸稀疏优化的恢复条件与低复杂度算法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于异构体系结构的稀疏矩阵分解算法并行化研究

国家自然科学基金

1+阅读 · 2015年12月31日

数据内在结构和稀疏保持的大间隔分类方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

图像复原中非凸稀疏优化问题的快速算法

国家自然科学基金

0+阅读 · 2015年12月31日

求解一类大规模稀疏线性矩阵方程的高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于L21范数约束的非负矩阵分解模型及其拓展

国家自然科学基金

1+阅读 · 2014年12月31日

带稀疏约束不适定问题的算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

几类典型稀疏优化问题的算法、理论及应用

国家自然科学基金

3+阅读 · 2014年12月31日

强非线性偏微分方程基于梯度重构的新型算法

国家自然科学基金

0+阅读 · 2014年12月31日

奇异线性方程组和具有特定结构的非线性问题的研究与应用

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员