Linear Layouts: Robust Code Generation of Efficient Tensor Computation Using $\mathbb{F}_2$ - 专知论文

会员服务 ·

0

鲁棒 · 代码 · 系统 · 表示 · 代码生成 ·

Linear Layouts: Robust Code Generation of Efficient Tensor Computation Using $\mathbb{F}_2$

翻译：线性布局：基于$\mathbb{F}_2$的高效张量计算鲁棒代码生成

Keren Zhou,Mario Lezcano,Adam Goucher,Akhmed Rakhmati,Jeff Niu,Justin Lebar,Pawel Szczerbuk,Peter Bell,Phil Tillet,Thomas Raoux,Zahi Moudallal

Efficient tensor computation is a cornerstone of modern deep learning (DL) workloads, yet existing approaches struggle to achieve flexible and performant design and implementation of tensor layouts -- mappings between logical tensors and hardware resources. The increasing complexity of DL algorithms and hardware demands a generic and systematic approach to handling tensor layouts. In this work, we introduce Linear Layouts, a novel approach that models tensor layouts using linear algebra over $\mathbb{F}_2$. By representing tensor layouts as binary matrices acting on the bits of the hardware representation, our approach enables a generic layout definition -- as opposed to the classical case-by-case approach -- and allows for generic layout-to-layout conversions, eliminating the quadratic explosion that plagues existing solutions. We integrate linear layouts with Triton and demonstrate their effectiveness in optimizing individual Triton operators as well as kernels written in Triton. We also show that linear layouts reduce engineering effort in the compiler backend while fixing several bugs in Triton's legacy layout system.

翻译：高效张量计算是现代深度学习工作负载的基石，然而现有方法在实现灵活且高性能的张量布局——即逻辑张量与硬件资源之间的映射——的设计与实现方面仍面临挑战。深度学习算法与硬件日益增长的复杂性要求一种通用且系统化的张量布局处理方法。本文提出线性布局，一种利用$\mathbb{F}_2$上的线性代数对张量布局进行建模的新方法。通过将张量布局表示为作用于硬件表示比特位的二元矩阵，我们的方法实现了通用布局定义——与传统的逐案例处理方法相反——并支持通用布局间转换，从而消除了困扰现有解决方案的二次复杂度爆炸问题。我们将线性布局与Triton集成，并展示了其在优化单个Triton算子及Triton编写的内核方面的有效性。实验还表明，线性布局在修复Triton传统布局系统中若干错误的同时，显著降低了编译器后端的工程开销。

0

相关内容

【牛津大学博士论文】将序列结构与几何结构融入深度神经网络

【牛津大学博士论文】将序列结构与几何结构融入深度神经网络

专知会员服务

17+阅读 · 2025年12月8日

《鲁棒高效边缘人工智能：赋能边缘设备智能的新原理与框架》154页

《鲁棒高效边缘人工智能：赋能边缘设备智能的新原理与框架》154页

专知会员服务

32+阅读 · 2025年4月11日

【博士论文】利用图结构加速稀疏计算

【博士论文】利用图结构加速稀疏计算

专知会员服务

18+阅读 · 2025年3月6日

【剑桥大学博士论文】深度学习中的编码参数和结构效率，150页pdf

【剑桥大学博士论文】深度学习中的编码参数和结构效率，150页pdf

专知会员服务

34+阅读 · 2023年3月1日

推荐！【量子算法设计、应用】《不确定性条件下用于决策的量子计算算法》IBM、美国空军109页技术报告

推荐！【量子算法设计、应用】《不确定性条件下用于决策的量子计算算法》IBM、美国空军109页技术报告

专知会员服务

57+阅读 · 2022年10月8日

【开放书】《次线性计算范例》，403页pdf，Sublinear Computation Paradigm

【开放书】《次线性计算范例》，403页pdf，Sublinear Computation Paradigm

专知会员服务

14+阅读 · 2022年3月24日

【Nature】AI助力芯片设计效率革命，6小时内完成布局设计；Jeff Dean领衔推出最新方案

专知会员服务

15+阅读 · 2021年6月11日

【论文推荐】张量图卷积网络的多关系和鲁棒学习，Tensor Graph Convolutional Networks for Multi-relational and Robust Learning

【论文推荐】张量图卷积网络的多关系和鲁棒学习，Tensor Graph Convolutional Networks for Multi-relational and Robust Learning

专知会员服务

26+阅读 · 2020年3月19日

【Caltech&NVIDiA】张量在机器学习中的作用（附pdf）

专知会员服务

13+阅读 · 2019年11月23日

【MLA 2019】机器学习中分布式鲁棒优化的一阶算法框架( Towards a First-Order Algorithmic Framework for Distributionally Robust Optimization in Machine Learning),香港中文大学苏文藻

【MLA 2019】机器学习中分布式鲁棒优化的一阶算法框架( Towards a First-Order Algorithmic Framework for Distributionally Robust Optimization in Machine Learning),香港中文大学苏文藻

专知会员服务

28+阅读 · 2019年11月6日

【MIT博士论文】深度学习几何表示，138页pdf

【MIT博士论文】深度学习几何表示，138页pdf

专知

18+阅读 · 2022年9月4日

面试题：请简要介绍下tensorflow的计算图

面试题：请简要介绍下tensorflow的计算图

七月在线实验室

14+阅读 · 2019年6月10日

十种深度学习推荐系统代码实现，持续更新中！！！

十种深度学习推荐系统代码实现，持续更新中！！！

专知

113+阅读 · 2019年4月25日

基于数据的分布式鲁棒优化算法及其应用【附PPT与视频资料】

基于数据的分布式鲁棒优化算法及其应用【附PPT与视频资料】

人工智能前沿讲习班

27+阅读 · 2018年12月13日

一句代码发布你的TensorFlow模型，简明TensorFlow Serving上手教程

一句代码发布你的TensorFlow模型，简明TensorFlow Serving上手教程

专知

13+阅读 · 2018年11月30日

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

深度学习与NLP

12+阅读 · 2018年9月13日

资源 | 用Python和NumPy学习《深度学习》中的线性代数基础

资源 | 用Python和NumPy学习《深度学习》中的线性代数基础

机器之心

18+阅读 · 2018年5月14日

【干货】深度学习中的线性代数

【干货】深度学习中的线性代数

专知

21+阅读 · 2018年3月30日

【干货】理解深度学习中的矩阵运算

【干货】理解深度学习中的矩阵运算

专知

12+阅读 · 2018年2月12日

手把手教TensorFlow（附代码）

手把手教TensorFlow（附代码）

深度学习世界

15+阅读 · 2017年10月17日

图的弦性计算

国家自然科学基金

0+阅读 · 2015年12月31日

直接优化半周长线长的VLSI两阶段迭代布局算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

张量分析及其在高维信息处理中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

基于草图的几何处理和应用

国家自然科学基金

2+阅读 · 2015年12月31日

基于马尔科夫链的线性系统求解问题的高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

求解一类大规模稀疏线性矩阵方程的高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

求解非线性方程的加速迭代算法

国家自然科学基金

0+阅读 · 2014年12月31日

面向众核计算的数值方法协同设计--一种高效且高精度广义有限元方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

线性算子的谱结构及其扰动分析

国家自然科学基金

0+阅读 · 2014年12月31日

Dynamics-Encoded Deep Learning for Robust System Identification and Parameter Estimation

Arxiv

0+阅读 · 5月1日

Decoding Algorithms for Tensor Codes

Arxiv

0+阅读 · 4月17日

Leveraging Mathematical Reasoning of LLMs for Efficient GPU Thread Mapping

Arxiv

0+阅读 · 4月14日

Tensor-Parallel Emulation of Quantum Circuits with Block-Cyclic Distributed Matrix Product States

Arxiv

0+阅读 · 4月10日

Implementing Basic Arithmetic in $\mathbb{F}_p$ via $\mathbb{F}_2$, and Its Application for Computing the Hamming Distance of Linear Codes

Arxiv

0+阅读 · 3月31日

Hierarchical Tensor Network Structure Search for High-Dimensional Data

Arxiv

0+阅读 · 3月29日

Robust Matrix Estimation with Side Information

Arxiv

0+阅读 · 3月25日

Automated Tensor-Relational Decomposition for Large-Scale Sparse Tensor Computation

Arxiv

0+阅读 · 3月9日

Rigidity matroids and linear algebraic matroids with applications to matrix completion and tensor codes

Arxiv

0+阅读 · 3月2日

Revisiting Matrix Sketching in Linear Bandits: Achieving Sublinear Regret via Dyadic Block Sketching

Arxiv

0+阅读 · 2月27日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

3+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

4+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

5+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

4+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

4+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

4+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

21+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

【牛津大学博士论文】将序列结构与几何结构融入深度神经网络

【牛津大学博士论文】将序列结构与几何结构融入深度神经网络

专知会员服务

17+阅读 · 2025年12月8日

《鲁棒高效边缘人工智能：赋能边缘设备智能的新原理与框架》154页

《鲁棒高效边缘人工智能：赋能边缘设备智能的新原理与框架》154页

专知会员服务

32+阅读 · 2025年4月11日

【博士论文】利用图结构加速稀疏计算

【博士论文】利用图结构加速稀疏计算

专知会员服务

18+阅读 · 2025年3月6日

【剑桥大学博士论文】深度学习中的编码参数和结构效率，150页pdf

【剑桥大学博士论文】深度学习中的编码参数和结构效率，150页pdf

专知会员服务

34+阅读 · 2023年3月1日

推荐！【量子算法设计、应用】《不确定性条件下用于决策的量子计算算法》IBM、美国空军109页技术报告

推荐！【量子算法设计、应用】《不确定性条件下用于决策的量子计算算法》IBM、美国空军109页技术报告

专知会员服务

57+阅读 · 2022年10月8日

【开放书】《次线性计算范例》，403页pdf，Sublinear Computation Paradigm

【开放书】《次线性计算范例》，403页pdf，Sublinear Computation Paradigm

专知会员服务

14+阅读 · 2022年3月24日

【Nature】AI助力芯片设计效率革命，6小时内完成布局设计；Jeff Dean领衔推出最新方案

专知会员服务

15+阅读 · 2021年6月11日

【论文推荐】张量图卷积网络的多关系和鲁棒学习，Tensor Graph Convolutional Networks for Multi-relational and Robust Learning

【论文推荐】张量图卷积网络的多关系和鲁棒学习，Tensor Graph Convolutional Networks for Multi-relational and Robust Learning

专知会员服务

26+阅读 · 2020年3月19日

【Caltech&NVIDiA】张量在机器学习中的作用（附pdf）

专知会员服务

13+阅读 · 2019年11月23日

【MLA 2019】机器学习中分布式鲁棒优化的一阶算法框架( Towards a First-Order Algorithmic Framework for Distributionally Robust Optimization in Machine Learning),香港中文大学苏文藻

【MLA 2019】机器学习中分布式鲁棒优化的一阶算法框架( Towards a First-Order Algorithmic Framework for Distributionally Robust Optimization in Machine Learning),香港中文大学苏文藻

专知会员服务

28+阅读 · 2019年11月6日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

【MIT博士论文】深度学习几何表示，138页pdf

【MIT博士论文】深度学习几何表示，138页pdf

专知

18+阅读 · 2022年9月4日

面试题：请简要介绍下tensorflow的计算图

面试题：请简要介绍下tensorflow的计算图

七月在线实验室

14+阅读 · 2019年6月10日

十种深度学习推荐系统代码实现，持续更新中！！！

十种深度学习推荐系统代码实现，持续更新中！！！

专知

113+阅读 · 2019年4月25日

基于数据的分布式鲁棒优化算法及其应用【附PPT与视频资料】

基于数据的分布式鲁棒优化算法及其应用【附PPT与视频资料】

人工智能前沿讲习班

27+阅读 · 2018年12月13日

一句代码发布你的TensorFlow模型，简明TensorFlow Serving上手教程

一句代码发布你的TensorFlow模型，简明TensorFlow Serving上手教程

专知

13+阅读 · 2018年11月30日

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

深度学习与NLP

12+阅读 · 2018年9月13日

资源 | 用Python和NumPy学习《深度学习》中的线性代数基础

资源 | 用Python和NumPy学习《深度学习》中的线性代数基础

机器之心

18+阅读 · 2018年5月14日

【干货】深度学习中的线性代数

【干货】深度学习中的线性代数

专知

21+阅读 · 2018年3月30日

【干货】理解深度学习中的矩阵运算

【干货】理解深度学习中的矩阵运算

专知

12+阅读 · 2018年2月12日

手把手教TensorFlow（附代码）

手把手教TensorFlow（附代码）

深度学习世界

15+阅读 · 2017年10月17日

相关论文

Dynamics-Encoded Deep Learning for Robust System Identification and Parameter Estimation

Arxiv

0+阅读 · 5月1日

Decoding Algorithms for Tensor Codes

Arxiv

0+阅读 · 4月17日

Leveraging Mathematical Reasoning of LLMs for Efficient GPU Thread Mapping

Arxiv

0+阅读 · 4月14日

Tensor-Parallel Emulation of Quantum Circuits with Block-Cyclic Distributed Matrix Product States

Arxiv

0+阅读 · 4月10日

Implementing Basic Arithmetic in $\mathbb{F}_p$ via $\mathbb{F}_2$, and Its Application for Computing the Hamming Distance of Linear Codes

Arxiv

0+阅读 · 3月31日

Hierarchical Tensor Network Structure Search for High-Dimensional Data

Arxiv

0+阅读 · 3月29日

Robust Matrix Estimation with Side Information

Arxiv

0+阅读 · 3月25日

Automated Tensor-Relational Decomposition for Large-Scale Sparse Tensor Computation

Arxiv

0+阅读 · 3月9日

Rigidity matroids and linear algebraic matroids with applications to matrix completion and tensor codes

Arxiv

0+阅读 · 3月2日

Revisiting Matrix Sketching in Linear Bandits: Achieving Sublinear Regret via Dyadic Block Sketching

Arxiv

0+阅读 · 2月27日

相关基金

图的弦性计算

国家自然科学基金

0+阅读 · 2015年12月31日

直接优化半周长线长的VLSI两阶段迭代布局算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

张量分析及其在高维信息处理中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

基于草图的几何处理和应用

国家自然科学基金

2+阅读 · 2015年12月31日

基于马尔科夫链的线性系统求解问题的高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

求解一类大规模稀疏线性矩阵方程的高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

求解非线性方程的加速迭代算法

国家自然科学基金

0+阅读 · 2014年12月31日

面向众核计算的数值方法协同设计--一种高效且高精度广义有限元方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

线性算子的谱结构及其扰动分析

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员