Scaling modern deep learning workloads demands coordinated placement of data and compute across device meshes, memory hierarchies, and heterogeneous accelerators. We present Axe Layout, a hardware-aware abstraction that maps logical tensor coordinates to a multi-axis physical space via named axes. Axe unifies tiling, sharding, replication, and offsets across inter-device distribution and on-device layouts, enabling collective primitives to be expressed consistently from device meshes to threads. Building on Axe, we design a multi-granularity, distribution-aware DSL and compiler that composes thread-local control with collective operators in a single kernel. Experiments show that our unified approach can bring performance close to hand-tuned kernels on across latest GPU devices and multi-device environments and accelerator backends.


翻译:扩展现代深度学习工作负载需要在设备网格、内存层次结构和异构加速器之间协调数据与计算资源的布局。本文提出Axe布局——一种硬件感知的抽象机制,通过命名轴将逻辑张量坐标映射到多轴物理空间。Axe在设备间分布与设备内布局两个层面,统一了分块(tiling)、分片(sharding)、复制(replication)和偏移量(offsets)的表示,使得从设备网格到线程层的集体计算原语能够以一致方式表达。基于Axe,我们设计了一个多粒度、分布感知的领域专用语言(DSL)及其编译器,可在单个内核中融合线程局部控制流与集体运算符。实验表明,这种统一方法在最新GPU设备、多设备环境及各类加速器后端上,能够实现接近手工调优内核的性能水平。

0
下载
关闭预览

相关内容

编译器(Compiler),是一种计算机程序,它会将用某种编程语言写成的源代码(原始语言),转换成另一种编程语言(目标语言)。
可解释的机器学习模型和架构
专知会员服务
92+阅读 · 2023年9月17日
几何观点下的深度学习
专知会员服务
35+阅读 · 2022年12月13日
概述自动机器学习(AutoML)
人工智能学家
19+阅读 · 2019年8月11日
从信息瓶颈理论一瞥机器学习的“大一统理论”
这可能是「多模态机器学习」最通俗易懂的介绍
计算机视觉life
113+阅读 · 2018年12月20日
<好书推荐> -《Pro Deep Learning with TensorFlow》分享
深度学习与NLP
12+阅读 · 2018年9月13日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
VIP会员
相关VIP内容
可解释的机器学习模型和架构
专知会员服务
92+阅读 · 2023年9月17日
几何观点下的深度学习
专知会员服务
35+阅读 · 2022年12月13日
相关基金
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员