A Programming Model for Disaggregated Memory over CXL - 专知论文

会员服务 ·

0

内存 · 编程 · 编程模型 · 分解 · 系统 ·

A Programming Model for Disaggregated Memory over CXL

翻译：基于CXL的分解式内存编程模型

Gal Assa,Moritz Lumme,Lucas Bürgi,Michal Friedman,Ori Lahav

CXL (Compute Express Link) is an emerging open industry-standard interconnect between processing and memory devices that is expected to revolutionize the way systems are designed. It enables cache-coherent, shared memory pools in a disaggregated fashion at unprecedented scales, allowing algorithms to interact with various storage devices using simple loads and stores. While CXL unleashes unique opportunities, it also introduces challenges of data management and crash consistency. For example, CXL currently lacks an adequate programming model, making it impossible to reason about the correctness and behavior of systems on top. In this work, we present CXL0, the first programming model for concurrent programs over CXL. We propose a high-level abstraction for memory accesses and formally define operational semantics. We demonstrate that CXL0 captures a wide range of current and future CXL setups and perform initial measurements on real hardware. To illustrate the usefulness of CXL0, we present a general transformation that enhances any linearizable concurrent algorithm with durability in a distributed partial-crash setting. We believe that this work will serve as a stepping stone for systems design and programming on top of CXL.

翻译：CXL（Compute Express Link）是一种新兴的开放行业标准互连技术，用于连接处理器与内存设备，有望彻底改变系统设计方式。它以分解式架构在空前规模上实现缓存一致性的共享内存池，使得算法能够通过简单的加载和存储操作与各类存储设备交互。尽管CXL带来了独特机遇，但也引入了数据管理与故障一致性的挑战。例如，当前CXL缺乏完善的编程模型，导致无法在理论上保证上层系统的正确性与行为可推演性。本研究提出CXL0——首个面向CXL并发程序的编程模型。我们建立了内存访问的高层抽象形式化定义操作语义，论证了CXL0能够涵盖当前及未来多种CXL配置方案，并在真实硬件上进行了初步测量。为展示CXL0的实用性，我们提出一种通用转换机制，可在分布式部分故障场景中为任意线性化并发算法增强持久性保障。我们相信这项工作将为基于CXL的系统设计与编程奠定基石。

0

相关内容

TransMLA：多头潜在注意力（MLA）即为所需

TransMLA：多头潜在注意力（MLA）即为所需

专知会员服务

23+阅读 · 2025年2月13日

【新书】解码大型语言模型：理解、实现与优化LLM在自然语言处理应用中的全面指南

【新书】解码大型语言模型：理解、实现与优化LLM在自然语言处理应用中的全面指南

专知会员服务

49+阅读 · 2024年12月13日

【CVPR2024】MA-LMM: 内存增强的大型多模态模型，用于长期视频理解

【CVPR2024】MA-LMM: 内存增强的大型多模态模型，用于长期视频理解

专知会员服务

21+阅读 · 2024年4月9日

使用 OpenLLM 构建和部署大模型应用

使用 OpenLLM 构建和部署大模型应用

专知会员服务

55+阅读 · 2024年1月4日

中科大腾讯最新《多模态大型语言模型》综述，详述多模态指令微调、上下文学习、思维链和辅助视觉推理技术

中科大腾讯最新《多模态大型语言模型》综述，详述多模态指令微调、上下文学习、思维链和辅助视觉推理技术

专知会员服务

105+阅读 · 2023年6月27日

《分布式多智能体强化学习的编码》加州大学等

《分布式多智能体强化学习的编码》加州大学等

专知会员服务

55+阅读 · 2022年11月2日

《分布式部分可观察马尔科夫决策过程中机器智能体的分解信念》美国空军技术学院2022最新论文

《分布式部分可观察马尔科夫决策过程中机器智能体的分解信念》美国空军技术学院2022最新论文

专知会员服务

26+阅读 · 2022年10月18日

【干货书】《XcalableMP PGAS编程语言》，265页pdf，XcalableMP PGAS Programming Language

【干货书】《XcalableMP PGAS编程语言》，265页pdf，XcalableMP PGAS Programming Language

专知会员服务

11+阅读 · 2022年3月24日

【博士论文】解耦合的类脑计算系统栈设计

【博士论文】解耦合的类脑计算系统栈设计

专知会员服务

32+阅读 · 2020年12月14日

【论文】利用Python开发长短时记忆网络，利用深度学习开发序列预测模型（Long Short-Term Memory Networks With Python，Develop Sequence Prediction Models With Deep Learning），246页pdf

【论文】利用Python开发长短时记忆网络，利用深度学习开发序列预测模型（Long Short-Term Memory Networks With Python，Develop Sequence Prediction Models With Deep Learning），246页pdf

专知会员服务

52+阅读 · 2020年1月1日

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

专知

10+阅读 · 2022年11月17日

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

极市平台

11+阅读 · 2021年11月18日

PyTorch 深度学习模型压缩开源库（含量化、剪枝、轻量化结构、BN融合）

PyTorch 深度学习模型压缩开源库（含量化、剪枝、轻量化结构、BN融合）

极市平台

24+阅读 · 2019年12月27日

【AAAI2020论文】用于视觉对话中深度视觉理解的自适应双向编码模型—DualVD, 中科院信工所于静等

【AAAI2020论文】用于视觉对话中深度视觉理解的自适应双向编码模型—DualVD, 中科院信工所于静等

专知

20+阅读 · 2019年11月24日

深度神经网络可解释性方法汇总（附TF代码实现）

深度神经网络可解释性方法汇总（附TF代码实现）

CVer

11+阅读 · 2019年11月4日

TVM: Deep Learning模型的优化编译器(强烈推荐, 附踩坑记录)

TVM: Deep Learning模型的优化编译器(强烈推荐, 附踩坑记录)

极市平台

22+阅读 · 2019年5月3日

【教程】语音识别中的End-to-End模型教程（附178页PDF全文下载）

【教程】语音识别中的End-to-End模型教程（附178页PDF全文下载）

专知

24+阅读 · 2018年11月21日

【干货】深入理解自编码器（附代码实现）

【干货】深入理解自编码器（附代码实现）

专知

136+阅读 · 2018年3月9日

手把手教你入门使用tf-slim库 | 回顾

手把手教你入门使用tf-slim库 | 回顾

AI研习社

12+阅读 · 2017年12月9日

荐书丨OpenCV算法精解：基于Python与C++

荐书丨OpenCV算法精解：基于Python与C++

程序人生

18+阅读 · 2017年11月18日

下一代异构移动网络中分布式云存储的设计与研究

国家自然科学基金

1+阅读 · 2015年12月31日

分布式工业自动化系统可重构混合计算模型研究

国家自然科学基金

4+阅读 · 2015年12月31日

航天器嵌入式操作系统内存管理系统的形式化建模及验证研究

国家自然科学基金

0+阅读 · 2015年12月31日

缓存路由器存储架构及其关键技术的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于非易失内存设备的数据读写性能优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

“非对称多通道”异质、异构内存系统架构及“启发式”混合内存资源管理机制的研究

国家自然科学基金

0+阅读 · 2015年12月31日

神经形态多核处理器的架构模型研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于L21范数约束的非负矩阵分解模型及其拓展

国家自然科学基金

1+阅读 · 2014年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于模型驱动的并发建模语言Apla+设计及其可靠性研究

国家自然科学基金

3+阅读 · 2014年12月31日

Efficient Multi-round LLM Inference over Disaggregated Serving

Arxiv

0+阅读 · 2月16日

PAM: Processing Across Memory Hierarchy for Efficient KV-centric LLM Serving System

Arxiv

0+阅读 · 2月12日

Hazel: Secure and Efficient Disaggregated Storage

Arxiv

0+阅读 · 2月10日

Equilibria: Fair Multi-Tenant CXL Memory Tiering At Scale

Arxiv

0+阅读 · 2月9日

Towards CXL Resilience to CPU Failures

Arxiv

0+阅读 · 2月9日

HyperOffload: Graph-Driven Hierarchical Memory Management for Large Language Models on SuperNode Architectures

Arxiv

0+阅读 · 2月3日

HyperOffload: Graph-Driven Hierarchical Memory Management for Large Language Models on SuperNode Architectures

Arxiv

0+阅读 · 1月31日

TRACE: Unlocking Effective CXL Bandwidth via Lossless Compression and Precision Scaling

Arxiv

0+阅读 · 1月30日

MSCCL++: Rethinking GPU Communication Abstractions for AI Inference

Arxiv

0+阅读 · 1月27日

LinkML: An Open Data Modeling Framework

Arxiv

0+阅读 · 1月20日

VIP会员

文章信息

相关主题

最新内容

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

2+阅读 · 今天15:00

《系统簇式多域作战规划范畴论框架》

《系统簇式多域作战规划范畴论框架》

专知会员服务

2+阅读 · 今天14:54

《美国防部指令6130.03，第2卷服役医疗标准：保留》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

专知会员服务

1+阅读 · 今天14:49

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

专知会员服务

1+阅读 · 今天14:44

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

专知会员服务

2+阅读 · 今天14:03

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

专知会员服务

0+阅读 · 今天13:36

高效视频扩散模型：进展与挑战

高效视频扩散模型：进展与挑战

专知会员服务

0+阅读 · 今天13:34

乌克兰前线的五项创新

乌克兰前线的五项创新

专知会员服务

6+阅读 · 今天6:14

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

4+阅读 · 今天5:59

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

6+阅读 · 今天5:54

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

4+阅读 · 今天5:51

《提升生成模型的安全性与保障》博士论文

《提升生成模型的安全性与保障》博士论文

专知会员服务

4+阅读 · 今天5:47

美国当前高超音速导弹发展概述

美国当前高超音速导弹发展概述

专知会员服务

4+阅读 · 4月19日

《高超音速武器：一项再度兴起的技术》120页slides

《高超音速武器：一项再度兴起的技术》120页slides

专知会员服务

12+阅读 · 4月19日

无人机蜂群建模与仿真方法

无人机蜂群建模与仿真方法

专知会员服务

13+阅读 · 4月19日

相关VIP内容

TransMLA：多头潜在注意力（MLA）即为所需

TransMLA：多头潜在注意力（MLA）即为所需

专知会员服务

23+阅读 · 2025年2月13日

【新书】解码大型语言模型：理解、实现与优化LLM在自然语言处理应用中的全面指南

【新书】解码大型语言模型：理解、实现与优化LLM在自然语言处理应用中的全面指南

专知会员服务

49+阅读 · 2024年12月13日

【CVPR2024】MA-LMM: 内存增强的大型多模态模型，用于长期视频理解

【CVPR2024】MA-LMM: 内存增强的大型多模态模型，用于长期视频理解

专知会员服务

21+阅读 · 2024年4月9日

使用 OpenLLM 构建和部署大模型应用

使用 OpenLLM 构建和部署大模型应用

专知会员服务

55+阅读 · 2024年1月4日

中科大腾讯最新《多模态大型语言模型》综述，详述多模态指令微调、上下文学习、思维链和辅助视觉推理技术

中科大腾讯最新《多模态大型语言模型》综述，详述多模态指令微调、上下文学习、思维链和辅助视觉推理技术

专知会员服务

105+阅读 · 2023年6月27日

《分布式多智能体强化学习的编码》加州大学等

《分布式多智能体强化学习的编码》加州大学等

专知会员服务

55+阅读 · 2022年11月2日

《分布式部分可观察马尔科夫决策过程中机器智能体的分解信念》美国空军技术学院2022最新论文

《分布式部分可观察马尔科夫决策过程中机器智能体的分解信念》美国空军技术学院2022最新论文

专知会员服务

26+阅读 · 2022年10月18日

【干货书】《XcalableMP PGAS编程语言》，265页pdf，XcalableMP PGAS Programming Language

【干货书】《XcalableMP PGAS编程语言》，265页pdf，XcalableMP PGAS Programming Language

专知会员服务

11+阅读 · 2022年3月24日

【博士论文】解耦合的类脑计算系统栈设计

【博士论文】解耦合的类脑计算系统栈设计

专知会员服务

32+阅读 · 2020年12月14日

【论文】利用Python开发长短时记忆网络，利用深度学习开发序列预测模型（Long Short-Term Memory Networks With Python，Develop Sequence Prediction Models With Deep Learning），246页pdf

【论文】利用Python开发长短时记忆网络，利用深度学习开发序列预测模型（Long Short-Term Memory Networks With Python，Develop Sequence Prediction Models With Deep Learning），246页pdf

专知会员服务

52+阅读 · 2020年1月1日

热门VIP内容

开通专知VIP会员享更多权益服务

《系统簇式多域作战规划范畴论框架》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

相关资讯

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

专知

10+阅读 · 2022年11月17日

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

PyTorch 深度剖析：如何使用模型并行技术（Model Parallel）

极市平台

11+阅读 · 2021年11月18日

PyTorch 深度学习模型压缩开源库（含量化、剪枝、轻量化结构、BN融合）

PyTorch 深度学习模型压缩开源库（含量化、剪枝、轻量化结构、BN融合）

极市平台

24+阅读 · 2019年12月27日

【AAAI2020论文】用于视觉对话中深度视觉理解的自适应双向编码模型—DualVD, 中科院信工所于静等

【AAAI2020论文】用于视觉对话中深度视觉理解的自适应双向编码模型—DualVD, 中科院信工所于静等

专知

20+阅读 · 2019年11月24日

深度神经网络可解释性方法汇总（附TF代码实现）

深度神经网络可解释性方法汇总（附TF代码实现）

CVer

11+阅读 · 2019年11月4日

TVM: Deep Learning模型的优化编译器(强烈推荐, 附踩坑记录)

TVM: Deep Learning模型的优化编译器(强烈推荐, 附踩坑记录)

极市平台

22+阅读 · 2019年5月3日

【教程】语音识别中的End-to-End模型教程（附178页PDF全文下载）

【教程】语音识别中的End-to-End模型教程（附178页PDF全文下载）

专知

24+阅读 · 2018年11月21日

【干货】深入理解自编码器（附代码实现）

【干货】深入理解自编码器（附代码实现）

专知

136+阅读 · 2018年3月9日

手把手教你入门使用tf-slim库 | 回顾

手把手教你入门使用tf-slim库 | 回顾

AI研习社

12+阅读 · 2017年12月9日

荐书丨OpenCV算法精解：基于Python与C++

荐书丨OpenCV算法精解：基于Python与C++

程序人生

18+阅读 · 2017年11月18日

相关论文

Efficient Multi-round LLM Inference over Disaggregated Serving

Arxiv

0+阅读 · 2月16日

PAM: Processing Across Memory Hierarchy for Efficient KV-centric LLM Serving System

Arxiv

0+阅读 · 2月12日

Hazel: Secure and Efficient Disaggregated Storage

Arxiv

0+阅读 · 2月10日

Equilibria: Fair Multi-Tenant CXL Memory Tiering At Scale

Arxiv

0+阅读 · 2月9日

Towards CXL Resilience to CPU Failures

Arxiv

0+阅读 · 2月9日

HyperOffload: Graph-Driven Hierarchical Memory Management for Large Language Models on SuperNode Architectures

Arxiv

0+阅读 · 2月3日

HyperOffload: Graph-Driven Hierarchical Memory Management for Large Language Models on SuperNode Architectures

Arxiv

0+阅读 · 1月31日

TRACE: Unlocking Effective CXL Bandwidth via Lossless Compression and Precision Scaling

Arxiv

0+阅读 · 1月30日

MSCCL++: Rethinking GPU Communication Abstractions for AI Inference

Arxiv

0+阅读 · 1月27日

LinkML: An Open Data Modeling Framework

Arxiv

0+阅读 · 1月20日

相关基金

下一代异构移动网络中分布式云存储的设计与研究

国家自然科学基金

1+阅读 · 2015年12月31日

分布式工业自动化系统可重构混合计算模型研究

国家自然科学基金

4+阅读 · 2015年12月31日

航天器嵌入式操作系统内存管理系统的形式化建模及验证研究

国家自然科学基金

0+阅读 · 2015年12月31日

缓存路由器存储架构及其关键技术的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于非易失内存设备的数据读写性能优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

“非对称多通道”异质、异构内存系统架构及“启发式”混合内存资源管理机制的研究

国家自然科学基金

0+阅读 · 2015年12月31日

神经形态多核处理器的架构模型研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于L21范数约束的非负矩阵分解模型及其拓展

国家自然科学基金

1+阅读 · 2014年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于模型驱动的并发建模语言Apla+设计及其可靠性研究

国家自然科学基金

3+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员