P-MOSS: Scheduling Main-Memory Indexes Over NUMA Servers Using Next Token Prediction - 专知论文

会员服务 ·

0

调度 · 词元 · 服务器 · 中央处理器 (CPU) · 异构 ·

P-MOSS: Scheduling Main-Memory Indexes Over NUMA Servers Using Next Token Prediction

翻译：P-MOSS：基于下一词元预测的NUMA服务器主存索引调度框架

Yeasir Rayhan,Walid G. Aref

from arxiv, Accepted to SIGMOD'26

Ever since the Dennard scaling broke down in the early 2000s and the frequency of the CPUs stalled, vendors have started to increase the core count in each CPU chip at the expense of introducing heterogeneity, thus ushering the era of NUMA and Chiplet processors. Since then, the heterogeneity in the design space of hardware has only increased to the point that DBMS performance may vary significantly up to an order of magnitude in modern servers. An important factor that affects performance includes the location of the logical cores where the DBMS queries execute, and the location where the data resides. This paper introduces P-MOSS, a learned spatial scheduling framework that schedules query execution to specific logical cores, and co-locates data on the corresponding NUMA node. For cross-hardware and workload adaptability, P-MOSS leverages core principles from Large Language Models, such as Next Token prediction, Generative Pre-training, and Fine-tuning. In the spirit of hardware-software synergy, P-MOSS guides its scheduling decision solely based on the low-level hardware statistics collected from the hardware Performance Monitoring Unit with the aid of a Decision Transformer. Experimental evaluation is performed in the context of the B$^+$-Tree index. Performance results demonstrate that P-MOSS offers an improvement of up to $6\times$ over traditional schedules in terms of query throughput.

翻译：自21世纪初登纳德缩放定律失效及CPU频率停滞以来，厂商开始通过引入异构性来增加每个CPU芯片的核心数量，从而开启了NUMA与小芯片处理器时代。此后，硬件设计空间的异构性持续加剧，导致现代服务器中数据库管理系统性能差异可达数量级。影响性能的关键因素包括数据库查询执行所在逻辑核心的位置，以及数据存储的位置。本文提出P-MOSS——一种基于学习的空间调度框架，可将查询执行调度至特定逻辑核心，并将数据协同定位至对应的NUMA节点。为提升跨硬件与工作负载的适应性，P-MOSS借鉴了大型语言模型的核心原理，如下一词元预测、生成式预训练与微调。基于软硬件协同设计理念，P-MOSS借助决策Transformer，仅通过从硬件性能监控单元采集的低级硬件统计数据进行调度决策。实验评估在B$^+$树索引场景下进行，性能结果表明：在查询吞吐量方面，P-MOSS相比传统调度方法最高可提升$6\times$。

0

相关内容

《探索用于低层级任务区分与分类的转址旁路缓冲》

《探索用于低层级任务区分与分类的转址旁路缓冲》

专知会员服务

13+阅读 · 1月1日

Meta-Transformer：多模态学习的统一框架

Meta-Transformer：多模态学习的统一框架

专知会员服务

59+阅读 · 2023年7月21日

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

专知会员服务

89+阅读 · 2023年4月6日

DPU发展分析报告（2022年），44页pdf

DPU发展分析报告（2022年），44页pdf

专知会员服务

26+阅读 · 2023年1月13日

《用于计算机系统的人工智能增强设计空间探索的机器学习》哥伦比亚大学2022最新博士论文

《用于计算机系统的人工智能增强设计空间探索的机器学习》哥伦比亚大学2022最新博士论文

专知会员服务

16+阅读 · 2022年6月6日

重磅发布|《信息系统稳定性保障能力建设指南（1.0）》，附下载方式

重磅发布|《信息系统稳定性保障能力建设指南（1.0）》，附下载方式

专知会员服务

45+阅读 · 2022年4月11日

中科院计算所牵头发布《专⽤数据处理器DPU技术白皮书》，94页pdf

中科院计算所牵头发布《专⽤数据处理器DPU技术白皮书》，94页pdf

专知会员服务

91+阅读 · 2021年10月24日

【伯利克博士论文】深度学习应用的算法、硬件和调度的协同设计，161页pdf

【伯利克博士论文】深度学习应用的算法、硬件和调度的协同设计，161页pdf

专知会员服务

77+阅读 · 2021年8月18日

内存计算研究进展

专知会员服务

29+阅读 · 2021年2月26日

【大规模数据系统，552页ppt】Large-scale Data Systems

【大规模数据系统，552页ppt】Large-scale Data Systems

专知会员服务

61+阅读 · 2019年12月21日

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

专知

14+阅读 · 2023年4月6日

Google at KDD 2020，提出MoSE框架显式建模用户行为序列提升多任务学习效果

Google at KDD 2020，提出MoSE框架显式建模用户行为序列提升多任务学习效果

AINLP

11+阅读 · 2020年7月7日

工行基于MySQL构建分布式架构的转型之路

工行基于MySQL构建分布式架构的转型之路

炼数成金订阅号

15+阅读 · 2019年5月16日

亿级订单数据的访问与存储，怎么实现与优化？

亿级订单数据的访问与存储，怎么实现与优化？

码农翻身

16+阅读 · 2019年4月17日

使用 Canal 实现数据异构

使用 Canal 实现数据异构

性能与架构

20+阅读 · 2019年3月4日

【泡泡图灵智库】MapNet：一种便于动态更新的全局地图存储方法（CVPR）

【泡泡图灵智库】MapNet：一种便于动态更新的全局地图存储方法（CVPR）

泡泡机器人SLAM

11+阅读 · 2018年12月10日

【CPS】社会物理信息系统（CPSS）及其典型应用

【CPS】社会物理信息系统（CPSS）及其典型应用

产业智能官

16+阅读 · 2018年9月18日

专栏 | 神经网络架构搜索（NAS）综述（附AutoML资料推荐）

专栏 | 神经网络架构搜索（NAS）综述（附AutoML资料推荐）

机器之心

13+阅读 · 2018年9月1日

【书籍】深度学习框架：PyTorch入门与实践（附代码）

【书籍】深度学习框架：PyTorch入门与实践（附代码）

专知

16+阅读 · 2018年1月21日

今日头条推荐系统架构演进之路

今日头条推荐系统架构演进之路

QCon

32+阅读 · 2017年6月21日

基于非易失内存设备的数据读写性能优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

3D堆叠众核处理器共享存储访问均衡性研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

具有重构特征的系统可靠性建模方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

嵌入式异构多核系统应用程序自动并行化过程关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于动态匹配的高能量利用率多层堆叠结构静态随机存储器（SRAM）关键技术

国家自然科学基金

0+阅读 · 2015年12月31日

面向可重构多核处理器系统的分层次自适应优化机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

可与MPSoC高度融合的片上自主测试-自主修复关键技术研究：针对自然、人为可靠性威胁

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据计算的高吞吐量众核处理器关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

HyMem: Hybrid Memory Architecture with Dynamic Retrieval Scheduling

Arxiv

0+阅读 · 2月15日

RooflineBench: A Benchmarking Framework for On-Device LLMs via Roofline Analysis

Arxiv

0+阅读 · 2月12日

KORAL: Knowledge Graph Guided LLM Reasoning for SSD Operational Analysis

Arxiv

0+阅读 · 2月10日

Morphis: SLO-Aware Resource Scheduling for Microservices with Time-Varying Call Graphs

Arxiv

0+阅读 · 2月3日

Morphis: SLO-Aware Resource Scheduling for Microservices with Time-Varying Call Graphs

Arxiv

0+阅读 · 2月1日

AnoMod: A Dataset for Anomaly Detection and Root Cause Analysis in Microservice Systems

Arxiv

0+阅读 · 1月30日

Confidential Computing on Heterogeneous CPU-GPU Systems: Survey and Future Directions

Arxiv

0+阅读 · 1月26日

RevaMp3D: Architecting the Processor Core and Cache Hierarchy for Systems with Monolithically-Integrated Logic and Memory

Arxiv

0+阅读 · 1月22日

A Two-Stage GPU Kernel Tuner Combining Semantic Refactoring and Search-Based Optimization

Arxiv

0+阅读 · 1月21日

KernelEvolve: Scaling Agentic Kernel Coding for Heterogeneous AI Accelerators at Meta

Arxiv

0+阅读 · 1月16日

VIP会员

文章信息

相关主题

中央处理器 (CPU)

最新内容

大语言模型平台在国防情报应用中的对比

大语言模型平台在国防情报应用中的对比

专知会员服务

1+阅读 · 25分钟前

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

专知会员服务

1+阅读 · 37分钟前

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

专知会员服务

1+阅读 · 41分钟前

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

专知会员服务

1+阅读 · 53分钟前

《仿真互操作性标准：实时平台参考联邦对象模型指南、原理与互操作性模式标准》300页

《仿真互操作性标准：实时平台参考联邦对象模型指南、原理与互操作性模式标准》300页

专知会员服务

2+阅读 · 今天2:37

《自主远程巡飞弹药打击系统的嵌入式人工智能感知框架》

《自主远程巡飞弹药打击系统的嵌入式人工智能感知框架》

专知会员服务

1+阅读 · 今天2:22

美海军“超配项目”

美海军“超配项目”

专知会员服务

1+阅读 · 今天2:13

《美陆军条例：陆军指挥政策（2026版）》

《美陆军条例：陆军指挥政策（2026版）》

专知会员服务

10+阅读 · 4月21日

《提升美军全域城市作战训练最佳实践的案例研究》366页

《提升美军全域城市作战训练最佳实践的案例研究》366页

专知会员服务

12+阅读 · 4月21日

《军用自主人工智能系统的治理与安全》

《军用自主人工智能系统的治理与安全》

专知会员服务

7+阅读 · 4月21日

美海军数字作战负责人：如何利用数据快速生成战斗力

美海军数字作战负责人：如何利用数据快速生成战斗力

专知会员服务

8+阅读 · 4月21日

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

11+阅读 · 4月20日

《系统簇式多域作战规划范畴论框架》

《系统簇式多域作战规划范畴论框架》

专知会员服务

10+阅读 · 4月20日

《美国防部指令6130.03，第2卷服役医疗标准：保留》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

专知会员服务

6+阅读 · 4月20日

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

专知会员服务

4+阅读 · 4月20日

相关VIP内容

《探索用于低层级任务区分与分类的转址旁路缓冲》

《探索用于低层级任务区分与分类的转址旁路缓冲》

专知会员服务

13+阅读 · 1月1日

Meta-Transformer：多模态学习的统一框架

Meta-Transformer：多模态学习的统一框架

专知会员服务

59+阅读 · 2023年7月21日

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

专知会员服务

89+阅读 · 2023年4月6日

DPU发展分析报告（2022年），44页pdf

DPU发展分析报告（2022年），44页pdf

专知会员服务

26+阅读 · 2023年1月13日

《用于计算机系统的人工智能增强设计空间探索的机器学习》哥伦比亚大学2022最新博士论文

《用于计算机系统的人工智能增强设计空间探索的机器学习》哥伦比亚大学2022最新博士论文

专知会员服务

16+阅读 · 2022年6月6日

重磅发布|《信息系统稳定性保障能力建设指南（1.0）》，附下载方式

重磅发布|《信息系统稳定性保障能力建设指南（1.0）》，附下载方式

专知会员服务

45+阅读 · 2022年4月11日

中科院计算所牵头发布《专⽤数据处理器DPU技术白皮书》，94页pdf

中科院计算所牵头发布《专⽤数据处理器DPU技术白皮书》，94页pdf

专知会员服务

91+阅读 · 2021年10月24日

【伯利克博士论文】深度学习应用的算法、硬件和调度的协同设计，161页pdf

【伯利克博士论文】深度学习应用的算法、硬件和调度的协同设计，161页pdf

专知会员服务

77+阅读 · 2021年8月18日

内存计算研究进展

专知会员服务

29+阅读 · 2021年2月26日

【大规模数据系统，552页ppt】Large-scale Data Systems

【大规模数据系统，552页ppt】Large-scale Data Systems

专知会员服务

61+阅读 · 2019年12月21日

热门VIP内容

开通专知VIP会员享更多权益服务

美陆军“增强任务分析”实验：将人工智能集成到军事决策流程中

《杀伤链中人类判断的终结？论AI智能体对主动权与解释权的重置》

大语言模型平台在国防情报应用中的对比

《面向安全态势自适应决策的情报信息系统与机器学习算法研究》

相关资讯

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

专知

14+阅读 · 2023年4月6日

Google at KDD 2020，提出MoSE框架显式建模用户行为序列提升多任务学习效果

Google at KDD 2020，提出MoSE框架显式建模用户行为序列提升多任务学习效果

AINLP

11+阅读 · 2020年7月7日

工行基于MySQL构建分布式架构的转型之路

工行基于MySQL构建分布式架构的转型之路

炼数成金订阅号

15+阅读 · 2019年5月16日

亿级订单数据的访问与存储，怎么实现与优化？

亿级订单数据的访问与存储，怎么实现与优化？

码农翻身

16+阅读 · 2019年4月17日

使用 Canal 实现数据异构

使用 Canal 实现数据异构

性能与架构

20+阅读 · 2019年3月4日

【泡泡图灵智库】MapNet：一种便于动态更新的全局地图存储方法（CVPR）

【泡泡图灵智库】MapNet：一种便于动态更新的全局地图存储方法（CVPR）

泡泡机器人SLAM

11+阅读 · 2018年12月10日

【CPS】社会物理信息系统（CPSS）及其典型应用

【CPS】社会物理信息系统（CPSS）及其典型应用

产业智能官

16+阅读 · 2018年9月18日

专栏 | 神经网络架构搜索（NAS）综述（附AutoML资料推荐）

专栏 | 神经网络架构搜索（NAS）综述（附AutoML资料推荐）

机器之心

13+阅读 · 2018年9月1日

【书籍】深度学习框架：PyTorch入门与实践（附代码）

【书籍】深度学习框架：PyTorch入门与实践（附代码）

专知

16+阅读 · 2018年1月21日

今日头条推荐系统架构演进之路

今日头条推荐系统架构演进之路

QCon

32+阅读 · 2017年6月21日

相关论文

HyMem: Hybrid Memory Architecture with Dynamic Retrieval Scheduling

Arxiv

0+阅读 · 2月15日

RooflineBench: A Benchmarking Framework for On-Device LLMs via Roofline Analysis

Arxiv

0+阅读 · 2月12日

KORAL: Knowledge Graph Guided LLM Reasoning for SSD Operational Analysis

Arxiv

0+阅读 · 2月10日

Morphis: SLO-Aware Resource Scheduling for Microservices with Time-Varying Call Graphs

Arxiv

0+阅读 · 2月3日

Morphis: SLO-Aware Resource Scheduling for Microservices with Time-Varying Call Graphs

Arxiv

0+阅读 · 2月1日

AnoMod: A Dataset for Anomaly Detection and Root Cause Analysis in Microservice Systems

Arxiv

0+阅读 · 1月30日

Confidential Computing on Heterogeneous CPU-GPU Systems: Survey and Future Directions

Arxiv

0+阅读 · 1月26日

RevaMp3D: Architecting the Processor Core and Cache Hierarchy for Systems with Monolithically-Integrated Logic and Memory

Arxiv

0+阅读 · 1月22日

A Two-Stage GPU Kernel Tuner Combining Semantic Refactoring and Search-Based Optimization

Arxiv

0+阅读 · 1月21日

KernelEvolve: Scaling Agentic Kernel Coding for Heterogeneous AI Accelerators at Meta

Arxiv

0+阅读 · 1月16日

相关基金

基于非易失内存设备的数据读写性能优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

3D堆叠众核处理器共享存储访问均衡性研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

具有重构特征的系统可靠性建模方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

嵌入式异构多核系统应用程序自动并行化过程关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于动态匹配的高能量利用率多层堆叠结构静态随机存储器（SRAM）关键技术

国家自然科学基金

0+阅读 · 2015年12月31日

面向可重构多核处理器系统的分层次自适应优化机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

可与MPSoC高度融合的片上自主测试-自主修复关键技术研究：针对自然、人为可靠性威胁

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据计算的高吞吐量众核处理器关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员