Hybrid Adaptive Tuning for Tiered Memory Systems - 专知论文

会员服务 ·

0

内存 · 分层 · 系统 · 在线 · 混合 ·

Hybrid Adaptive Tuning for Tiered Memory Systems

翻译：分层内存系统的混合自适应调优技术

Xi Wang,Jie Liu,Shuangyan Yang,Jongryool Kim,Pengfei Su,Dong Li

Memory tiering provides a cost-effective solution to increase memory capacity, utilization, and even bandwidth. Memory tiering relies on system software for memory profiling, detection of frequently accessed pages, and page migration. Such a system software often comes with system parameters. The configurations of those parameters impact application performance. We comprehensively classify system parameters, and characterize the sensitivity of application performance to them using representative memory tiering solutions. Furthermore, we introduce a lightweight and user-friendly framework PTMT, which automates tuning of parameters at runtime for various memory tiering solutions. We identify major challenges for online tuning of memory tiering. PTMT uses a hybrid "offline + online" tuning method: while the offline phase builds a performance database for online queries and reduces runtime overhead, the online phase uses reinforcement learning (customized to memory tiering) to tune. PTMT improves performance by 30%, 26%, 21%, and 14%, on four memory tiering solutions (TPP, UPM, Colloid, and AutoNUMA), compared to using the default configurations. PTMT outperforms the state-of-the-art by 32% on average.

翻译：内存分层技术通过系统软件实现内存性能分析、频繁访问页面检测及页面迁移等机制，以低成本提升内存容量、利用率乃至带宽。此类系统软件通常包含多个系统参数，其配置直接影响应用性能。本文对系统参数进行了系统分类，并基于代表性内存分层方案，特征化分析了应用性能对参数的敏感度。进一步地，我们提出轻量级且用户友好的框架PTMT，能够自动实现对多种内存分层方案的运行时参数调优。我们识别了内存分层在线调优的主要挑战。PTMT采用"离线+在线"混合调优方法：离线阶段用于构建性能数据库以支持在线查询，并降低运行时开销；在线阶段则使用定制化强化学习（针对内存分层场景）进行调优。实验表明，相较于默认配置，PTMT在四种内存分层方案（TPP、UPM、Colloid、AutoNUMA）上分别实现30%、26%、21%和14%的性能提升，且平均性能优于现有最优方案32%。

0

相关内容

《分层多智能体系统分类：设计范式、协调机制与工业应用》最新28页

《分层多智能体系统分类：设计范式、协调机制与工业应用》最新28页

专知会员服务

36+阅读 · 2025年8月20日

推荐系统融合排序的多目标寻优技术

推荐系统融合排序的多目标寻优技术

专知会员服务

19+阅读 · 2024年8月17日

国家标准《信息技术云计算参考架构》

国家标准《信息技术云计算参考架构》

专知会员服务

37+阅读 · 2024年5月24日

推荐系统技术综述

推荐系统技术综述

专知会员服务

55+阅读 · 2023年5月13日

智能化分布式协同作战体系发展综述

智能化分布式协同作战体系发展综述

专知会员服务

194+阅读 · 2022年6月10日

【清华大学陈游旻博士论文】持久性内存存储系统关键技术研究

【清华大学陈游旻博士论文】持久性内存存储系统关键技术研究

专知会员服务

29+阅读 · 2021年11月24日

混合增强视觉认知架构及其关键技术进展

混合增强视觉认知架构及其关键技术进展

专知会员服务

46+阅读 · 2021年11月20日

中国信通院发布《下一代数据存储技术研究报告（2021年）》（附pdf）

专知会员服务

46+阅读 · 2021年7月13日

【博士论文】非易失内存系统中的写优化和持久化技术研究

专知会员服务

11+阅读 · 2020年12月23日

个性化推荐系统技术进展

个性化推荐系统技术进展

专知会员服务

66+阅读 · 2020年8月15日

分布式核心技术知识图谱，带走不谢

分布式核心技术知识图谱，带走不谢

架构师之路

12+阅读 · 2019年9月23日

推荐系统原理、工程、大厂(Youtube、BAT、TMB)架构干活分享

推荐系统原理、工程、大厂(Youtube、BAT、TMB)架构干活分享

深度学习与NLP

40+阅读 · 2019年9月13日

CVPR 2019 | 告别低分辨率网络，微软提出高分辨率深度神经网络HRNet

CVPR 2019 | 告别低分辨率网络，微软提出高分辨率深度神经网络HRNet

微软研究院AI头条

14+阅读 · 2019年5月21日

工行基于MySQL构建分布式架构的转型之路

工行基于MySQL构建分布式架构的转型之路

炼数成金订阅号

15+阅读 · 2019年5月16日

十种深度学习推荐系统代码实现，持续更新中！！！

十种深度学习推荐系统代码实现，持续更新中！！！

专知

113+阅读 · 2019年4月25日

最新23页《深度学习图像超分辨率应用综述》论文，带你全面了解深度学习超分方法（附下载）

最新23页《深度学习图像超分辨率应用综述》论文，带你全面了解深度学习超分方法（附下载）

专知

43+阅读 · 2019年2月20日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

AI前线

11+阅读 · 2018年5月15日

深度学习在推荐系统上的应用

深度学习在推荐系统上的应用

架构文摘

13+阅读 · 2018年2月22日

今日头条推荐系统架构演进之路

今日头条推荐系统架构演进之路

QCon

32+阅读 · 2017年6月21日

分布式工业自动化系统可重构混合计算模型研究

国家自然科学基金

4+阅读 · 2015年12月31日

考虑不同渗透率条件的分布式逆变系统自适应并网差异化控制策略研究

国家自然科学基金

1+阅读 · 2015年12月31日

非主从式混合云存储系统伸缩性管理研究

国家自然科学基金

1+阅读 · 2015年12月31日

异构网络中的分层并发传输技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

“非对称多通道”异质、异构内存系统架构及“启发式”混合内存资源管理机制的研究

国家自然科学基金

0+阅读 · 2015年12月31日

嵌入式异构多核系统应用程序自动并行化过程关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向可重构多核处理器系统的分层次自适应优化机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的高时效并行计算机系统结构与技术

国家自然科学基金

0+阅读 · 2014年12月31日

主动配电网分布式自律优化调控的关键技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于认知技术的分层异构网络能效分析与资源分配研究

国家自然科学基金

0+阅读 · 2014年12月31日

Maximizing Memory-Level Parallelism via Integrated Stochastic Logic-in-Memory Architectures

Arxiv

0+阅读 · 4月25日

Efficient Page Migration in Hybrid Memory Systems

Arxiv

0+阅读 · 4月21日

Equilibria: Fair Multi-Tenant CXL Memory Tiering At Scale

Arxiv

0+阅读 · 4月20日

Optimizing Memory Allocation in Distributed Clusters with Predictive Modeling

Arxiv

0+阅读 · 4月20日

Tensor Memory Engine: On-the-fly Data Reorganization for Ideal Locality

Arxiv

0+阅读 · 4月14日

TierBPF: Page Migration Admission Control for Tiered Memory via eBPF

Arxiv

0+阅读 · 4月14日

ODMA: On-Demand Memory Allocation Strategy for LLM Serving on LPDDR-Class Accelerators

Arxiv

0+阅读 · 3月25日

Communication-Avoiding SpGEMM via Trident Partitioning on Hierarchical GPU Interconnects

Arxiv

0+阅读 · 3月22日

Resilient Chaotic Cross-Layer Routing for Smart Grid IoT Networks

Arxiv

0+阅读 · 3月15日

System-Technology Co-Optimization of Bitline Routing and Bonding Pathways in Monolithic 3D DRAM Architectures

Arxiv

0+阅读 · 3月12日

VIP会员

文章信息

相关主题

最新内容

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

3+阅读 · 今天14:49

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

3+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

5+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

7+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

10+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

11+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

7+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

15+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

8+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

6+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

8+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

相关VIP内容

《分层多智能体系统分类：设计范式、协调机制与工业应用》最新28页

《分层多智能体系统分类：设计范式、协调机制与工业应用》最新28页

专知会员服务

36+阅读 · 2025年8月20日

推荐系统融合排序的多目标寻优技术

推荐系统融合排序的多目标寻优技术

专知会员服务

19+阅读 · 2024年8月17日

国家标准《信息技术云计算参考架构》

国家标准《信息技术云计算参考架构》

专知会员服务

37+阅读 · 2024年5月24日

推荐系统技术综述

推荐系统技术综述

专知会员服务

55+阅读 · 2023年5月13日

智能化分布式协同作战体系发展综述

智能化分布式协同作战体系发展综述

专知会员服务

194+阅读 · 2022年6月10日

【清华大学陈游旻博士论文】持久性内存存储系统关键技术研究

【清华大学陈游旻博士论文】持久性内存存储系统关键技术研究

专知会员服务

29+阅读 · 2021年11月24日

混合增强视觉认知架构及其关键技术进展

混合增强视觉认知架构及其关键技术进展

专知会员服务

46+阅读 · 2021年11月20日

中国信通院发布《下一代数据存储技术研究报告（2021年）》（附pdf）

专知会员服务

46+阅读 · 2021年7月13日

【博士论文】非易失内存系统中的写优化和持久化技术研究

专知会员服务

11+阅读 · 2020年12月23日

个性化推荐系统技术进展

个性化推荐系统技术进展

专知会员服务

66+阅读 · 2020年8月15日

热门VIP内容

开通专知VIP会员享更多权益服务

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

相关资讯

分布式核心技术知识图谱，带走不谢

分布式核心技术知识图谱，带走不谢

架构师之路

12+阅读 · 2019年9月23日

推荐系统原理、工程、大厂(Youtube、BAT、TMB)架构干活分享

推荐系统原理、工程、大厂(Youtube、BAT、TMB)架构干活分享

深度学习与NLP

40+阅读 · 2019年9月13日

CVPR 2019 | 告别低分辨率网络，微软提出高分辨率深度神经网络HRNet

CVPR 2019 | 告别低分辨率网络，微软提出高分辨率深度神经网络HRNet

微软研究院AI头条

14+阅读 · 2019年5月21日

工行基于MySQL构建分布式架构的转型之路

工行基于MySQL构建分布式架构的转型之路

炼数成金订阅号

15+阅读 · 2019年5月16日

十种深度学习推荐系统代码实现，持续更新中！！！

十种深度学习推荐系统代码实现，持续更新中！！！

专知

113+阅读 · 2019年4月25日

最新23页《深度学习图像超分辨率应用综述》论文，带你全面了解深度学习超分方法（附下载）

最新23页《深度学习图像超分辨率应用综述》论文，带你全面了解深度学习超分方法（附下载）

专知

43+阅读 · 2019年2月20日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

一张长图，让你直击推荐系统背后算法、架构、深度学习等运用！

AI前线

11+阅读 · 2018年5月15日

深度学习在推荐系统上的应用

深度学习在推荐系统上的应用

架构文摘

13+阅读 · 2018年2月22日

今日头条推荐系统架构演进之路

今日头条推荐系统架构演进之路

QCon

32+阅读 · 2017年6月21日

相关论文

Maximizing Memory-Level Parallelism via Integrated Stochastic Logic-in-Memory Architectures

Arxiv

0+阅读 · 4月25日

Efficient Page Migration in Hybrid Memory Systems

Arxiv

0+阅读 · 4月21日

Equilibria: Fair Multi-Tenant CXL Memory Tiering At Scale

Arxiv

0+阅读 · 4月20日

Optimizing Memory Allocation in Distributed Clusters with Predictive Modeling

Arxiv

0+阅读 · 4月20日

Tensor Memory Engine: On-the-fly Data Reorganization for Ideal Locality

Arxiv

0+阅读 · 4月14日

TierBPF: Page Migration Admission Control for Tiered Memory via eBPF

Arxiv

0+阅读 · 4月14日

ODMA: On-Demand Memory Allocation Strategy for LLM Serving on LPDDR-Class Accelerators

Arxiv

0+阅读 · 3月25日

Communication-Avoiding SpGEMM via Trident Partitioning on Hierarchical GPU Interconnects

Arxiv

0+阅读 · 3月22日

Resilient Chaotic Cross-Layer Routing for Smart Grid IoT Networks

Arxiv

0+阅读 · 3月15日

System-Technology Co-Optimization of Bitline Routing and Bonding Pathways in Monolithic 3D DRAM Architectures

Arxiv

0+阅读 · 3月12日

相关基金

分布式工业自动化系统可重构混合计算模型研究

国家自然科学基金

4+阅读 · 2015年12月31日

考虑不同渗透率条件的分布式逆变系统自适应并网差异化控制策略研究

国家自然科学基金

1+阅读 · 2015年12月31日

非主从式混合云存储系统伸缩性管理研究

国家自然科学基金

1+阅读 · 2015年12月31日

异构网络中的分层并发传输技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

“非对称多通道”异质、异构内存系统架构及“启发式”混合内存资源管理机制的研究

国家自然科学基金

0+阅读 · 2015年12月31日

嵌入式异构多核系统应用程序自动并行化过程关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向可重构多核处理器系统的分层次自适应优化机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的高时效并行计算机系统结构与技术

国家自然科学基金

0+阅读 · 2014年12月31日

主动配电网分布式自律优化调控的关键技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于认知技术的分层异构网络能效分析与资源分配研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员