The ability to dynamically allocate memory is fundamental in modern programming languages. However, this feature is not adequately supported in current general-purpose PIM devices. To identify key design principles that PIM must consider, we conduct a design space exploration of PIM memory allocators, examining various strategies for metadata placement and management of the allocator. Based on this exploration, we introduce PIM-malloc, a fast and scalable memory allocator for general-purpose PIM that operates on real PIM hardware, achieving a x66 improvement in memory allocation performance. This design is further enhanced with a lightweight, per-PIM core hardware cache, specifically designed for dynamic memory allocation, achieving an additional 31% performance improvement. Finally, we demonstrate the applicability of PIM-malloc by developing several representative PIM workloads, demonstrating its effectiveness in enhancing programmability.


翻译:动态内存分配能力是现代编程语言的基础特性。然而,当前通用存内计算设备对此功能的支持尚不充分。为明确存内计算架构必须考虑的关键设计原则,我们对存内计算内存分配器进行了设计空间探索,研究了元数据放置与分配器管理的多种策略。基于此探索,我们提出了PIM-malloc——一种在真实存内计算硬件上运行的快速可扩展通用内存分配器,其内存分配性能实现了66倍提升。该设计进一步配备了专为动态内存分配设计的轻量级单核硬件缓存,额外获得了31%的性能提升。最后,我们通过开发多个代表性存内计算工作负载,验证了PIM-malloc的适用性,证明了其在提升程序可编程性方面的有效性。

0
下载
关闭预览

相关内容

【CMU博士论文】算法和架构的学习
专知会员服务
36+阅读 · 2024年9月27日
【ICML 2024】零阶优化器微调大模型,大幅降低内存
专知会员服务
32+阅读 · 2024年7月8日
专知会员服务
29+阅读 · 2021年2月26日
概述自动机器学习(AutoML)
人工智能学家
19+阅读 · 2019年8月11日
深度学习中Attention Mechanism详细介绍:原理、分类及应用
深度学习与NLP
10+阅读 · 2019年2月18日
新型阻变存储器的物理研究与产业化前景
中国物理学会期刊网
13+阅读 · 2017年11月1日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员