Designing and validating efficient cache-coherent memory subsystems is a critical yet complex task in the development of modern multi-core system-on-chip architectures. Rhea is a unified framework that streamlines the design and system-level validation of RTL cache-coherent memory subsystems. On the design side, Rhea generates synthesizable, highly configurable RTL supporting various architectural parameters. On the validation side, Rhea integrates Verilator's cycle-accurate RTL simulation with gem5's full-system simulation, allowing realistic workloads and operating systems to run alongside the actual RTL under test. We apply Rhea to design MSI-based RTL memory subsystems with one and two levels of private caches and scaling up to sixteen cores. Their evaluation with 22 applications from state-of-the-art benchmark suites shows intermediate performance relative to gem5 Ruby's MI and MOESI models. The hybrid gem5-Verilator co-simulation flow incurs a moderate simulation overhead, up to 2.7 times compared to gem5 MI, but achieves higher fidelity by simulating real RTL hardware. This overhead decreases with scale, down to 1.6 times in sixteen-core scenarios. These results demonstrate Rhea's effectiveness and scalability in enabling fast development of RTL cache-coherent memory subsystem designs.


翻译:设计与验证高效的缓存一致性内存子系统是现代多核片上系统架构开发中至关重要却又极其复杂的任务。Rhea是一个统一的框架,旨在简化和加速RTL缓存一致性内存子系统的设计与系统级验证。在设计方面,Rhea能够生成支持多种架构参数、可综合且高度可配置的RTL代码。在验证方面,Rhea将Verilator的周期精确RTL仿真与gem5的全系统仿真相结合,使得实际工作负载和操作系统能够在被测真实RTL硬件上同时运行。我们应用Rhea设计了基于MSI协议、具有一级和二级私有缓存并可扩展至十六核的RTL内存子系统。使用来自前沿基准测试套件的22个应用程序进行评估,结果显示其性能介于gem5 Ruby的MI模型与MOESI模型之间。这种gem5-Verilator混合协同仿真流程会产生适度的仿真开销,与gem5 MI模型相比最高达2.7倍,但通过仿真真实RTL硬件实现了更高的保真度。该开销随系统规模扩大而降低,在十六核场景下可降至1.6倍。这些结果证明了Rhea在实现RTL缓存一致性内存子系统设计快速开发方面的有效性与可扩展性。

0
下载
关闭预览

相关内容

国家标准《信息技术云计算参考架构》
专知会员服务
37+阅读 · 2024年5月24日
Nat. Commun. | 基于最优传输的单细胞数据集成统一计算框架
专知会员服务
12+阅读 · 2022年12月19日
RLChina强化学习课程,国内众大牛讲解,(附课件pdf下载)
专知会员服务
29+阅读 · 2021年2月26日
【经典书】操作系统导论,687页pdf
专知
11+阅读 · 2020年10月28日
聊聊RTA(Realtime API)
AINLP
29+阅读 · 2020年6月5日
深度学习目标检测模型全面综述:Faster R-CNN、R-FCN和SSD
深度学习世界
10+阅读 · 2017年9月18日
今日头条推荐系统架构演进之路
QCon
32+阅读 · 2017年6月21日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
VIP会员
最新内容
综述 | OPSD:大语言模型的在线策略自蒸馏
专知会员服务
3+阅读 · 6月1日
帕兰蒂尔Maven:军事人工智能的新纪元
专知会员服务
8+阅读 · 6月1日
超越网格:作战环境对炮兵的影响
专知会员服务
3+阅读 · 5月31日
BES:让语言模型通过双向进化搜索自我改进
专知会员服务
6+阅读 · 5月30日
以色列-美国-伊朗战争中的无人机:关键要点
专知会员服务
8+阅读 · 5月30日
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员