Rhea: a Framework for Fast Design and Validation of RTL Cache-Coherent Memory Subsystems - 专知论文

会员服务 ·

0

系统 · 设计 · 内存 · 内存子系统 · 子系统 ·

Rhea: a Framework for Fast Design and Validation of RTL Cache-Coherent Memory Subsystems

翻译：Rhea：一种用于快速设计与验证RTL缓存一致性内存子系统的框架

Davide Zoni,Andrea Galimberti,Adriano Guarisco

from arxiv, 9 pages, 13 figures, 1 table

Designing and validating efficient cache-coherent memory subsystems is a critical yet complex task in the development of modern multi-core system-on-chip architectures. Rhea is a unified framework that streamlines the design and system-level validation of RTL cache-coherent memory subsystems. On the design side, Rhea generates synthesizable, highly configurable RTL supporting various architectural parameters. On the validation side, Rhea integrates Verilator's cycle-accurate RTL simulation with gem5's full-system simulation, allowing realistic workloads and operating systems to run alongside the actual RTL under test. We apply Rhea to design MSI-based RTL memory subsystems with one and two levels of private caches and scaling up to sixteen cores. Their evaluation with 22 applications from state-of-the-art benchmark suites shows intermediate performance relative to gem5 Ruby's MI and MOESI models. The hybrid gem5-Verilator co-simulation flow incurs a moderate simulation overhead, up to 2.7 times compared to gem5 MI, but achieves higher fidelity by simulating real RTL hardware. This overhead decreases with scale, down to 1.6 times in sixteen-core scenarios. These results demonstrate Rhea's effectiveness and scalability in enabling fast development of RTL cache-coherent memory subsystem designs.

翻译：设计与验证高效的缓存一致性内存子系统是现代多核片上系统架构开发中至关重要却又极其复杂的任务。Rhea是一个统一的框架，旨在简化和加速RTL缓存一致性内存子系统的设计与系统级验证。在设计方面，Rhea能够生成支持多种架构参数、可综合且高度可配置的RTL代码。在验证方面，Rhea将Verilator的周期精确RTL仿真与gem5的全系统仿真相结合，使得实际工作负载和操作系统能够在被测真实RTL硬件上同时运行。我们应用Rhea设计了基于MSI协议、具有一级和二级私有缓存并可扩展至十六核的RTL内存子系统。使用来自前沿基准测试套件的22个应用程序进行评估，结果显示其性能介于gem5 Ruby的MI模型与MOESI模型之间。这种gem5-Verilator混合协同仿真流程会产生适度的仿真开销，与gem5 MI模型相比最高达2.7倍，但通过仿真真实RTL硬件实现了更高的保真度。该开销随系统规模扩大而降低，在十六核场景下可降至1.6倍。这些结果证明了Rhea在实现RTL缓存一致性内存子系统设计快速开发方面的有效性与可扩展性。

0

相关内容

《实时机器学习（RTML）编译硬件神经网加速器（CHANNA）项目》DARPA项目报告

《实时机器学习（RTML）编译硬件神经网加速器（CHANNA）项目》DARPA项目报告

专知会员服务

13+阅读 · 2025年7月9日

国家标准《信息技术云计算参考架构》

国家标准《信息技术云计算参考架构》

专知会员服务

37+阅读 · 2024年5月24日

《现代多任务规划、调度和排序系统（Aerie）》加州理工学院

《现代多任务规划、调度和排序系统（Aerie）》加州理工学院

专知会员服务

60+阅读 · 2024年1月26日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

111+阅读 · 2023年12月19日

Nat. Commun. | 基于最优传输的单细胞数据集成统一计算框架

Nat. Commun. | 基于最优传输的单细胞数据集成统一计算框架

专知会员服务

12+阅读 · 2022年12月19日

推荐！《用于多域作战的预测、自适应、稳健和分布式网络的统一框架：第二年报告》2022美国陆军研究实验室20余位作者最新88页技术报告

推荐！《用于多域作战的预测、自适应、稳健和分布式网络的统一框架：第二年报告》2022美国陆军研究实验室20余位作者最新88页技术报告

专知会员服务

88+阅读 · 2022年10月26日

EDA断供？最新《计算机行业EDA专题报告》，行业快速发展，国产替代前景可期，76页ppt

EDA断供？最新《计算机行业EDA专题报告》，行业快速发展，国产替代前景可期，76页ppt

专知会员服务

35+阅读 · 2022年8月19日

重磅发布|《信息系统稳定性保障能力建设指南（1.0）》，附下载方式

重磅发布|《信息系统稳定性保障能力建设指南（1.0）》，附下载方式

专知会员服务

45+阅读 · 2022年4月11日

RLChina强化学习课程，国内众大牛讲解，（附课件pdf下载）

RLChina强化学习课程，国内众大牛讲解，（附课件pdf下载）

专知会员服务

102+阅读 · 2021年8月19日

内存计算研究进展

专知会员服务

29+阅读 · 2021年2月26日

【硬核书】Linux核心编程|Linux Kernel Programming，741页pdf

【硬核书】Linux核心编程|Linux Kernel Programming，741页pdf

专知

13+阅读 · 2021年3月26日

【经典书】操作系统导论，687页pdf

【经典书】操作系统导论，687页pdf

专知

11+阅读 · 2020年10月28日

聊聊RTA（Realtime API）

聊聊RTA（Realtime API）

AINLP

29+阅读 · 2020年6月5日

【干货书】R语言书: 编程和统计的第一课程，835页pdf

【干货书】R语言书: 编程和统计的第一课程，835页pdf

专知

40+阅读 · 2020年5月9日

【NeurlPS2019教程】微软首席研究员Katja Hofmann - 强化学习：过去、现在和未来展望，附97页ppt

【NeurlPS2019教程】微软首席研究员Katja Hofmann - 强化学习：过去、现在和未来展望，附97页ppt

专知

12+阅读 · 2019年12月16日

DeepMind Nando（原牛津大学教授）强化学习最新进展，含图文、公式和代码，附102页PPT下载

DeepMind Nando（原牛津大学教授）强化学习最新进展，含图文、公式和代码，附102页PPT下载

专知

18+阅读 · 2019年11月15日

【研究报告】《边缘计算参考架构3.0》、《边云协同白皮书》发布！（附下载）

【研究报告】《边缘计算参考架构3.0》、《边云协同白皮书》发布！（附下载）

产业智能官

26+阅读 · 2019年10月12日

【泡泡图灵智库】RelocNet：一种通过连续度量学习实现相机重定位的神经网络框架

【泡泡图灵智库】RelocNet：一种通过连续度量学习实现相机重定位的神经网络框架

泡泡机器人SLAM

14+阅读 · 2019年9月5日

深度学习目标检测模型全面综述：Faster R-CNN、R-FCN和SSD

深度学习目标检测模型全面综述：Faster R-CNN、R-FCN和SSD

深度学习世界

10+阅读 · 2017年9月18日

今日头条推荐系统架构演进之路

今日头条推荐系统架构演进之路

QCon

32+阅读 · 2017年6月21日

面向网络系统的一致性安全隐私分析与防护机制设计

国家自然科学基金

2+阅读 · 2017年12月31日

基于OFDM的弹性光网络系统参数辨识方法及实验研究

国家自然科学基金

0+阅读 · 2015年12月31日

闪存存储系统关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

缓存路由器存储架构及其关键技术的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于非易失内存设备的数据读写性能优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

“非对称多通道”异质、异构内存系统架构及“启发式”混合内存资源管理机制的研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂交互型网络系统的DEA效率评价与资源配置研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

嵌入式存储器容错设计关键技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向大数据的高时效并行计算机系统结构与技术

国家自然科学基金

0+阅读 · 2014年12月31日

基于模型驱动的并发建模语言Apla+设计及其可靠性研究

国家自然科学基金

3+阅读 · 2014年12月31日

ReLMXEL: Adaptive RL-Based Memory Controller with Explainable Energy and Latency Optimization

ReLMXEL: Adaptive RL-Based Memory Controller with Explainable Energy and Latency Optimization

Arxiv

0+阅读 · 3月18日

SYMDIREC: A Neuro-Symbolic Divide-Retrieve-Conquer Framework for Enhanced RTL Synthesis and Summarization

SYMDIREC: A Neuro-Symbolic Divide-Retrieve-Conquer Framework for Enhanced RTL Synthesis and Summarization

Arxiv

0+阅读 · 3月17日

CODMAS: A Dialectic Multi-Agent Collaborative Framework for Structured RTL Optimization

CODMAS: A Dialectic Multi-Agent Collaborative Framework for Structured RTL Optimization

Arxiv

0+阅读 · 3月17日

Co-Design of Memory-Storage Systems for Workload Awareness with Interpretable Models

Arxiv

0+阅读 · 3月16日

LHGstore: An In-Memory Learned Graph Storage for Fast Updates and Analytics

Arxiv

0+阅读 · 3月12日

HaLoRA: Hardware-aware Low-Rank Adaptation for Large Language Models Based on Hybrid Compute-in-Memory Architecture

Arxiv

0+阅读 · 3月9日

Joint Hardware-Workload Co-Optimization for In-Memory Computing Accelerators

Arxiv

0+阅读 · 3月4日

ChatNeuroSim: An LLM Agent Framework for Automated Compute-in-Memory Accelerator Deployment and Optimization

Arxiv

0+阅读 · 3月4日

Threadle: A Memory-Efficient Network Storage and Query Engine for Large, Multilayer, and Mixed-mode Networks

Arxiv

0+阅读 · 2月24日

RLGT: A reinforcement learning framework for extremal graph theory

Arxiv

0+阅读 · 2月19日

VIP会员

文章信息

相关主题

内存子系统

最新内容

ICML 2026 | Sheaf-ADMM：用可微优化学习多智能体协调

ICML 2026 | Sheaf-ADMM：用可微优化学习多智能体协调

专知会员服务

3+阅读 · 6月1日

综述 | OPSD：大语言模型的在线策略自蒸馏

综述 | OPSD：大语言模型的在线策略自蒸馏

专知会员服务

3+阅读 · 6月1日

算法化战争：人工智能时代的新范式（万字长文）

算法化战争：人工智能时代的新范式（万字长文）

专知会员服务

8+阅读 · 6月1日

帕兰蒂尔Maven：军事人工智能的新纪元

帕兰蒂尔Maven：军事人工智能的新纪元

专知会员服务

8+阅读 · 6月1日

《军事网络取证系统中的人工智能驱动情报融合：帕兰蒂尔公司“Maven智能系统”案例研究》

《军事网络取证系统中的人工智能驱动情报融合：帕兰蒂尔公司“Maven智能系统”案例研究》

专知会员服务

10+阅读 · 6月1日

《扩展主权人工智能操作系统：将Symphony作为帕兰蒂尔Foundry与英伟达的计算本体》

《扩展主权人工智能操作系统：将Symphony作为帕兰蒂尔Foundry与英伟达的计算本体》

专知会员服务

10+阅读 · 6月1日

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

专知会员服务

13+阅读 · 5月31日

比利时发布用于实时战场军事装备识别的离线人工智能系统

比利时发布用于实时战场军事装备识别的离线人工智能系统

专知会员服务

6+阅读 · 5月31日

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

专知会员服务

5+阅读 · 5月31日

超越网格：作战环境对炮兵的影响

超越网格：作战环境对炮兵的影响

专知会员服务

3+阅读 · 5月31日

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

专知会员服务

9+阅读 · 5月31日

综述 | 推理时控制：可信大语言模型的运行时治理全景

综述 | 推理时控制：可信大语言模型的运行时治理全景

专知会员服务

4+阅读 · 5月31日

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

6+阅读 · 5月30日

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

7+阅读 · 5月30日

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

8+阅读 · 5月30日

相关VIP内容

《实时机器学习（RTML）编译硬件神经网加速器（CHANNA）项目》DARPA项目报告

《实时机器学习（RTML）编译硬件神经网加速器（CHANNA）项目》DARPA项目报告

专知会员服务

13+阅读 · 2025年7月9日

国家标准《信息技术云计算参考架构》

国家标准《信息技术云计算参考架构》

专知会员服务

37+阅读 · 2024年5月24日

《现代多任务规划、调度和排序系统（Aerie）》加州理工学院

《现代多任务规划、调度和排序系统（Aerie）》加州理工学院

专知会员服务

60+阅读 · 2024年1月26日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

111+阅读 · 2023年12月19日

Nat. Commun. | 基于最优传输的单细胞数据集成统一计算框架

Nat. Commun. | 基于最优传输的单细胞数据集成统一计算框架

专知会员服务

12+阅读 · 2022年12月19日

推荐！《用于多域作战的预测、自适应、稳健和分布式网络的统一框架：第二年报告》2022美国陆军研究实验室20余位作者最新88页技术报告

推荐！《用于多域作战的预测、自适应、稳健和分布式网络的统一框架：第二年报告》2022美国陆军研究实验室20余位作者最新88页技术报告

专知会员服务

88+阅读 · 2022年10月26日

EDA断供？最新《计算机行业EDA专题报告》，行业快速发展，国产替代前景可期，76页ppt

EDA断供？最新《计算机行业EDA专题报告》，行业快速发展，国产替代前景可期，76页ppt

专知会员服务

35+阅读 · 2022年8月19日

重磅发布|《信息系统稳定性保障能力建设指南（1.0）》，附下载方式

重磅发布|《信息系统稳定性保障能力建设指南（1.0）》，附下载方式

专知会员服务

45+阅读 · 2022年4月11日

RLChina强化学习课程，国内众大牛讲解，（附课件pdf下载）

RLChina强化学习课程，国内众大牛讲解，（附课件pdf下载）

专知会员服务

102+阅读 · 2021年8月19日

内存计算研究进展

专知会员服务

29+阅读 · 2021年2月26日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | OPSD：大语言模型的在线策略自蒸馏

帕兰蒂尔Maven：军事人工智能的新纪元

ICML 2026 | Sheaf-ADMM：用可微优化学习多智能体协调

算法化战争：人工智能时代的新范式（万字长文）

相关资讯

【硬核书】Linux核心编程|Linux Kernel Programming，741页pdf

【硬核书】Linux核心编程|Linux Kernel Programming，741页pdf

专知

13+阅读 · 2021年3月26日

【经典书】操作系统导论，687页pdf

【经典书】操作系统导论，687页pdf

专知

11+阅读 · 2020年10月28日

聊聊RTA（Realtime API）

聊聊RTA（Realtime API）

AINLP

29+阅读 · 2020年6月5日

【干货书】R语言书: 编程和统计的第一课程，835页pdf

【干货书】R语言书: 编程和统计的第一课程，835页pdf

专知

40+阅读 · 2020年5月9日

【NeurlPS2019教程】微软首席研究员Katja Hofmann - 强化学习：过去、现在和未来展望，附97页ppt

【NeurlPS2019教程】微软首席研究员Katja Hofmann - 强化学习：过去、现在和未来展望，附97页ppt

专知

12+阅读 · 2019年12月16日

DeepMind Nando（原牛津大学教授）强化学习最新进展，含图文、公式和代码，附102页PPT下载

DeepMind Nando（原牛津大学教授）强化学习最新进展，含图文、公式和代码，附102页PPT下载

专知

18+阅读 · 2019年11月15日

【研究报告】《边缘计算参考架构3.0》、《边云协同白皮书》发布！（附下载）

【研究报告】《边缘计算参考架构3.0》、《边云协同白皮书》发布！（附下载）

产业智能官

26+阅读 · 2019年10月12日

【泡泡图灵智库】RelocNet：一种通过连续度量学习实现相机重定位的神经网络框架

【泡泡图灵智库】RelocNet：一种通过连续度量学习实现相机重定位的神经网络框架

泡泡机器人SLAM

14+阅读 · 2019年9月5日

深度学习目标检测模型全面综述：Faster R-CNN、R-FCN和SSD

深度学习目标检测模型全面综述：Faster R-CNN、R-FCN和SSD

深度学习世界

10+阅读 · 2017年9月18日

今日头条推荐系统架构演进之路

今日头条推荐系统架构演进之路

QCon

32+阅读 · 2017年6月21日

相关论文

ReLMXEL: Adaptive RL-Based Memory Controller with Explainable Energy and Latency Optimization

ReLMXEL: Adaptive RL-Based Memory Controller with Explainable Energy and Latency Optimization

Arxiv

0+阅读 · 3月18日

SYMDIREC: A Neuro-Symbolic Divide-Retrieve-Conquer Framework for Enhanced RTL Synthesis and Summarization

SYMDIREC: A Neuro-Symbolic Divide-Retrieve-Conquer Framework for Enhanced RTL Synthesis and Summarization

Arxiv

0+阅读 · 3月17日

CODMAS: A Dialectic Multi-Agent Collaborative Framework for Structured RTL Optimization

CODMAS: A Dialectic Multi-Agent Collaborative Framework for Structured RTL Optimization

Arxiv

0+阅读 · 3月17日

Co-Design of Memory-Storage Systems for Workload Awareness with Interpretable Models

Arxiv

0+阅读 · 3月16日

LHGstore: An In-Memory Learned Graph Storage for Fast Updates and Analytics

Arxiv

0+阅读 · 3月12日

HaLoRA: Hardware-aware Low-Rank Adaptation for Large Language Models Based on Hybrid Compute-in-Memory Architecture

Arxiv

0+阅读 · 3月9日

Joint Hardware-Workload Co-Optimization for In-Memory Computing Accelerators

Arxiv

0+阅读 · 3月4日

ChatNeuroSim: An LLM Agent Framework for Automated Compute-in-Memory Accelerator Deployment and Optimization

Arxiv

0+阅读 · 3月4日

Threadle: A Memory-Efficient Network Storage and Query Engine for Large, Multilayer, and Mixed-mode Networks

Arxiv

0+阅读 · 2月24日

RLGT: A reinforcement learning framework for extremal graph theory

Arxiv

0+阅读 · 2月19日

相关基金

面向网络系统的一致性安全隐私分析与防护机制设计

国家自然科学基金

2+阅读 · 2017年12月31日

基于OFDM的弹性光网络系统参数辨识方法及实验研究

国家自然科学基金

0+阅读 · 2015年12月31日

闪存存储系统关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

缓存路由器存储架构及其关键技术的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于非易失内存设备的数据读写性能优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

“非对称多通道”异质、异构内存系统架构及“启发式”混合内存资源管理机制的研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂交互型网络系统的DEA效率评价与资源配置研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

嵌入式存储器容错设计关键技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

面向大数据的高时效并行计算机系统结构与技术

国家自然科学基金

0+阅读 · 2014年12月31日

基于模型驱动的并发建模语言Apla+设计及其可靠性研究

国家自然科学基金

3+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员