RV-IM100: Quantifying ISA Extension, Datapath Width, and Pipeline Depth Trade-offs in RISC-V Microarchitectures - 专知论文

会员服务 ·

0

RV-IM100: Quantifying ISA Extension, Datapath Width, and Pipeline Depth Trade-offs in RISC-V Microarchitectures

翻译：RV-IM100：RISC-V微架构中ISA扩展、数据通路宽度与流水线深度的权衡量化

from arxiv, Preprint. 8 pages, 8 figures, 2 tables

While functional RISC-V implementations are readily available in academia, controlled empirical studies that extend a single baseline architecture along multiple design axes and quantify the resulting trade-offs at each step remain scarce. This paper presents RV-IM100, a family of 10 incremental FPGA-implemented microarchitectures derived from a common 5-stage pipeline baseline, systematically varying datapath width from RV32 to RV64, instruction set from I to IM, and pipeline depth from 5 to 8~stages under controlled conditions. Using an iterative timing-closure methodology, RV32IM frequency improved from 43 to 126MHz, increasing Dhrystone throughput by 64% and CoreMark by 300%, while per-MHz efficiency decreased by 36--41%. The 6-to-7-stage transition caused throughput regression in RV64 despite higher frequency, revealing that the outcome depends on available frequency headroom. Cross-width comparison showed RV32 outperforming RV64 in absolute throughput, with per-MHz efficiency diverging by benchmark: RV64 led by 2.3% in DMIPS/MHz while RV32 led by 4.6% in CoreMark/MHz. At 8 stages, RV32 required 59% fewer LUTs, 51% fewer FFs, and 80% fewer DSPs, indicating that the resource cost of width extension substantially exceeds the modest efficiency differences. These results provide a quantitative reference for design-space exploration in RISC-V microarchitectures. All RTL sources and benchmark configurations are publicly available.

翻译：尽管学术界已可获得功能完备的RISC-V实现，但针对单一基线架构沿多个设计维度扩展并量化各阶段权衡的受控实证研究仍较罕见。本文提出RV-IM100微架构家族——基于公共5级流水线基线的10个增量式FPGA实现，在受控条件下系统化调整数据通路宽度（RV32至RV64）、指令集（I至IM）及流水线深度（5至8级）。通过迭代时序收敛方法，RV32IM工作频率从43MHz提升至126MHz，Dhrystone吞吐量增加64%、CoreMark增加300%，但每MHz效率下降36%-41%。在6级向7级流水线过渡时，尽管RV64频率提升，吞吐量却出现倒退，表明结果取决于可用频率余量。跨宽度对比显示：绝对吞吐量方面RV32优于RV64，而每MHz效率因基准测试而异——DMIPS/MHz指标下RV64领先2.3%，CoreMark/MHz指标下RV32领先4.6%。在8级流水线配置中，RV32所需LUT减少59%、FF减少51%、DSP减少80%，表明宽度扩展的资源成本远超其微小的效率差异。这些结果为RISC-V微架构的设计空间探索提供了量化参考。所有RTL源码与基准测试配置均已公开。

0

相关内容

【新书】深度强化学习在可重构智能表面和无人机赋能智能6G通信中的应用

【新书】深度强化学习在可重构智能表面和无人机赋能智能6G通信中的应用

专知会员服务

28+阅读 · 2025年1月3日

《战术数据链感知模拟器标准的不断演变》

《战术数据链感知模拟器标准的不断演变》

专知会员服务

39+阅读 · 2024年12月26日

《可重构智能表面 (RIS)：下一代一体化传感与通信的关键？》

《可重构智能表面 (RIS)：下一代一体化传感与通信的关键？》

专知会员服务

34+阅读 · 2024年3月14日

【AAAI2023】深度神经网络的可解释性验证

【AAAI2023】深度神经网络的可解释性验证

专知会员服务

49+阅读 · 2022年12月6日

北大最新Nature Machine Intelligence《基于图神经网络的城市道路网空间均匀性量化》

北大最新Nature Machine Intelligence《基于图神经网络的城市道路网空间均匀性量化》

专知会员服务

24+阅读 · 2022年5月15日

深度神经网络 FPGA 设计进展、实现与展望

深度神经网络 FPGA 设计进展、实现与展望

专知会员服务

59+阅读 · 2022年3月26日

深度神经网络FPGA设计进展、实现与展望

深度神经网络FPGA设计进展、实现与展望

专知会员服务

36+阅读 · 2022年3月21日

【ACMMM2021】通用近似交叉验证的模型选择：监督、半监督与比对学习

专知会员服务

16+阅读 · 2021年10月10日

【牛津大学ICLR2020】通过元学习的贝叶斯自适应深度RL, VariBAD: A Very Good Method for Bayes-Adaptive Deep RL via Meta-Learning

【牛津大学ICLR2020】通过元学习的贝叶斯自适应深度RL, VariBAD: A Very Good Method for Bayes-Adaptive Deep RL via Meta-Learning

专知会员服务

25+阅读 · 2020年2月28日

【ICCV2019教程】物体检测的R-CNN通用框架，The Generalized R-CNN Framework for Object Detection，180页ppt，Facebook 人工智能研究院Ross Girshick大神

【ICCV2019教程】物体检测的R-CNN通用框架，The Generalized R-CNN Framework for Object Detection，180页ppt，Facebook 人工智能研究院Ross Girshick大神

专知会员服务

26+阅读 · 2019年11月16日

全新水下目标检测算法SWIPENet+IMA框架（已开源）

全新水下目标检测算法SWIPENet+IMA框架（已开源）

CVer

17+阅读 · 2020年5月31日

AAAI 2020 | 华为：短小时序，如何预测？——基于特征重构的张量ARIMA

AAAI 2020 | 华为：短小时序，如何预测？——基于特征重构的张量ARIMA

AI科技评论

13+阅读 · 2020年2月5日

CVPR 2019 Oral 论文解读 | 百度提出关于网络压缩和加速的新剪枝算法

CVPR 2019 Oral 论文解读 | 百度提出关于网络压缩和加速的新剪枝算法

AI科技评论

11+阅读 · 2019年5月28日

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

专知

42+阅读 · 2019年4月9日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

最新基于FPGA的深度学习加速器综述论文（附下载）

最新基于FPGA的深度学习加速器综述论文（附下载）

专知

23+阅读 · 2019年1月17日

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

AI研习社

14+阅读 · 2018年2月17日

AAAI 2018 | 腾讯提出自适应图卷积神经网络，接受不同图结构和规模的数据

AAAI 2018 | 腾讯提出自适应图卷积神经网络，接受不同图结构和规模的数据

机器之心

12+阅读 · 2018年1月21日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

【前沿】何恺明大神ICCV2017最佳论文Mask R-CNN的Keras/TensorFlow/Pytorch 代码实现

【前沿】何恺明大神ICCV2017最佳论文Mask R-CNN的Keras/TensorFlow/Pytorch 代码实现

专知

16+阅读 · 2017年11月8日

面向传感网的软件定义测量技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向估计性能优化的网络化控制系统传感器调度

国家自然科学基金

0+阅读 · 2015年12月31日

众核集群上基于MPI的模型扩展及性能优化研究

国家自然科学基金

1+阅读 · 2015年12月31日

多输入-多输出网络量化系统的分析与综合研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于跨层网络编码感知的无线传感器网络节能路由协议研究

国家自然科学基金

0+阅读 · 2015年12月31日

虚拟化光纤-无线融合宽带接入网中资源调度机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

稀疏宽带信号亚奈奎斯特采样与重构算法及其在宽带频谱感知中的应用研究

国家自然科学基金

1+阅读 · 2015年12月31日

低功耗数字化高集成度无线通信SoC芯片关键技术研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于分布式∑/△与扩展量化的红外焦平面阵列像素级/列级混合式模数转换方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

图的谱方法及其在纳米尺度集成电路分析优化中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

Microarchitectural Co-Optimization for Sustained Throughput of RISC-V Multi-Lane Chaining Vector Processors

Arxiv

0+阅读 · 4月24日

RISC-V Functional Safety for Autonomous Automotive Systems: An Analytical Framework and Research Roadmap for ML-Assisted Certification

Arxiv

0+阅读 · 4月19日

Chiplet-Based RISC-V SoC with Modular AI Acceleration

Arxiv

0+阅读 · 4月7日

Beyond-Diagonal RIS For Enhanced Secrecy and Sensing Gains in Secure ISAC Networks: An Optimization Framework

Arxiv

0+阅读 · 4月6日

An FPGA-Based SoC Architecture with a RISC-V Controller for Energy-Efficient Temporal-Coding Spiking Neural Networks

Arxiv

0+阅读 · 3月17日

High-performance Vector-length Agnostic Quantum Circuit Simulations on ARM Processors

Arxiv

0+阅读 · 3月12日

HyperCroc: End-to-End Open-Source RISC-V MCU with a Plug-In Interface for Domain-Specific Accelerators

Arxiv

0+阅读 · 3月12日

Implementing and Optimizing an Open-Source SD-card Host Controller for RISC-V SoCs

Arxiv

0+阅读 · 3月12日

VMXDOTP: A RISC-V Vector ISA Extension for Efficient Microscaling (MX) Format Acceleration

Arxiv

0+阅读 · 3月5日

SAILOR: A Scalable and Energy-Efficient Ultra-Lightweight RISC-V for IoT Security

Arxiv

0+阅读 · 2月27日

VIP会员

文章信息

相关主题

最新内容

《反无人机蜂群：有人-无人协同防御场景下的编队重构分析》

《反无人机蜂群：有人-无人协同防御场景下的编队重构分析》

专知会员服务

4+阅读 · 今天12:53

《史诗怒火/咆哮雄狮行动：针对伊朗空中战役的战略分析》68页智库报告

《史诗怒火/咆哮雄狮行动：针对伊朗空中战役的战略分析》68页智库报告

专知会员服务

3+阅读 · 今天12:39

“愈演愈烈的欺骗与干扰博弈”：无人机与人工智能背景下俄乌强化以无人机为核心的电子战

“愈演愈烈的欺骗与干扰博弈”：无人机与人工智能背景下俄乌强化以无人机为核心的电子战

专知会员服务

2+阅读 · 今天12:32

乌克兰纵深打击如何重塑俄罗斯的战略选择

乌克兰纵深打击如何重塑俄罗斯的战略选择

专知会员服务

1+阅读 · 今天12:25

《分布式太空任务对比分析与综合建模及仿真环境》120页

《分布式太空任务对比分析与综合建模及仿真环境》120页

专知会员服务

1+阅读 · 今天12:14

俄乌战争中关于中程打击无人机部署的经验启示

俄乌战争中关于中程打击无人机部署的经验启示

专知会员服务

0+阅读 · 今天12:08

《远程自主系统可扩展态势感知的解决方案》32页2026最新报告

《远程自主系统可扩展态势感知的解决方案》32页2026最新报告

专知会员服务

5+阅读 · 7月23日

《基于强化学习的自动化红队测试》

《基于强化学习的自动化红队测试》

专知会员服务

4+阅读 · 7月23日

《下一代无人机-卫星通信：人工智能创新与未来展望》32页长综述

《下一代无人机-卫星通信：人工智能创新与未来展望》32页长综述

专知会员服务

6+阅读 · 7月23日

“天降毒雾”：无人机如何使化学战重返乌克兰战场

“天降毒雾”：无人机如何使化学战重返乌克兰战场

专知会员服务

2+阅读 · 7月23日

伊朗不对称防空战略的演进

伊朗不对称防空战略的演进

专知会员服务

4+阅读 · 7月23日

对抗环境下超视距目标打击的情报支援

对抗环境下超视距目标打击的情报支援

专知会员服务

10+阅读 · 7月22日

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

专知会员服务

4+阅读 · 7月22日

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

专知会员服务

8+阅读 · 7月22日

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

专知会员服务

11+阅读 · 7月22日

相关VIP内容

【新书】深度强化学习在可重构智能表面和无人机赋能智能6G通信中的应用

【新书】深度强化学习在可重构智能表面和无人机赋能智能6G通信中的应用

专知会员服务

28+阅读 · 2025年1月3日

《战术数据链感知模拟器标准的不断演变》

《战术数据链感知模拟器标准的不断演变》

专知会员服务

39+阅读 · 2024年12月26日

《可重构智能表面 (RIS)：下一代一体化传感与通信的关键？》

《可重构智能表面 (RIS)：下一代一体化传感与通信的关键？》

专知会员服务

34+阅读 · 2024年3月14日

【AAAI2023】深度神经网络的可解释性验证

【AAAI2023】深度神经网络的可解释性验证

专知会员服务

49+阅读 · 2022年12月6日

北大最新Nature Machine Intelligence《基于图神经网络的城市道路网空间均匀性量化》

北大最新Nature Machine Intelligence《基于图神经网络的城市道路网空间均匀性量化》

专知会员服务

24+阅读 · 2022年5月15日

深度神经网络 FPGA 设计进展、实现与展望

深度神经网络 FPGA 设计进展、实现与展望

专知会员服务

59+阅读 · 2022年3月26日

深度神经网络FPGA设计进展、实现与展望

深度神经网络FPGA设计进展、实现与展望

专知会员服务

36+阅读 · 2022年3月21日

【ACMMM2021】通用近似交叉验证的模型选择：监督、半监督与比对学习

专知会员服务

16+阅读 · 2021年10月10日

【牛津大学ICLR2020】通过元学习的贝叶斯自适应深度RL, VariBAD: A Very Good Method for Bayes-Adaptive Deep RL via Meta-Learning

【牛津大学ICLR2020】通过元学习的贝叶斯自适应深度RL, VariBAD: A Very Good Method for Bayes-Adaptive Deep RL via Meta-Learning

专知会员服务

25+阅读 · 2020年2月28日

【ICCV2019教程】物体检测的R-CNN通用框架，The Generalized R-CNN Framework for Object Detection，180页ppt，Facebook 人工智能研究院Ross Girshick大神

【ICCV2019教程】物体检测的R-CNN通用框架，The Generalized R-CNN Framework for Object Detection，180页ppt，Facebook 人工智能研究院Ross Girshick大神

专知会员服务

26+阅读 · 2019年11月16日

热门VIP内容

开通专知VIP会员享更多权益服务

《史诗怒火/咆哮雄狮行动：针对伊朗空中战役的战略分析》68页智库报告

乌克兰纵深打击如何重塑俄罗斯的战略选择

《反无人机蜂群：有人-无人协同防御场景下的编队重构分析》

“愈演愈烈的欺骗与干扰博弈”：无人机与人工智能背景下俄乌强化以无人机为核心的电子战

相关资讯

全新水下目标检测算法SWIPENet+IMA框架（已开源）

全新水下目标检测算法SWIPENet+IMA框架（已开源）

CVer

17+阅读 · 2020年5月31日

AAAI 2020 | 华为：短小时序，如何预测？——基于特征重构的张量ARIMA

AAAI 2020 | 华为：短小时序，如何预测？——基于特征重构的张量ARIMA

AI科技评论

13+阅读 · 2020年2月5日

CVPR 2019 Oral 论文解读 | 百度提出关于网络压缩和加速的新剪枝算法

CVPR 2019 Oral 论文解读 | 百度提出关于网络压缩和加速的新剪枝算法

AI科技评论

11+阅读 · 2019年5月28日

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

专知

42+阅读 · 2019年4月9日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

最新基于FPGA的深度学习加速器综述论文（附下载）

最新基于FPGA的深度学习加速器综述论文（附下载）

专知

23+阅读 · 2019年1月17日

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

AI研习社

14+阅读 · 2018年2月17日

AAAI 2018 | 腾讯提出自适应图卷积神经网络，接受不同图结构和规模的数据

AAAI 2018 | 腾讯提出自适应图卷积神经网络，接受不同图结构和规模的数据

机器之心

12+阅读 · 2018年1月21日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

【前沿】何恺明大神ICCV2017最佳论文Mask R-CNN的Keras/TensorFlow/Pytorch 代码实现

【前沿】何恺明大神ICCV2017最佳论文Mask R-CNN的Keras/TensorFlow/Pytorch 代码实现

专知

16+阅读 · 2017年11月8日

相关论文

Microarchitectural Co-Optimization for Sustained Throughput of RISC-V Multi-Lane Chaining Vector Processors

Arxiv

0+阅读 · 4月24日

RISC-V Functional Safety for Autonomous Automotive Systems: An Analytical Framework and Research Roadmap for ML-Assisted Certification

Arxiv

0+阅读 · 4月19日

Chiplet-Based RISC-V SoC with Modular AI Acceleration

Arxiv

0+阅读 · 4月7日

Beyond-Diagonal RIS For Enhanced Secrecy and Sensing Gains in Secure ISAC Networks: An Optimization Framework

Arxiv

0+阅读 · 4月6日

An FPGA-Based SoC Architecture with a RISC-V Controller for Energy-Efficient Temporal-Coding Spiking Neural Networks

Arxiv

0+阅读 · 3月17日

High-performance Vector-length Agnostic Quantum Circuit Simulations on ARM Processors

Arxiv

0+阅读 · 3月12日

HyperCroc: End-to-End Open-Source RISC-V MCU with a Plug-In Interface for Domain-Specific Accelerators

Arxiv

0+阅读 · 3月12日

Implementing and Optimizing an Open-Source SD-card Host Controller for RISC-V SoCs

Arxiv

0+阅读 · 3月12日

VMXDOTP: A RISC-V Vector ISA Extension for Efficient Microscaling (MX) Format Acceleration

Arxiv

0+阅读 · 3月5日

SAILOR: A Scalable and Energy-Efficient Ultra-Lightweight RISC-V for IoT Security

Arxiv

0+阅读 · 2月27日

相关基金

面向传感网的软件定义测量技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向估计性能优化的网络化控制系统传感器调度

国家自然科学基金

0+阅读 · 2015年12月31日

众核集群上基于MPI的模型扩展及性能优化研究

国家自然科学基金

1+阅读 · 2015年12月31日

多输入-多输出网络量化系统的分析与综合研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于跨层网络编码感知的无线传感器网络节能路由协议研究

国家自然科学基金

0+阅读 · 2015年12月31日

虚拟化光纤-无线融合宽带接入网中资源调度机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

稀疏宽带信号亚奈奎斯特采样与重构算法及其在宽带频谱感知中的应用研究

国家自然科学基金

1+阅读 · 2015年12月31日

低功耗数字化高集成度无线通信SoC芯片关键技术研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于分布式∑/△与扩展量化的红外焦平面阵列像素级/列级混合式模数转换方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

图的谱方法及其在纳米尺度集成电路分析优化中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员