RTeAAL Sim：使用张量代数表示与加速RTL仿真（扩展版） (RTeAAL Sim: Using Tensor Algebra to Represent and Accelerate RTL Simulation (Extended Version)) - 专知论文

会员服务 ·

0

表示 · 中央处理器 (CPU) · 稀疏 · 优化技术 · 嵌入 ·

RTeAAL Sim: Using Tensor Algebra to Represent and Accelerate RTL Simulation (Extended Version)

翻译：RTeAAL Sim：使用张量代数表示与加速RTL仿真（扩展版）

Yan Zhu,Boru Chen,Christopher W. Fletcher,Nandeeka Nayak

RTL simulation on CPUs remains a persistent bottleneck in hardware design. State-of-the-art simulators embed the circuit directly into the simulation binary, resulting in long compilation times and execution that is fundamentally CPU frontend-bound, with severe instruction-cache pressure. This work proposes RTeAAL Sim, which reformulates RTL simulation as a sparse tensor algebra problem. By representing RTL circuits as tensors and simulation as a sparse tensor algebra kernel, RTeAAL Sim decouples simulation behavior from binary size and makes RTL simulation amenable to well-studied tensor algebra optimizations. We demonstrate that a prototype of our tensor-based simulator, even with a subset of these optimizations, already mitigates the compilation overhead and frontend pressure and achieves performance competitive with the highly optimized Verilator simulator across multiple CPUs and ISAs.

翻译：在硬件设计中，基于CPU的RTL仿真仍然是一个长期存在的瓶颈。最先进的仿真器将电路直接嵌入仿真二进制文件中，导致编译时间漫长，且其执行从根本上受限于CPU前端，并承受严重的指令缓存压力。本文提出RTeAAL Sim，它将RTL仿真重新表述为一个稀疏张量代数问题。通过将RTL电路表示为张量，并将仿真视为稀疏张量代数内核，RTeAAL Sim将仿真行为与二进制文件大小解耦，并使RTL仿真能够应用经过深入研究的张量代数优化技术。我们证明，即使仅应用了这些优化技术的一个子集，我们基于张量的仿真器原型已经能够缓解编译开销和前端压力，并在多种CPU和ISA上实现了与高度优化的Verilator仿真器相竞争的性能。

0

相关内容

【ETHZ博士论文】设计与分析：一种面向极大规模、高性能、模块化的智能体仿真平台

【ETHZ博士论文】设计与分析：一种面向极大规模、高性能、模块化的智能体仿真平台

专知会员服务

31+阅读 · 2025年3月17日

MILA等最新《强化学习Transformer模型》综述，详述表征学习、奖励建模、转换函数建模和策略学习等技术

MILA等最新《强化学习Transformer模型》综述，详述表征学习、奖励建模、转换函数建模和策略学习等技术

专知会员服务

61+阅读 · 2023年7月16日

【博士论文】《表征 4 输入 4 输出复值参考块模型的复值神经网络模型逼近》美国空军技术学院2022最新208页论文

【博士论文】《表征 4 输入 4 输出复值参考块模型的复值神经网络模型逼近》美国空军技术学院2022最新208页论文

专知会员服务

11+阅读 · 2022年10月7日

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

专知会员服务

11+阅读 · 2022年6月5日

清华49页长文全方位分析参数高效微调方案Delta Tuning，揭秘大模型背后的机理

清华49页长文全方位分析参数高效微调方案Delta Tuning，揭秘大模型背后的机理

专知会员服务

50+阅读 · 2022年4月8日

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

专知会员服务

26+阅读 · 2022年3月15日

Time2Vec：学习时间的向量表示，Time2Vec: Learning a Vector Representation of Time

Time2Vec：学习时间的向量表示，Time2Vec: Learning a Vector Representation of Time

专知会员服务

36+阅读 · 2020年5月10日

【2020新书】利用Simulink进行MATLAB仿真，对常微分方程和偏微分方程进行编程和仿真，495pdf

【2020新书】利用Simulink进行MATLAB仿真，对常微分方程和偏微分方程进行编程和仿真，495pdf

专知会员服务

72+阅读 · 2020年4月10日

模型压缩究竟在做什么？我们真的需要模型压缩么？

模型压缩究竟在做什么？我们真的需要模型压缩么？

专知会员服务

28+阅读 · 2020年1月16日

【Caltech&NVIDiA】张量在机器学习中的作用（附pdf）

专知会员服务

13+阅读 · 2019年11月23日

《数字孪生仿真赋能要素及其在国防领域信息优势中的应用》2022最新16页技术报告，北约STO

《数字孪生仿真赋能要素及其在国防领域信息优势中的应用》2022最新16页技术报告，北约STO

专知

33+阅读 · 2022年10月26日

聊聊RTA（Realtime API）

聊聊RTA（Realtime API）

AINLP

29+阅读 · 2020年6月5日

【仿真+AI】浅谈AI在CAE领域的应用

【仿真+AI】浅谈AI在CAE领域的应用

产业智能官

13+阅读 · 2019年12月7日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

CALDERA 一款对手自动模拟工具

CALDERA 一款对手自动模拟工具

黑白之道

20+阅读 · 2019年9月17日

【最新综述】模型压缩与加速（附论文全文下载）

【最新综述】模型压缩与加速（附论文全文下载）

专知

28+阅读 · 2019年2月14日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

【仿真】生产系统仿真软件，实现数字化工厂的利器！

【仿真】生产系统仿真软件，实现数字化工厂的利器！

产业智能官

15+阅读 · 2018年11月1日

超全总结：神经网络加速之量化模型 | 附带代码

超全总结：神经网络加速之量化模型 | 附带代码

PaperWeekly

12+阅读 · 2018年6月1日

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

全球人工智能

12+阅读 · 2017年12月3日

纳米尺度自旋电子器件参数化电路模型建立方法的研究

国家自然科学基金

0+阅读 · 2017年12月31日

从仿生的角度设计用于指导构建组织支架的单元细胞模块、有限元分析以及3D打印工艺路径规划

国家自然科学基金

0+阅读 · 2015年12月31日

近似计算中基于概率图模型的软错误量化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

高精度片上抖动测量关键技术及电路实现研究

国家自然科学基金

0+阅读 · 2015年12月31日

集成电路中电热耦合建模理论及高效数值方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

张量分析及其在高维信息处理中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

基于周期数据的广义保形拟插值的理论及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于扩展的概率转移矩阵模型的高精度快速广义门电路可靠性评估方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

三维连续集成集成电路关键工艺技术和机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向14纳米及以下工艺的亚皮秒精度信号片上测量关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

Fast and Fusiest: An Optimal Fusion-Aware Mapper for Accelerator Modeling and Evaluation

Arxiv

0+阅读 · 2月16日

Supercharging Packet-level Network Simulation of Large Model Training via Memoization and Fast-Forwarding

Arxiv

0+阅读 · 2月11日

Pushing Tensor Accelerators Beyond MatMul in a User-Schedulable Language

Arxiv

0+阅读 · 2月11日

ACE-RTL: When Agentic Context Evolution Meets RTL-Specialized LLMs

Arxiv

0+阅读 · 2月10日

A-Graph: A Unified Graph Representation for At-Will Simulation across System Stacks

Arxiv

0+阅读 · 2月4日

Understanding and Mitigating Errors of LLM-Generated RTL Code

Arxiv

0+阅读 · 2月1日

ScaleSim: Serving Large-Scale Multi-Agent Simulation with Invocation Distance-Based Memory Management

Arxiv

0+阅读 · 1月29日

DiffVC-RT: Towards Practical Real-Time Diffusion-based Perceptual Neural Video Compression

Arxiv

0+阅读 · 1月28日

Veri-Sure: A Contract-Aware Multi-Agent Framework with Temporal Tracing and Formal Verification for Correct RTL Code Generation

Arxiv

0+阅读 · 1月27日

TempoNet: Learning Realistic Communication and Timing Patterns for Network Traffic Simulation

Arxiv

0+阅读 · 1月22日

VIP会员

文章信息

相关主题

中央处理器 (CPU)

相关VIP内容

【ETHZ博士论文】设计与分析：一种面向极大规模、高性能、模块化的智能体仿真平台

【ETHZ博士论文】设计与分析：一种面向极大规模、高性能、模块化的智能体仿真平台

专知会员服务

31+阅读 · 2025年3月17日

MILA等最新《强化学习Transformer模型》综述，详述表征学习、奖励建模、转换函数建模和策略学习等技术

MILA等最新《强化学习Transformer模型》综述，详述表征学习、奖励建模、转换函数建模和策略学习等技术

专知会员服务

61+阅读 · 2023年7月16日

【博士论文】《表征 4 输入 4 输出复值参考块模型的复值神经网络模型逼近》美国空军技术学院2022最新208页论文

【博士论文】《表征 4 输入 4 输出复值参考块模型的复值神经网络模型逼近》美国空军技术学院2022最新208页论文

专知会员服务

11+阅读 · 2022年10月7日

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

【ICML2022】DepthShrinker:一种新的压缩范式，用于提高紧凑神经网络的实际硬件效率

专知会员服务

11+阅读 · 2022年6月5日

清华49页长文全方位分析参数高效微调方案Delta Tuning，揭秘大模型背后的机理

清华49页长文全方位分析参数高效微调方案Delta Tuning，揭秘大模型背后的机理

专知会员服务

50+阅读 · 2022年4月8日

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

专知会员服务

26+阅读 · 2022年3月15日

Time2Vec：学习时间的向量表示，Time2Vec: Learning a Vector Representation of Time

Time2Vec：学习时间的向量表示，Time2Vec: Learning a Vector Representation of Time

专知会员服务

36+阅读 · 2020年5月10日

【2020新书】利用Simulink进行MATLAB仿真，对常微分方程和偏微分方程进行编程和仿真，495pdf

【2020新书】利用Simulink进行MATLAB仿真，对常微分方程和偏微分方程进行编程和仿真，495pdf

专知会员服务

72+阅读 · 2020年4月10日

模型压缩究竟在做什么？我们真的需要模型压缩么？

模型压缩究竟在做什么？我们真的需要模型压缩么？

专知会员服务

28+阅读 · 2020年1月16日

【Caltech&NVIDiA】张量在机器学习中的作用（附pdf）

专知会员服务

13+阅读 · 2019年11月23日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】基于自适应表征的高效视觉建模

《多域作战中融合网络、电子战与动能机动》

AI智能体时代大模型安全风险与攻防新挑战

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

相关资讯

《数字孪生仿真赋能要素及其在国防领域信息优势中的应用》2022最新16页技术报告，北约STO

《数字孪生仿真赋能要素及其在国防领域信息优势中的应用》2022最新16页技术报告，北约STO

专知

33+阅读 · 2022年10月26日

聊聊RTA（Realtime API）

聊聊RTA（Realtime API）

AINLP

29+阅读 · 2020年6月5日

【仿真+AI】浅谈AI在CAE领域的应用

【仿真+AI】浅谈AI在CAE领域的应用

产业智能官

13+阅读 · 2019年12月7日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

CALDERA 一款对手自动模拟工具

CALDERA 一款对手自动模拟工具

黑白之道

20+阅读 · 2019年9月17日

【最新综述】模型压缩与加速（附论文全文下载）

【最新综述】模型压缩与加速（附论文全文下载）

专知

28+阅读 · 2019年2月14日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

【仿真】生产系统仿真软件，实现数字化工厂的利器！

【仿真】生产系统仿真软件，实现数字化工厂的利器！

产业智能官

15+阅读 · 2018年11月1日

超全总结：神经网络加速之量化模型 | 附带代码

超全总结：神经网络加速之量化模型 | 附带代码

PaperWeekly

12+阅读 · 2018年6月1日

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

全球人工智能

12+阅读 · 2017年12月3日

相关论文

Fast and Fusiest: An Optimal Fusion-Aware Mapper for Accelerator Modeling and Evaluation

Arxiv

0+阅读 · 2月16日

Supercharging Packet-level Network Simulation of Large Model Training via Memoization and Fast-Forwarding

Arxiv

0+阅读 · 2月11日

Pushing Tensor Accelerators Beyond MatMul in a User-Schedulable Language

Arxiv

0+阅读 · 2月11日

ACE-RTL: When Agentic Context Evolution Meets RTL-Specialized LLMs

Arxiv

0+阅读 · 2月10日

A-Graph: A Unified Graph Representation for At-Will Simulation across System Stacks

Arxiv

0+阅读 · 2月4日

Understanding and Mitigating Errors of LLM-Generated RTL Code

Arxiv

0+阅读 · 2月1日

ScaleSim: Serving Large-Scale Multi-Agent Simulation with Invocation Distance-Based Memory Management

Arxiv

0+阅读 · 1月29日

DiffVC-RT: Towards Practical Real-Time Diffusion-based Perceptual Neural Video Compression

Arxiv

0+阅读 · 1月28日

Veri-Sure: A Contract-Aware Multi-Agent Framework with Temporal Tracing and Formal Verification for Correct RTL Code Generation

Arxiv

0+阅读 · 1月27日

TempoNet: Learning Realistic Communication and Timing Patterns for Network Traffic Simulation

Arxiv

0+阅读 · 1月22日

相关基金

纳米尺度自旋电子器件参数化电路模型建立方法的研究

国家自然科学基金

0+阅读 · 2017年12月31日

从仿生的角度设计用于指导构建组织支架的单元细胞模块、有限元分析以及3D打印工艺路径规划

国家自然科学基金

0+阅读 · 2015年12月31日

近似计算中基于概率图模型的软错误量化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

高精度片上抖动测量关键技术及电路实现研究

国家自然科学基金

0+阅读 · 2015年12月31日

集成电路中电热耦合建模理论及高效数值方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

张量分析及其在高维信息处理中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

基于周期数据的广义保形拟插值的理论及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于扩展的概率转移矩阵模型的高精度快速广义门电路可靠性评估方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

三维连续集成集成电路关键工艺技术和机理研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向14纳米及以下工艺的亚皮秒精度信号片上测量关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员