PAI: Fast, Accurate, and Full Benchmark Performance Projection with AI - 专知论文

会员服务 ·

0

基准 · 基准测试 · 性能预测 · 分析 · 片上系统 ·

PAI: Fast, Accurate, and Full Benchmark Performance Projection with AI

翻译：PAI：基于人工智能的快速、准确且完整的基准测试性能预测

Avery Johnson,Mohammad Majharul Islam,Riad Akram,Abdullah Muzahid

The exponential increase in complex IPs within modern SoCs, driven by Moore's Law, has created a pressing need for fast and accurate hardware-software power-performance analysis. Traditional performance simulators (such as cycle accurate simulators) are often too slow to simulate full benchmarks within a reasonable timeframe; require considerable effort for development, maintenance, and extensions; and are prone to errors, making pre-silicon performance projections and competitive analysis increasingly challenging. Prior attempts in addressing this challenge using machine learning fall short as they are either slow, inaccurate or unable to predict the performance of full benchmarks. To address these limitations, we present PAI, the first technique to accurately predict full benchmark performance without relying on detailed simulation or instruction-wise encoding. At the heart of PAI is a hierarchical Long Short Term Memory (LSTM)-based model that takes a trace of microarchitecture independent features from a program execution and predicts performance metrics. We present the detailed design, implementation and evaluation of PAI. Our initial experiments showed that PAI can achieve an average IPC prediction error of 9.35% for SPEC CPU 2017 benchmark suite while taking only 2 min 57 sec for the entire suite. This prediction error is comparable to prior state-of-the-art techniques while requiring 3 orders of magnitude less time.

翻译：随着摩尔定律的驱动，现代片上系统中复杂知识产权核的指数级增长，催生了对快速且精确的软硬件功耗-性能分析的迫切需求。传统的性能模拟器（如周期精确模拟器）通常在合理时间内无法完成完整基准测试的仿真，在开发、维护和扩展方面需要大量人力，且容易出错，这使得硅前性能预测和竞争分析日益困难。此前利用机器学习解决该问题的尝试存在不足，要么速度缓慢、精度不足，要么无法预测完整基准测试的性能。为克服这些局限，我们提出了PAI——首个无需依赖详细仿真或指令级编码即可精确预测完整基准测试性能的技术。PAI的核心是一个基于分层长短期记忆网络的模型，该模型从程序执行中提取与微架构无关的特征轨迹，并预测性能指标。我们详细阐述了PAI的设计、实现与评估。初步实验表明，PAI对SPEC CPU 2017基准测试套件可实现平均IPC预测误差为9.35%，且整个套件仅需2分57秒。这一预测误差与先前最先进的技术相当，但所需时间减少了三个数量级。

0

相关内容

国家标准《人工智能预训练模型第2 部分：评测指标与方法》

国家标准《人工智能预训练模型第2 部分：评测指标与方法》

专知会员服务

94+阅读 · 2024年6月15日

《综述：测试与评估中应用的人工智能工具》

《综述：测试与评估中应用的人工智能工具》

专知会员服务

75+阅读 · 2024年1月22日

《人工智能系统测试与评估框架》美国防部联合人工智能中心

《人工智能系统测试与评估框架》美国防部联合人工智能中心

专知会员服务

83+阅读 · 2024年1月4日

中文版《综述：人工智能赋能工具在测试与评估中的应用》

中文版《综述：人工智能赋能工具在测试与评估中的应用》

专知会员服务

98+阅读 · 2023年7月29日

MIT发布《人工智能加速器》2022年度综述论文，详解80+类AI芯片性能优劣

MIT发布《人工智能加速器》2022年度综述论文，详解80+类AI芯片性能优劣

专知会员服务

79+阅读 · 2022年10月12日

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

专知会员服务

22+阅读 · 2022年3月29日

「AI芯片/GPU/NPU/DSP专用处理器」技术特征比较分析最新2022综述论文

「AI芯片/GPU/NPU/DSP专用处理器」技术特征比较分析最新2022综述论文

专知会员服务

65+阅读 · 2022年3月6日

《人工智能芯片基准测试评估方法》行业标准

《人工智能芯片基准测试评估方法》行业标准

专知会员服务

88+阅读 · 2022年2月20日

MIT发布《人工智能加速器》2021年度综述论文，详解80+类AI芯片性能优劣

专知会员服务

66+阅读 · 2021年9月21日

【Facebook】人工智能基准(Benchmarking)测试再思考，55页ppt

【Facebook】人工智能基准(Benchmarking)测试再思考，55页ppt

专知会员服务

32+阅读 · 2020年12月20日

《人工智能安全测评白皮书》，99页pdf

《人工智能安全测评白皮书》，99页pdf

专知

36+阅读 · 2022年2月26日

【PKDD2020教程】可解释人工智能XAI:算法到应用，200页ppt

【PKDD2020教程】可解释人工智能XAI:算法到应用，200页ppt

专知

16+阅读 · 2020年10月13日

清华大学、中国人工智能学会重磅发布《2019人工智能发展报告》！两大亮点抢先看（附下载）

清华大学、中国人工智能学会重磅发布《2019人工智能发展报告》！两大亮点抢先看（附下载）

新智元

16+阅读 · 2019年12月2日

清华大学、中国人工智能学会联合发布《2019人工智能发展报告》，391页pdf详述进展

清华大学、中国人工智能学会联合发布《2019人工智能发展报告》，391页pdf详述进展

专知

24+阅读 · 2019年12月1日

清华大学、中国人工智能学会重磅发布《2019人工智能发展报告》（附报告下载）

清华大学、中国人工智能学会重磅发布《2019人工智能发展报告》（附报告下载）

AI科技评论

12+阅读 · 2019年11月30日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

【边缘智能】边缘计算驱动的深度学习加速技术

【边缘智能】边缘计算驱动的深度学习加速技术

产业智能官

20+阅读 · 2019年2月8日

【人工智能】智能计算概述、神经网络计算、机器学习计算、遗传算法、模糊计算、群智能计算

【人工智能】智能计算概述、神经网络计算、机器学习计算、遗传算法、模糊计算、群智能计算

产业智能官

15+阅读 · 2019年1月8日

【泡泡图灵智库】非监督深度学习单应性：一种快速稳健的单应性估计模型

【泡泡图灵智库】非监督深度学习单应性：一种快速稳健的单应性估计模型

泡泡机器人SLAM

10+阅读 · 2018年8月10日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

纳米尺度自旋电子器件参数化电路模型建立方法的研究

国家自然科学基金

0+阅读 · 2017年12月31日

面向传感网的软件定义测量技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向估计性能优化的网络化控制系统传感器调度

国家自然科学基金

0+阅读 · 2015年12月31日

高精度片上抖动测量关键技术及电路实现研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于概率计算的大规模MIMO检测方法

国家自然科学基金

1+阅读 · 2015年12月31日

大规模MIMO检测的理论性能分析和算法设计

国家自然科学基金

0+阅读 · 2015年12月31日

基于扩展的概率转移矩阵模型的高精度快速广义门电路可靠性评估方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

可与MPSoC高度融合的片上自主测试-自主修复关键技术研究：针对自然、人为可靠性威胁

国家自然科学基金

0+阅读 · 2015年12月31日

千万自由度量级并行有限元模态和振动分析软件研发

国家自然科学基金

0+阅读 · 2014年12月31日

基于多层多源信息的地区级智能电网短期负荷预测研究

国家自然科学基金

2+阅读 · 2014年12月31日

LabOSBench: Benchmarking Computer Use Agents for Scientific Instrument Control

Arxiv

0+阅读 · 6月15日

Benchmarking Quantum Computers via Protocols, Comparing IBM's Heron vs IBM's Eagle

Arxiv

0+阅读 · 6月12日

Benchmarking AI Agents for Addressing Scientific Challenges Across Scales

Arxiv

0+阅读 · 6月10日

$τ$-Rec: A Verifiable Benchmark for Agentic Recommender Systems

Arxiv

0+阅读 · 6月8日

ProEval: Proactive Failure Discovery and Efficient Performance Estimation for Generative AI Evaluation

Arxiv

0+阅读 · 6月1日

Benchmarks are Not Enough: RAMP for Runtime Assessing of Agentic Models in Production Systems

Arxiv

0+阅读 · 5月26日

ParseBench: A Document Parsing Benchmark for AI Agents

Arxiv

0+阅读 · 4月13日

ParseBench: A Document Parsing Benchmark for AI Agents

Arxiv

0+阅读 · 4月10日

ABI: A tightly integrated, unified, sparsity-aware, reconfigurable, compute near-register file/cache GPU architecture with light-weight softmax for deep learning, linear algebra, and Ising compute

Arxiv

0+阅读 · 4月4日

DABench-LLM: Standardized and In-Depth Benchmarking of Post-Moore Dataflow AI Accelerators for LLMs

Arxiv

0+阅读 · 2025年12月4日

VIP会员

文章信息

相关主题

最新内容

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

专知会员服务

8+阅读 · 7月16日

《无人地面战车（UGV）的崛起》报告

《无人地面战车（UGV）的崛起》报告

专知会员服务

5+阅读 · 7月16日

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

专知会员服务

5+阅读 · 7月16日

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

专知会员服务

8+阅读 · 7月16日

美陆军任务式指挥人工智能解决方案

美陆军任务式指挥人工智能解决方案

专知会员服务

7+阅读 · 7月16日

ICML 2026 | 理论级自动形式化：从孤立命题到统一形式化知识库

ICML 2026 | 理论级自动形式化：从孤立命题到统一形式化知识库

专知会员服务

5+阅读 · 7月16日

综述 | 现代智能体自我改进，从模型更新到脚手架演化

综述 | 现代智能体自我改进，从模型更新到脚手架演化

专知会员服务

8+阅读 · 7月16日

美国陆军宣布“项目融合-顶点6”：现代化进程的关键里程碑

美国陆军宣布“项目融合-顶点6”：现代化进程的关键里程碑

专知会员服务

12+阅读 · 7月15日

五角大楼新版反无人机手册：内容解析与战略影响（附手册100页原件）

五角大楼新版反无人机手册：内容解析与战略影响（附手册100页原件）

专知会员服务

14+阅读 · 7月15日

《军事基地能源韧性与经济性权衡评估方法研究》

《军事基地能源韧性与经济性权衡评估方法研究》

专知会员服务

7+阅读 · 7月15日

ACM MM 2026 | UNIT：释放大语言模型在图持续学习中的潜力

ACM MM 2026 | UNIT：释放大语言模型在图持续学习中的潜力

专知会员服务

8+阅读 · 7月15日

综述 | 具身视觉语言导航：系统综述与真实世界评测

综述 | 具身视觉语言导航：系统综述与真实世界评测

专知会员服务

10+阅读 · 7月15日

应对第1、2类无人机威胁的推荐战术、技术与程序

应对第1、2类无人机威胁的推荐战术、技术与程序

专知会员服务

10+阅读 · 7月15日

《反制多无人机集群攻城：序贯斯塔克伯格安全博弈方法研究》59页

《反制多无人机集群攻城：序贯斯塔克伯格安全博弈方法研究》59页

专知会员服务

11+阅读 · 7月15日

博士论文 | 可扩展、自我改进的大语言模型智能体

博士论文 | 可扩展、自我改进的大语言模型智能体

专知会员服务

12+阅读 · 7月14日

相关VIP内容

国家标准《人工智能预训练模型第2 部分：评测指标与方法》

国家标准《人工智能预训练模型第2 部分：评测指标与方法》

专知会员服务

94+阅读 · 2024年6月15日

《综述：测试与评估中应用的人工智能工具》

《综述：测试与评估中应用的人工智能工具》

专知会员服务

75+阅读 · 2024年1月22日

《人工智能系统测试与评估框架》美国防部联合人工智能中心

《人工智能系统测试与评估框架》美国防部联合人工智能中心

专知会员服务

83+阅读 · 2024年1月4日

中文版《综述：人工智能赋能工具在测试与评估中的应用》

中文版《综述：人工智能赋能工具在测试与评估中的应用》

专知会员服务

98+阅读 · 2023年7月29日

MIT发布《人工智能加速器》2022年度综述论文，详解80+类AI芯片性能优劣

MIT发布《人工智能加速器》2022年度综述论文，详解80+类AI芯片性能优劣

专知会员服务

79+阅读 · 2022年10月12日

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

【TPAMI】从人机对抗提出视觉跟踪智能评估新方法，Global Instance Tracking: Locating Target More Like Humans

专知会员服务

22+阅读 · 2022年3月29日

「AI芯片/GPU/NPU/DSP专用处理器」技术特征比较分析最新2022综述论文

「AI芯片/GPU/NPU/DSP专用处理器」技术特征比较分析最新2022综述论文

专知会员服务

65+阅读 · 2022年3月6日

《人工智能芯片基准测试评估方法》行业标准

《人工智能芯片基准测试评估方法》行业标准

专知会员服务

88+阅读 · 2022年2月20日

MIT发布《人工智能加速器》2021年度综述论文，详解80+类AI芯片性能优劣

专知会员服务

66+阅读 · 2021年9月21日

【Facebook】人工智能基准(Benchmarking)测试再思考，55页ppt

【Facebook】人工智能基准(Benchmarking)测试再思考，55页ppt

专知会员服务

32+阅读 · 2020年12月20日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人地面战车（UGV）的崛起》报告

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

相关资讯

《人工智能安全测评白皮书》，99页pdf

《人工智能安全测评白皮书》，99页pdf

专知

36+阅读 · 2022年2月26日

【PKDD2020教程】可解释人工智能XAI:算法到应用，200页ppt

【PKDD2020教程】可解释人工智能XAI:算法到应用，200页ppt

专知

16+阅读 · 2020年10月13日

清华大学、中国人工智能学会重磅发布《2019人工智能发展报告》！两大亮点抢先看（附下载）

清华大学、中国人工智能学会重磅发布《2019人工智能发展报告》！两大亮点抢先看（附下载）

新智元

16+阅读 · 2019年12月2日

清华大学、中国人工智能学会联合发布《2019人工智能发展报告》，391页pdf详述进展

清华大学、中国人工智能学会联合发布《2019人工智能发展报告》，391页pdf详述进展

专知

24+阅读 · 2019年12月1日

清华大学、中国人工智能学会重磅发布《2019人工智能发展报告》（附报告下载）

清华大学、中国人工智能学会重磅发布《2019人工智能发展报告》（附报告下载）

AI科技评论

12+阅读 · 2019年11月30日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

【边缘智能】边缘计算驱动的深度学习加速技术

【边缘智能】边缘计算驱动的深度学习加速技术

产业智能官

20+阅读 · 2019年2月8日

【人工智能】智能计算概述、神经网络计算、机器学习计算、遗传算法、模糊计算、群智能计算

【人工智能】智能计算概述、神经网络计算、机器学习计算、遗传算法、模糊计算、群智能计算

产业智能官

15+阅读 · 2019年1月8日

【泡泡图灵智库】非监督深度学习单应性：一种快速稳健的单应性估计模型

【泡泡图灵智库】非监督深度学习单应性：一种快速稳健的单应性估计模型

泡泡机器人SLAM

10+阅读 · 2018年8月10日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

相关论文

LabOSBench: Benchmarking Computer Use Agents for Scientific Instrument Control

Arxiv

0+阅读 · 6月15日

Benchmarking Quantum Computers via Protocols, Comparing IBM's Heron vs IBM's Eagle

Arxiv

0+阅读 · 6月12日

Benchmarking AI Agents for Addressing Scientific Challenges Across Scales

Arxiv

0+阅读 · 6月10日

$τ$-Rec: A Verifiable Benchmark for Agentic Recommender Systems

Arxiv

0+阅读 · 6月8日

ProEval: Proactive Failure Discovery and Efficient Performance Estimation for Generative AI Evaluation

Arxiv

0+阅读 · 6月1日

Benchmarks are Not Enough: RAMP for Runtime Assessing of Agentic Models in Production Systems

Arxiv

0+阅读 · 5月26日

ParseBench: A Document Parsing Benchmark for AI Agents

Arxiv

0+阅读 · 4月13日

ParseBench: A Document Parsing Benchmark for AI Agents

Arxiv

0+阅读 · 4月10日

ABI: A tightly integrated, unified, sparsity-aware, reconfigurable, compute near-register file/cache GPU architecture with light-weight softmax for deep learning, linear algebra, and Ising compute

Arxiv

0+阅读 · 4月4日

DABench-LLM: Standardized and In-Depth Benchmarking of Post-Moore Dataflow AI Accelerators for LLMs

Arxiv

0+阅读 · 2025年12月4日

相关基金

纳米尺度自旋电子器件参数化电路模型建立方法的研究

国家自然科学基金

0+阅读 · 2017年12月31日

面向传感网的软件定义测量技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向估计性能优化的网络化控制系统传感器调度

国家自然科学基金

0+阅读 · 2015年12月31日

高精度片上抖动测量关键技术及电路实现研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于概率计算的大规模MIMO检测方法

国家自然科学基金

1+阅读 · 2015年12月31日

大规模MIMO检测的理论性能分析和算法设计

国家自然科学基金

0+阅读 · 2015年12月31日

基于扩展的概率转移矩阵模型的高精度快速广义门电路可靠性评估方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

可与MPSoC高度融合的片上自主测试-自主修复关键技术研究：针对自然、人为可靠性威胁

国家自然科学基金

0+阅读 · 2015年12月31日

千万自由度量级并行有限元模态和振动分析软件研发

国家自然科学基金

0+阅读 · 2014年12月31日

基于多层多源信息的地区级智能电网短期负荷预测研究

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员