AI Application Benchmarking: Power-Aware Performance Analysis for Vision and Language Models - 专知论文

会员服务 ·

0

基准 · 基准测试 · 分析 · 能效 · GPU ·

AI Application Benchmarking: Power-Aware Performance Analysis for Vision and Language Models

翻译：人工智能应用基准测试：视觉与语言模型的功耗感知性能分析

Martin Mayr,Sebastian Wind,Lukas Schröder,Georg Hager,Harald Köstler,Gerhard Wellein

Artificial Intelligence (AI) workloads drive a rapid expansion of high-performance computing (HPC) infrastructures and increase their power and energy demands towards a critical level. AI benchmarks representing state-of-the art workloads and their understanding in the context of performance-energy trade-offs are critical to deploy efficient infrastructures and can guide energy efficiency measures, such as power capping. We introduce a benchmarking framework with popular deep learning applications from computer vision (image classification and generation) and large language models (continued pre-training and inference) implementing modern methods. Our performance analysis focuses on throughput rather than time to "completion", which is the standard metric in HPC. We analyse performance and energy efficiency under various power capping scenarios on NVIDIA H100, NVIDIA H200, and AMD MI300X GPUs. Our results reveal that no universal optimal power cap exists, as the efficiency peak varies across application types and GPU architectures. Interestingly, the two NVIDIA GPUs which mainly differ in their HBM configuration show qualitatively different performance-energy trade-offs. The developed benchmarking framework will be released as a public tool.

翻译：人工智能（AI）工作负载驱动着高性能计算（HPC）基础设施的快速扩张，并使其功耗与能源需求逼近临界水平。代表前沿工作负载的AI基准测试及其在性能-能耗权衡背景下的理解，对于部署高效基础设施至关重要，并能指导能效措施（如功耗封顶）的实施。我们引入了一个基准测试框架，其中包含来自计算机视觉（图像分类与生成）和大型语言模型（持续预训练与推理）的流行深度学习应用，这些应用实现了现代方法。我们的性能分析侧重于吞吐量而非“完成时间”——后者是HPC领域的标准度量指标。我们在NVIDIA H100、NVIDIA H200和AMD MI300X GPU上，分析了多种功耗封顶场景下的性能与能效。结果表明，不存在普适的最优功耗封顶值，因为能效峰值因应用类型和GPU架构而异。有趣的是，两款主要在HBM配置上存在差异的NVIDIA GPU，在性能-能耗权衡方面表现出质的差异。所开发的基准测试框架将作为公开工具发布。

0

相关内容

国家标准《人工智能知识图谱应用系统第2 部分：性能要求与测试方法》意见稿

国家标准《人工智能知识图谱应用系统第2 部分：性能要求与测试方法》意见稿

专知会员服务

30+阅读 · 2024年10月21日

大模型+遥感？最新《遥感中的人工智能基础模型》综述

大模型+遥感？最新《遥感中的人工智能基础模型》综述

专知会员服务

63+阅读 · 2024年8月10日

如何评估具身智能？斯坦福李飞飞等发布《BEHAVIOR-1K: 以人为中心、具身化AI基准测试，含1000种日常活动和真实模拟》

如何评估具身智能？斯坦福李飞飞等发布《BEHAVIOR-1K: 以人为中心、具身化AI基准测试，含1000种日常活动和真实模拟》

专知会员服务

62+阅读 · 2024年3月15日

《综述：测试与评估中应用的人工智能工具》

《综述：测试与评估中应用的人工智能工具》

专知会员服务

74+阅读 · 2024年1月22日

中文版《综述：人工智能赋能工具在测试与评估中的应用》

中文版《综述：人工智能赋能工具在测试与评估中的应用》

专知会员服务

97+阅读 · 2023年7月29日

《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知会员服务

189+阅读 · 2022年4月15日

《人工智能芯片基准测试评估方法》行业标准

《人工智能芯片基准测试评估方法》行业标准

专知会员服务

87+阅读 · 2022年2月20日

【人工智能+人力资源】人力资源专业人士的工具箱，Human-Centred Artificial Intelligence for Human Resources: A Toolkit for Human Resources Professionals

【人工智能+人力资源】人力资源专业人士的工具箱，Human-Centred Artificial Intelligence for Human Resources: A Toolkit for Human Resources Professionals

专知会员服务

29+阅读 · 2022年2月17日

2020-2021中国人工智能计算力发展评估报告, 36页pdf

2020-2021中国人工智能计算力发展评估报告, 36页pdf

专知会员服务

46+阅读 · 2021年3月20日

【Facebook】人工智能基准(Benchmarking)测试再思考，55页ppt

【Facebook】人工智能基准(Benchmarking)测试再思考，55页ppt

专知会员服务

31+阅读 · 2020年12月20日

重磅！斯坦福HAI《2023人工智能指数报告》出炉，386页pdf了解AI十大态势进展（附中文版报告下载）

重磅！斯坦福HAI《2023人工智能指数报告》出炉，386页pdf了解AI十大态势进展（附中文版报告下载）

专知

24+阅读 · 2023年4月4日

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

专知

102+阅读 · 2022年10月17日

推荐！【中文版】《人工智能对海军作战的重要性和应用》37页报告：人工智能是美国第三次抵消战略的关键能力

推荐！【中文版】《人工智能对海军作战的重要性和应用》37页报告：人工智能是美国第三次抵消战略的关键能力

专知

64+阅读 · 2022年9月9日

推荐！《关于美国海军陆战队情报工作的人工智能（AI）战略和设计》美国海军研究生院131页报告

推荐！《关于美国海军陆战队情报工作的人工智能（AI）战略和设计》美国海军研究生院131页报告

专知

62+阅读 · 2022年9月7日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

106+阅读 · 2022年4月28日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

91+阅读 · 2022年4月17日

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

专知

98+阅读 · 2022年3月7日

《人工智能安全测评白皮书》，99页pdf

《人工智能安全测评白皮书》，99页pdf

专知

36+阅读 · 2022年2月26日

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

产业智能官

16+阅读 · 2019年4月22日

【人工智能】智能计算概述、神经网络计算、机器学习计算、遗传算法、模糊计算、群智能计算

【人工智能】智能计算概述、神经网络计算、机器学习计算、遗传算法、模糊计算、群智能计算

产业智能官

15+阅读 · 2019年1月8日

家庭智能用电任务调度优化及其对电网负荷影响分析模型

国家自然科学基金

1+阅读 · 2015年12月31日

面向传感网的软件定义测量技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于感性工学与视觉感知协同优化的产品设计理论及应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

高通量测序的可计算建模与应用基础算法

国家自然科学基金

1+阅读 · 2015年12月31日

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

面向存储受限应用的GPU性能预测模型和通信优化关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

无人驾驶车辆智能测试评估与环境设计

国家自然科学基金

28+阅读 · 2014年12月31日

一种低功耗高压缩率测试图形生成方法的实现与应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于人眼关注度与情感分析的电子商务智能推荐计算

国家自然科学基金

0+阅读 · 2014年12月31日

基于多层多源信息的地区级智能电网短期负荷预测研究

国家自然科学基金

2+阅读 · 2014年12月31日

Efficiency vs Demand in AI Electricity: Implications for Post-AGI Scaling

Arxiv

0+阅读 · 3月11日

AI-Enabled Data-driven Intelligence for Spectrum Demand Estimation

Arxiv

0+阅读 · 3月10日

Capabilities Ain't All You Need: Measuring Propensities in AI

Arxiv

0+阅读 · 2月25日

Pareto Optimal Benchmarking of AI Models on ARM Cortex Processors for Sustainable Embedded Systems

Pareto Optimal Benchmarking of AI Models on ARM Cortex Processors for Sustainable Embedded Systems

Arxiv

0+阅读 · 2月19日

Benchmarking AI-based data assimilation to advance data-driven global weather forecasting

Arxiv

0+阅读 · 2月16日

Benchmarking AI Performance on End-to-End Data Science Projects

Arxiv

0+阅读 · 2月15日

How Should AI Safety Benchmarks Benchmark Safety?

Arxiv

0+阅读 · 2月8日

How well are open sourced AI-generated image detection models out-of-the-box: A comprehensive benchmark study

Arxiv

0+阅读 · 2月8日

How should AI Safety Benchmarks Benchmark Safety?

Arxiv

0+阅读 · 1月30日

Toward Third-Party Assurance of AI Systems: Design Requirements, Prototype, and Early Testing

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

最新内容

【ICML Spotlight 2026 】NonZero：交互引导探索的多智能体蒙特卡洛树搜索

【ICML Spotlight 2026 】NonZero：交互引导探索的多智能体蒙特卡洛树搜索

专知会员服务

7+阅读 · 5月4日

【综述】机器人学习中的世界模型：全面综述

【综述】机器人学习中的世界模型：全面综述

专知会员服务

9+阅读 · 5月4日

伊朗的导弹-无人机行动及其对美国威慑的影响

伊朗的导弹-无人机行动及其对美国威慑的影响

专知会员服务

8+阅读 · 5月4日

《未来战术无人机系统案例研究：量身定制采办策略方法》100页报告

《未来战术无人机系统案例研究：量身定制采办策略方法》100页报告

专知会员服务

8+阅读 · 5月4日

战争贩子：2026年第一季度美国对中东潜在军售激增

战争贩子：2026年第一季度美国对中东潜在军售激增

专知会员服务

6+阅读 · 5月4日

【CVPR Oral 2026】LILA：从无标签视频中学习像素级时空一致表示

【CVPR Oral 2026】LILA：从无标签视频中学习像素级时空一致表示

专知会员服务

9+阅读 · 5月3日

【综述】基于大语言模型的对话用户模拟综述

【综述】基于大语言模型的对话用户模拟综述

专知会员服务

8+阅读 · 5月3日

《美战争部人工智能应用用例评估：人类专家与大型语言模型比较》

《美战争部人工智能应用用例评估：人类专家与大型语言模型比较》

专知会员服务

13+阅读 · 5月3日

《无人机与大规模齐射攻击：美国-以色列的经验教训》

《无人机与大规模齐射攻击：美国-以色列的经验教训》

专知会员服务

18+阅读 · 5月3日

《再入飞行器轨迹分析与性能工具的开发及其在SpaceX星舰™上的应用》227页

《再入飞行器轨迹分析与性能工具的开发及其在SpaceX星舰™上的应用》227页

专知会员服务

7+阅读 · 5月3日

《军事人工智能中的法律、伦理和技术困境》338页书籍

《军事人工智能中的法律、伦理和技术困境》338页书籍

专知会员服务

6+阅读 · 5月3日

首场人工智能战争：美军在伊朗对无人机、无人水面艇、无人潜航器、人工智能及商业航天技术的运用

首场人工智能战争：美军在伊朗对无人机、无人水面艇、无人潜航器、人工智能及商业航天技术的运用

专知会员服务

9+阅读 · 5月3日

反无人机措施与海湾局势：乌克兰战争对抗无人机的经验教训

反无人机措施与海湾局势：乌克兰战争对抗无人机的经验教训

专知会员服务

14+阅读 · 5月2日

【CVPR 2026】语义泡沫：统一空间与语义场景分解

【CVPR 2026】语义泡沫：统一空间与语义场景分解

专知会员服务

9+阅读 · 5月2日

【综述】智能体AI如何重塑软件开发生命周期：从代码补全到人类监督下的委托执行

【综述】智能体AI如何重塑软件开发生命周期：从代码补全到人类监督下的委托执行

专知会员服务

11+阅读 · 5月2日

相关VIP内容

国家标准《人工智能知识图谱应用系统第2 部分：性能要求与测试方法》意见稿

国家标准《人工智能知识图谱应用系统第2 部分：性能要求与测试方法》意见稿

专知会员服务

30+阅读 · 2024年10月21日

大模型+遥感？最新《遥感中的人工智能基础模型》综述

大模型+遥感？最新《遥感中的人工智能基础模型》综述

专知会员服务

63+阅读 · 2024年8月10日

如何评估具身智能？斯坦福李飞飞等发布《BEHAVIOR-1K: 以人为中心、具身化AI基准测试，含1000种日常活动和真实模拟》

如何评估具身智能？斯坦福李飞飞等发布《BEHAVIOR-1K: 以人为中心、具身化AI基准测试，含1000种日常活动和真实模拟》

专知会员服务

62+阅读 · 2024年3月15日

《综述：测试与评估中应用的人工智能工具》

《综述：测试与评估中应用的人工智能工具》

专知会员服务

74+阅读 · 2024年1月22日

中文版《综述：人工智能赋能工具在测试与评估中的应用》

中文版《综述：人工智能赋能工具在测试与评估中的应用》

专知会员服务

97+阅读 · 2023年7月29日

《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知会员服务

189+阅读 · 2022年4月15日

《人工智能芯片基准测试评估方法》行业标准

《人工智能芯片基准测试评估方法》行业标准

专知会员服务

87+阅读 · 2022年2月20日

【人工智能+人力资源】人力资源专业人士的工具箱，Human-Centred Artificial Intelligence for Human Resources: A Toolkit for Human Resources Professionals

【人工智能+人力资源】人力资源专业人士的工具箱，Human-Centred Artificial Intelligence for Human Resources: A Toolkit for Human Resources Professionals

专知会员服务

29+阅读 · 2022年2月17日

2020-2021中国人工智能计算力发展评估报告, 36页pdf

2020-2021中国人工智能计算力发展评估报告, 36页pdf

专知会员服务

46+阅读 · 2021年3月20日

【Facebook】人工智能基准(Benchmarking)测试再思考，55页ppt

【Facebook】人工智能基准(Benchmarking)测试再思考，55页ppt

专知会员服务

31+阅读 · 2020年12月20日

热门VIP内容

开通专知VIP会员享更多权益服务

【综述】机器人学习中的世界模型：全面综述

《未来战术无人机系统案例研究：量身定制采办策略方法》100页报告

【ICML Spotlight 2026 】NonZero：交互引导探索的多智能体蒙特卡洛树搜索

伊朗的导弹-无人机行动及其对美国威慑的影响

相关资讯

重磅！斯坦福HAI《2023人工智能指数报告》出炉，386页pdf了解AI十大态势进展（附中文版报告下载）

重磅！斯坦福HAI《2023人工智能指数报告》出炉，386页pdf了解AI十大态势进展（附中文版报告下载）

专知

24+阅读 · 2023年4月4日

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

推荐！《人工智能在武器系统中的应用》美智库(DSIAC)2022最新92页报告

专知

102+阅读 · 2022年10月17日

推荐！【中文版】《人工智能对海军作战的重要性和应用》37页报告：人工智能是美国第三次抵消战略的关键能力

推荐！【中文版】《人工智能对海军作战的重要性和应用》37页报告：人工智能是美国第三次抵消战略的关键能力

专知

64+阅读 · 2022年9月9日

推荐！《关于美国海军陆战队情报工作的人工智能（AI）战略和设计》美国海军研究生院131页报告

推荐！《关于美国海军陆战队情报工作的人工智能（AI）战略和设计》美国海军研究生院131页报告

专知

62+阅读 · 2022年9月7日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

106+阅读 · 2022年4月28日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

91+阅读 · 2022年4月17日

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

AI+军事？美国政府问责局(GAO)最新《人工智能武器系统研制与获取能力现状》报告，53页pdf

专知

98+阅读 · 2022年3月7日

《人工智能安全测评白皮书》，99页pdf

《人工智能安全测评白皮书》，99页pdf

专知

36+阅读 · 2022年2月26日

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

产业智能官

16+阅读 · 2019年4月22日

【人工智能】智能计算概述、神经网络计算、机器学习计算、遗传算法、模糊计算、群智能计算

【人工智能】智能计算概述、神经网络计算、机器学习计算、遗传算法、模糊计算、群智能计算

产业智能官

15+阅读 · 2019年1月8日

相关论文

Efficiency vs Demand in AI Electricity: Implications for Post-AGI Scaling

Arxiv

0+阅读 · 3月11日

AI-Enabled Data-driven Intelligence for Spectrum Demand Estimation

Arxiv

0+阅读 · 3月10日

Capabilities Ain't All You Need: Measuring Propensities in AI

Arxiv

0+阅读 · 2月25日

Pareto Optimal Benchmarking of AI Models on ARM Cortex Processors for Sustainable Embedded Systems

Pareto Optimal Benchmarking of AI Models on ARM Cortex Processors for Sustainable Embedded Systems

Arxiv

0+阅读 · 2月19日

Benchmarking AI-based data assimilation to advance data-driven global weather forecasting

Arxiv

0+阅读 · 2月16日

Benchmarking AI Performance on End-to-End Data Science Projects

Arxiv

0+阅读 · 2月15日

How Should AI Safety Benchmarks Benchmark Safety?

Arxiv

0+阅读 · 2月8日

How well are open sourced AI-generated image detection models out-of-the-box: A comprehensive benchmark study

Arxiv

0+阅读 · 2月8日

How should AI Safety Benchmarks Benchmark Safety?

Arxiv

0+阅读 · 1月30日

Toward Third-Party Assurance of AI Systems: Design Requirements, Prototype, and Early Testing

Arxiv

0+阅读 · 1月30日

相关基金

家庭智能用电任务调度优化及其对电网负荷影响分析模型

国家自然科学基金

1+阅读 · 2015年12月31日

面向传感网的软件定义测量技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于感性工学与视觉感知协同优化的产品设计理论及应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

高通量测序的可计算建模与应用基础算法

国家自然科学基金

1+阅读 · 2015年12月31日

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

面向存储受限应用的GPU性能预测模型和通信优化关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

无人驾驶车辆智能测试评估与环境设计

国家自然科学基金

28+阅读 · 2014年12月31日

一种低功耗高压缩率测试图形生成方法的实现与应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于人眼关注度与情感分析的电子商务智能推荐计算

国家自然科学基金

0+阅读 · 2014年12月31日

基于多层多源信息的地区级智能电网短期负荷预测研究

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员