The rapid growth of generative artificial intelligence (AI) has introduced unprecedented computational demands, driving significant increases in the energy footprint of data centers. However, existing power consumption data is largely proprietary and reported at varying resolutions, creating challenges for estimating whole-facility energy use and planning infrastructure. In this work, we present a methodology that bridges this gap by linking high-resolution workload power measurements to whole-facility energy demand. Using NLR's high-performance computing data center equipped with NVIDIA H100 GPUs, we measure power consumption of AI workloads at 0.1-second resolution for AI training, fine-tuning and inference jobs. Workloads are characterized using MLCommons benchmarks for model training and fine-tuning, and vLLM benchmarks for inference, enabling reproducible and standardized workload profiling. The dataset of power consumption profiles is made publicly available. These power profiles are then scaled to the whole-facility-level using a bottom-up, event-driven, data center energy model. The resulting whole-facility energy profiles capture realistic temporal fluctuations driven by AI workloads and user-behavior, and can be used to inform infrastructure planning for grid connection, on-site energy generation, and distributed microgrids.


翻译:生成式人工智能的快速发展带来了前所未有的计算需求,显著推高了数据中心的能源足迹。然而,现有功耗数据大多为专有信息,且报告分辨率各异,这给估算整设施能耗及规划基础设施带来了挑战。本文提出一种方法论,通过将高分辨率工作负载功耗测量与整设施能源需求相衔接来弥补这一缺口。利用配备NVIDIA H100 GPU的NLR高性能计算数据中心,我们以0.1秒分辨率测量了AI训练、微调和推理作业的功耗。工作负载通过MLCommons基准测试(用于模型训练与微调)和vLLM基准测试(用于推理)进行表征,从而实现可复现、标准化的负载特征分析。该功耗剖面数据集已公开。随后,采用自底向上、事件驱动的数据中心能源模型将这些功耗剖面扩展至整设施层级。由此生成的整设施能源剖面能够捕捉由AI工作负载和用户行为驱动的真实时间波动,并可服务于电网接入、现场发电及分布式微电网等基础设施规划。

0
下载
关闭预览

相关内容

AI 智能体系统:体系架构、应用场景及评估范式
电力人工智能技术研究框架、应用现状及展望
专知会员服务
17+阅读 · 2025年5月15日
中国智算中心产业发展白皮书,63页pdf
专知会员服务
32+阅读 · 2025年1月22日
数据中心智能化运维发展研究报告 (2023 年),35页pdf
专知会员服务
63+阅读 · 2023年3月25日
电力人工智能发展报告
专知会员服务
85+阅读 · 2022年4月11日
【图计算】人工智能之图计算
产业智能官
17+阅读 · 2020年4月3日
面试题:请简要介绍下tensorflow的计算图
七月在线实验室
14+阅读 · 2019年6月10日
面向人工智能的计算机体系结构
计算机研究与发展
14+阅读 · 2019年6月6日
【学科发展报告】智慧城市
中国自动化学会
10+阅读 · 2019年1月14日
【知识图谱】知识图谱+人工智能=新型网络信息体系
产业智能官
14+阅读 · 2018年11月18日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
VIP会员
相关主题
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
1+阅读 · 今天15:00
21世纪的无人机战争
专知会员服务
2+阅读 · 今天14:05
《量子技术的军事任务技术适配与利用》
专知会员服务
2+阅读 · 今天13:51
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员