Energy Use of AI Inference, Efficiency Pathways, and Test-Time Scaling - 专知论文

会员服务 ·

0

测试时间 · 人工智能推理 · 路径 · 系统 · 自下而上 ·

Energy Use of AI Inference, Efficiency Pathways, and Test-Time Scaling

翻译：人工智能推理能源使用、效率路径与测试时间扩展

Felipe Oviedo,Fiodar Kazhamiaka,Esha Choukse,Allen Kim,Amy Luers,Melanie Nakagawa,Ricardo Bianchini,Juan M. Lavista Ferres

from arxiv, A preprint version with DOI is available at Zenodo: https://doi.org/10.5281/zenodo.17188770

As AI inference scales to billions of queries, estimates of per-query energy use are increasingly important for capacity planning, efficiency interventions, and policy. Yet many public estimates assume non-production settings, leading to systematic overestimation. We introduce a bottom-up framework estimating inference energy from token throughput, node power, and overhead under large-scale deployment assumptions. For frontier-scale models (>200B parameters) on H100 nodes, we estimate a median energy of 0.31 Wh/query (IQR 0.16-0.60), indicating widely cited estimates are overstated by 4-20x. In test-time scaling scenarios 15x longer than typical queries, the median energy rises 13x to 3.91 Wh (IQR 2.15-7.05). Across models, serving systems, and hardware, we estimate 8-20x line-of-sight energy reductions. At datacenter scale, serving 1 billion queries/day requires 0.7 GWh; if 10% are long queries, demand rises to 1.7 GWh/day. With efficiency interventions, it falls to 0.8 GWh/day, mitigating the energy impact of test-time scaling.

翻译：随着人工智能推理扩展至数十亿次查询，每次查询的能源消耗估算对于容量规划、效率干预和政策制定日益重要。然而，许多公开估算假设非生产环境，导致系统性高估。我们提出一个自下而上的框架，基于大规模部署假设，通过令牌吞吐量、节点功耗和开销来估算推理能耗。对于H100节点上的前沿模型（参数超过2000亿），我们估算每次查询的中位能耗为0.31瓦时（四分位距0.16-0.60），表明广泛引用的估算被高估了4-20倍。在测试时间扩展场景中，当查询时间比典型查询长15倍时，中位能耗上升13倍至3.91瓦时（四分位距2.15-7.05）。跨越不同模型、服务系统和硬件，我们估算出8-20倍的直接能耗缩减空间。在数据中心规模下，每天服务10亿次查询需要0.7吉瓦时；如果其中10%为长查询，则需求升至每天1.7吉瓦时。通过效率干预，这一数值可降至每天0.8吉瓦时，从而缓解测试时间扩展带来的能源影响。

0

相关内容

测试时间

《人工智能增强监视分析：利用跨网络、陆地、空中及海上领域的威胁向量实时建模》

《人工智能增强监视分析：利用跨网络、陆地、空中及海上领域的威胁向量实时建模》

专知会员服务

29+阅读 · 2025年12月11日

军事人工智能的能源挑战

军事人工智能的能源挑战

专知会员服务

18+阅读 · 2025年11月23日

电力人工智能技术研究框架、应用现状及展望

电力人工智能技术研究框架、应用现状及展望

专知会员服务

17+阅读 · 2025年5月15日

美能源部发布《面向科学、能源和安全的人工智能》报告

美能源部发布《面向科学、能源和安全的人工智能》报告

专知会员服务

44+阅读 · 2023年6月18日

AI应用端行业研究报告：赋能千行百业，AI+矿山、AI+电力助力能源改革，37页pdf

AI应用端行业研究报告：赋能千行百业，AI+矿山、AI+电力助力能源改革，37页pdf

专知会员服务

97+阅读 · 2023年4月15日

电力人工智能发展报告

电力人工智能发展报告

专知会员服务

85+阅读 · 2022年4月11日

《利用人工智能加速能源转型》报告

《利用人工智能加速能源转型》报告

专知会员服务

85+阅读 · 2022年2月23日

《人工智能发展报告2020》,清华人工智能研究院等，235页pdf

专知会员服务

218+阅读 · 2021年1月21日

集大成者！经典书《知识表示学习》，1035页pdf系统性讲解人工智能知识表示与推理基础、算法与应用

集大成者！经典书《知识表示学习》，1035页pdf系统性讲解人工智能知识表示与推理基础、算法与应用

专知会员服务

155+阅读 · 2020年11月20日

【CCF优秀博士学位论文奖-2019提名】面向绿色跨域数据中心的能效管理研究，华中科技大学周知

【CCF优秀博士学位论文奖-2019提名】面向绿色跨域数据中心的能效管理研究，华中科技大学周知

专知会员服务

14+阅读 · 2019年11月8日

推荐！《用于兵棋推演和建模的人工智能》兰德、耶鲁大学2022最新16页论文

推荐！《用于兵棋推演和建模的人工智能》兰德、耶鲁大学2022最新16页论文

专知

53+阅读 · 2022年11月14日

推荐！【中美俄AI军用方向】中文版《为国家安全和国防开发人工智能》，美军重大AI应用案例及未来发展布局

推荐！【中美俄AI军用方向】中文版《为国家安全和国防开发人工智能》，美军重大AI应用案例及未来发展布局

专知

74+阅读 · 2022年6月30日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

92+阅读 · 2022年4月17日

清华大学、中国人工智能学会联合发布《2019人工智能发展报告》，391页pdf详述进展

清华大学、中国人工智能学会联合发布《2019人工智能发展报告》，391页pdf详述进展

专知

24+阅读 · 2019年12月1日

人工智能应用实践与趋势

人工智能应用实践与趋势

人工智能学家

13+阅读 · 2019年9月20日

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

专知

23+阅读 · 2019年9月6日

【人工智能】智能计算概述、神经网络计算、机器学习计算、遗传算法、模糊计算、群智能计算

【人工智能】智能计算概述、神经网络计算、机器学习计算、遗传算法、模糊计算、群智能计算

产业智能官

15+阅读 · 2019年1月8日

推荐几个权威且免费的人工智能学习资源

推荐几个权威且免费的人工智能学习资源

深度学习世界

10+阅读 · 2018年5月2日

AI 经典书单 | 人工智能学习该读哪些书

AI 经典书单 | 人工智能学习该读哪些书

七月在线实验室

35+阅读 · 2018年1月16日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

推荐系统的信息核挖掘及其应用研究

国家自然科学基金

8+阅读 · 2015年12月31日

面向绿色交通的智能车辆变工况行驶能耗反馈与耗散控制方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于多存储介质的在线社交网络数据节能存储研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向智能电网多元储能系统的信息综合利用及自学习研究

国家自然科学基金

1+阅读 · 2015年12月31日

智能电网环境下地理分布式互联网数据中心的能量成本降低方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于多源遥感数据和GIS的城市太阳能资源时空分布调查与利用评价

国家自然科学基金

0+阅读 · 2014年12月31日

能源效率测度和资源优化配置的非参数前沿面建模方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于人眼关注度与情感分析的电子商务智能推荐计算

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据的环境绩效评价理论、方法及其应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

How Inference Compute Shapes Frontier LLM Evaluation

Arxiv

0+阅读 · 6月16日

Short Chains, Deep Thoughts: Balancing Reasoning Efficiency and Intra-Segment Capability via Split-Merge Optimization

Arxiv

0+阅读 · 6月10日

Agentomics: Economic Foundations for the Valuation, Attribution, and Pricing of AI Agents in Human-AI Workflows

Arxiv

0+阅读 · 6月9日

Powering the Future of AI: Navigating the Trade-offs for Europe's Energy Transition and Net-Zero Goals

Arxiv

0+阅读 · 6月8日

Long Live the Librarian! A Persistent Search Sub-Agent for Energy-Efficient Multi-Agent Software Engineering Systems

Arxiv

0+阅读 · 5月27日

Greening AI Inference with Accuracy and Latency-aware User Incentives

Arxiv

0+阅读 · 5月26日

Energy per Successful Goal: Goal-Level Energy Accounting for Agentic AI Systems

Arxiv

0+阅读 · 5月20日

Carbon-Aware Compute--Power Scheduling for AI Data Centers with Microgrid Prosumer Operations

Arxiv

0+阅读 · 5月12日

Toward an Engineering of Science: Rebalancing Generation and Verification in the Age of AI

Arxiv

0+阅读 · 5月11日

Green AI Carbon Optimizer: Carbon-Efficient Training Location Recommendation and Global AI Energy Demand Forecasting

Arxiv

0+阅读 · 4月6日

VIP会员

文章信息

相关主题

人工智能推理

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

3+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

4+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

9+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

8+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

4+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

7+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

6+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

9+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

4+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

6+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

7+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

6+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

5+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

相关VIP内容

《人工智能增强监视分析：利用跨网络、陆地、空中及海上领域的威胁向量实时建模》

《人工智能增强监视分析：利用跨网络、陆地、空中及海上领域的威胁向量实时建模》

专知会员服务

29+阅读 · 2025年12月11日

军事人工智能的能源挑战

军事人工智能的能源挑战

专知会员服务

18+阅读 · 2025年11月23日

电力人工智能技术研究框架、应用现状及展望

电力人工智能技术研究框架、应用现状及展望

专知会员服务

17+阅读 · 2025年5月15日

美能源部发布《面向科学、能源和安全的人工智能》报告

美能源部发布《面向科学、能源和安全的人工智能》报告

专知会员服务

44+阅读 · 2023年6月18日

AI应用端行业研究报告：赋能千行百业，AI+矿山、AI+电力助力能源改革，37页pdf

AI应用端行业研究报告：赋能千行百业，AI+矿山、AI+电力助力能源改革，37页pdf

专知会员服务

97+阅读 · 2023年4月15日

电力人工智能发展报告

电力人工智能发展报告

专知会员服务

85+阅读 · 2022年4月11日

《利用人工智能加速能源转型》报告

《利用人工智能加速能源转型》报告

专知会员服务

85+阅读 · 2022年2月23日

《人工智能发展报告2020》,清华人工智能研究院等，235页pdf

专知会员服务

218+阅读 · 2021年1月21日

集大成者！经典书《知识表示学习》，1035页pdf系统性讲解人工智能知识表示与推理基础、算法与应用

集大成者！经典书《知识表示学习》，1035页pdf系统性讲解人工智能知识表示与推理基础、算法与应用

专知会员服务

155+阅读 · 2020年11月20日

【CCF优秀博士学位论文奖-2019提名】面向绿色跨域数据中心的能效管理研究，华中科技大学周知

【CCF优秀博士学位论文奖-2019提名】面向绿色跨域数据中心的能效管理研究，华中科技大学周知

专知会员服务

14+阅读 · 2019年11月8日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

推荐！《用于兵棋推演和建模的人工智能》兰德、耶鲁大学2022最新16页论文

推荐！《用于兵棋推演和建模的人工智能》兰德、耶鲁大学2022最新16页论文

专知

53+阅读 · 2022年11月14日

推荐！【中美俄AI军用方向】中文版《为国家安全和国防开发人工智能》，美军重大AI应用案例及未来发展布局

推荐！【中美俄AI军用方向】中文版《为国家安全和国防开发人工智能》，美军重大AI应用案例及未来发展布局

专知

74+阅读 · 2022年6月30日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

92+阅读 · 2022年4月17日

清华大学、中国人工智能学会联合发布《2019人工智能发展报告》，391页pdf详述进展

清华大学、中国人工智能学会联合发布《2019人工智能发展报告》，391页pdf详述进展

专知

24+阅读 · 2019年12月1日

人工智能应用实践与趋势

人工智能应用实践与趋势

人工智能学家

13+阅读 · 2019年9月20日

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

专知

23+阅读 · 2019年9月6日

【人工智能】智能计算概述、神经网络计算、机器学习计算、遗传算法、模糊计算、群智能计算

【人工智能】智能计算概述、神经网络计算、机器学习计算、遗传算法、模糊计算、群智能计算

产业智能官

15+阅读 · 2019年1月8日

推荐几个权威且免费的人工智能学习资源

推荐几个权威且免费的人工智能学习资源

深度学习世界

10+阅读 · 2018年5月2日

AI 经典书单 | 人工智能学习该读哪些书

AI 经典书单 | 人工智能学习该读哪些书

七月在线实验室

35+阅读 · 2018年1月16日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

相关论文

How Inference Compute Shapes Frontier LLM Evaluation

Arxiv

0+阅读 · 6月16日

Short Chains, Deep Thoughts: Balancing Reasoning Efficiency and Intra-Segment Capability via Split-Merge Optimization

Arxiv

0+阅读 · 6月10日

Agentomics: Economic Foundations for the Valuation, Attribution, and Pricing of AI Agents in Human-AI Workflows

Arxiv

0+阅读 · 6月9日

Powering the Future of AI: Navigating the Trade-offs for Europe's Energy Transition and Net-Zero Goals

Arxiv

0+阅读 · 6月8日

Long Live the Librarian! A Persistent Search Sub-Agent for Energy-Efficient Multi-Agent Software Engineering Systems

Arxiv

0+阅读 · 5月27日

Greening AI Inference with Accuracy and Latency-aware User Incentives

Arxiv

0+阅读 · 5月26日

Energy per Successful Goal: Goal-Level Energy Accounting for Agentic AI Systems

Arxiv

0+阅读 · 5月20日

Carbon-Aware Compute--Power Scheduling for AI Data Centers with Microgrid Prosumer Operations

Arxiv

0+阅读 · 5月12日

Toward an Engineering of Science: Rebalancing Generation and Verification in the Age of AI

Arxiv

0+阅读 · 5月11日

Green AI Carbon Optimizer: Carbon-Efficient Training Location Recommendation and Global AI Energy Demand Forecasting

Arxiv

0+阅读 · 4月6日

相关基金

推荐系统的信息核挖掘及其应用研究

国家自然科学基金

8+阅读 · 2015年12月31日

面向绿色交通的智能车辆变工况行驶能耗反馈与耗散控制方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于多存储介质的在线社交网络数据节能存储研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向智能电网多元储能系统的信息综合利用及自学习研究

国家自然科学基金

1+阅读 · 2015年12月31日

智能电网环境下地理分布式互联网数据中心的能量成本降低方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于多源遥感数据和GIS的城市太阳能资源时空分布调查与利用评价

国家自然科学基金

0+阅读 · 2014年12月31日

能源效率测度和资源优化配置的非参数前沿面建模方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于人眼关注度与情感分析的电子商务智能推荐计算

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据的环境绩效评价理论、方法及其应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员