As AI inference scales to billions of queries, estimates of per-query energy use are increasingly important for capacity planning, efficiency interventions, and policy. Yet many public estimates assume non-production settings, leading to systematic overestimation. We introduce a bottom-up framework estimating inference energy from token throughput, node power, and overhead under large-scale deployment assumptions. For frontier-scale models (>200B parameters) on H100 nodes, we estimate a median energy of 0.31 Wh/query (IQR 0.16-0.60), indicating widely cited estimates are overstated by 4-20x. In test-time scaling scenarios 15x longer than typical queries, the median energy rises 13x to 3.91 Wh (IQR 2.15-7.05). Across models, serving systems, and hardware, we estimate 8-20x line-of-sight energy reductions. At datacenter scale, serving 1 billion queries/day requires 0.7 GWh; if 10% are long queries, demand rises to 1.7 GWh/day. With efficiency interventions, it falls to 0.8 GWh/day, mitigating the energy impact of test-time scaling.


翻译:随着人工智能推理扩展至数十亿次查询,每次查询的能源消耗估算对于容量规划、效率干预和政策制定日益重要。然而,许多公开估算假设非生产环境,导致系统性高估。我们提出一个自下而上的框架,基于大规模部署假设,通过令牌吞吐量、节点功耗和开销来估算推理能耗。对于H100节点上的前沿模型(参数超过2000亿),我们估算每次查询的中位能耗为0.31瓦时(四分位距0.16-0.60),表明广泛引用的估算被高估了4-20倍。在测试时间扩展场景中,当查询时间比典型查询长15倍时,中位能耗上升13倍至3.91瓦时(四分位距2.15-7.05)。跨越不同模型、服务系统和硬件,我们估算出8-20倍的直接能耗缩减空间。在数据中心规模下,每天服务10亿次查询需要0.7吉瓦时;如果其中10%为长查询,则需求升至每天1.7吉瓦时。通过效率干预,这一数值可降至每天0.8吉瓦时,从而缓解测试时间扩展带来的能源影响。

0
下载
关闭预览

相关内容

军事人工智能的能源挑战
专知会员服务
18+阅读 · 2025年11月23日
电力人工智能技术研究框架、应用现状及展望
专知会员服务
17+阅读 · 2025年5月15日
美能源部发布《面向科学、能源和安全的人工智能》报告
电力人工智能发展报告
专知会员服务
85+阅读 · 2022年4月11日
《利用人工智能加速能源转型》报告
专知会员服务
85+阅读 · 2022年2月23日
人工智能应用实践与趋势
人工智能学家
13+阅读 · 2019年9月20日
推荐几个权威且免费的人工智能学习资源
深度学习世界
10+阅读 · 2018年5月2日
AI 经典书单 | 人工智能学习该读哪些书
七月在线实验室
35+阅读 · 2018年1月16日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
6+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
4+阅读 · 6月17日
相关基金
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员