AI power demand is growing at an unprecedented rate while power grids are often ailing and struggle to keep up. Grid expansion comes with high capital expenditure and long-distance transmission losses, yet there is abundant renewable energy at the source, just not matched to demand. This paper proposes a complementary AI infrastructure deployment model, AI Greenferencing, that brings modular AI compute to renewable energy sources, focusing on wind, allowing AI footprint expansion, generating local behind-the-meter demand for renewable sites, and helping ease the growing strain on power utilities. Our feasibility analysis shows that 890+ GW of wind capacity lies within 50 ms network round trip time of Azure data centers, and that site-wise right-sizing combined with spatial complementarity of wind energy keeps aggregate fleet utilization on par with traditional deployments. To serve inference requests under variable wind power, we build XWind, a lightweight, reactive, and workload-agnostic AI inference router that uses only real-time signals: inference latency, KV-cache utilization, and queue depth, to dynamically configure sites and distribute requests. Evaluated on a real 64-GPU A100 testbed emulating three wind-powered sites with Azure production traces, XWind reduces P99 end-to-end latency by up to 52% over the strongest contender (also our idea) and by up to 98% over baselines such as power-capping and GPU idling, with consistent gains across workload types, load levels, and GPU generations.


翻译:人工智能的电力需求正以空前的速度增长,而电网往往不堪重负,难以跟上步伐。电网扩容伴随着高额资本支出和远距离传输损耗,然而在源头却有充足的可再生能源,只是与需求不匹配。本文提出了一种互补性AI基础设施部署模式——AI绿电协同(AI Greenferencing),将模块化AI计算部署至可再生能源源头,重点关注风能,实现AI算力足迹扩展,为可再生能源场站创造本地表计侧需求,并有助于缓解电力公用事业日益增长的负担。我们的可行性分析表明,在Azure数据中心的50毫秒网络往返时间内,可触及超过890吉瓦的风电容量;同时,站点级容量优化结合风能的时空互补性,可使机群总体利用率与传统部署模式相当。为了在波动的风电功率下处理推理请求,我们构建了XWind——一种轻量级、响应式且与负载无关的AI推理路由器,仅使用实时信号(推理延迟、KV缓存利用率和队列深度)来动态配置站点和分发请求。在模拟三个风电驱动站点、采用Azure生产日志的真实64 GPU A100测试平台上评估,XWind将P99端到端延迟较最强竞争者(也为我们提出的构想)最多降低52%,较功率上限与GPU空闲占用等基线方法最多降低98%,且在不同工作负载类型、负载水平和GPU代际上均有一致性的性能提升。

0
下载
关闭预览

相关内容

人工智能杂志AI(Artificial Intelligence)是目前公认的发表该领域最新研究成果的主要国际论坛。该期刊欢迎有关AI广泛方面的论文,这些论文构成了整个领域的进步,也欢迎介绍人工智能应用的论文,但重点应该放在新的和新颖的人工智能方法如何提高应用领域的性能,而不是介绍传统人工智能方法的另一个应用。关于应用的论文应该描述一个原则性的解决方案,强调其新颖性,并对正在开发的人工智能技术进行深入的评估。 官网地址:http://dblp.uni-trier.de/db/journals/ai/
电力人工智能技术研究框架、应用现状及展望
专知会员服务
17+阅读 · 2025年5月15日
《面向边缘AI应用的高性能高能效架构探索》156页
专知会员服务
37+阅读 · 2025年4月12日
可解释人工智能(XAI):从内在可解释性到大语言模型
专知会员服务
34+阅读 · 2025年1月20日
基于人工智能赋能的新型电力系统关键技术综述
专知会员服务
40+阅读 · 2024年6月24日
【AI+电力】大模型在电力系统中的应用
专知会员服务
105+阅读 · 2023年6月20日
数字电网最新报告:数字赋能,电网添翼,33页ppt
专知会员服务
37+阅读 · 2022年12月15日
电力人工智能发展报告
专知会员服务
85+阅读 · 2022年4月11日
电力人工智能发展报告,33页ppt
专知会员服务
135+阅读 · 2019年12月25日
基于车路协同的群体智能协同
智能交通技术
10+阅读 · 2019年1月23日
【知识图谱】大规模知识图谱的构建、推理及应用
产业智能官
38+阅读 · 2017年9月12日
大规模知识图谱的构建、推理及应用
人工智能头条
15+阅读 · 2017年8月29日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
VIP会员
最新内容
ICML 2026 | CFPO:用反事实策略优化提升多模态推理
专知会员服务
1+阅读 · 今天14:45
综述 | 世界动作模型:少做梦,多行动
专知会员服务
2+阅读 · 今天14:43
美以伊冲突:无人机与人工智能的运用
专知会员服务
4+阅读 · 今天14:31
《特种部队在透明战场中的生存力》最新报告
专知会员服务
3+阅读 · 今天14:11
《人工智能生成的零日漏洞:对未来作战的影响》
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关VIP内容
电力人工智能技术研究框架、应用现状及展望
专知会员服务
17+阅读 · 2025年5月15日
《面向边缘AI应用的高性能高能效架构探索》156页
专知会员服务
37+阅读 · 2025年4月12日
可解释人工智能(XAI):从内在可解释性到大语言模型
专知会员服务
34+阅读 · 2025年1月20日
基于人工智能赋能的新型电力系统关键技术综述
专知会员服务
40+阅读 · 2024年6月24日
【AI+电力】大模型在电力系统中的应用
专知会员服务
105+阅读 · 2023年6月20日
数字电网最新报告:数字赋能,电网添翼,33页ppt
专知会员服务
37+阅读 · 2022年12月15日
电力人工智能发展报告
专知会员服务
85+阅读 · 2022年4月11日
电力人工智能发展报告,33页ppt
专知会员服务
135+阅读 · 2019年12月25日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员