AI inference is becoming a persistent and geographically distributed source of electricity demand. Unlike many traditional electrical loads, inference workloads can sometimes be executed away from the user-facing service location, provided that latency, state locality, capacity, and regulatory constraints remain acceptable. This paper studies when such digital relocation of computation can be interpreted as latency-constrained relocation of electricity demand. We develop an energy-geography framework for geo-distributed AI inference. The framework models a three-layer architecture of clients, service nodes, and compute nodes, and formulates inference placement as a constrained optimization problem over electricity prices, marginal carbon intensity, power usage effectiveness, compute capacity, network latency, and migration frictions. The key object is the energy-latency frontier: the marginal cost and carbon benefit unlocked by relaxing inference latency budgets. The paper makes four contributions. First, it distinguishes physical electricity transmission from digital relocation of electricity-consuming computation. Second, it formulates a geo-distributed inference placement model with feasibility masks and migration frictions. Third, it introduces operational metrics, including relocatable inference demand, energy return on latency, carbon return on latency, and a relocation break-even condition. Fourth, it provides a transparent stylized simulation over representative global compute regions to show how heterogeneous latency tolerance separates workloads into local, regional, and energy-oriented execution layers. The results show that latency relaxation expands feasible geography, while migration frictions, egress costs, state locality, legal constraints, and capacity limits can sharply reduce realized benefits.


翻译:AI推理正成为一种持续性的、地理分布式的电力需求源。与许多传统电力负荷不同,推理工作负载有时可在远离用户服务位置的地方执行,前提是延迟、状态局部性、容量和监管约束仍可接受。本文研究了这种计算数字迁移何时可被解释为受延迟约束的电力需求迁移。我们为地理分布式AI推理构建了一个能源-地理框架。该框架建模了包含客户端、服务节点和计算节点的三层架构,并将推理部署表述为一个受电价、边际碳强度、电力使用效率、计算容量、网络延迟和迁移摩擦约束的优化问题。核心对象是能源-延迟边界:即通过放宽推理延迟预算所释放的边际成本与碳效益。本文做出四项贡献:第一,区分了物理电力传输与消耗电力的计算数字迁移;第二,提出了包含可行性掩码和迁移摩擦的地理分布式推理部署模型;第三,引入了可操作指标,包括可迁移推理需求、延迟的能源回报率、延迟的碳回报率以及迁移盈亏平衡条件;第四,提供了对代表性全球计算区域的透明简化仿真,以展示异构延迟容忍度如何将工作负载分离为本地、区域和面向能源的执行层。结果表明,延迟放宽扩大了可行地理范围,而迁移摩擦、出口成本、状态局部性、法律限制和容量上限可能急剧降低实际效益。

0
下载
关闭预览

相关内容

《人工智能使能系统可靠性框架》
专知会员服务
20+阅读 · 4月27日
电力人工智能技术研究框架、应用现状及展望
专知会员服务
17+阅读 · 2025年5月15日
《面向边缘AI应用的高性能高能效架构探索》156页
专知会员服务
37+阅读 · 2025年4月12日
电力人工智能发展报告
专知会员服务
85+阅读 · 2022年4月11日
「因果推理」概述论文,13页pdf
专知
16+阅读 · 2021年3月20日
【资源推荐】AI可解释性资源汇总
专知
47+阅读 · 2019年4月24日
迁移学习在深度学习中的应用
专知
24+阅读 · 2017年12月24日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
VIP会员
相关主题
最新内容
美国从乌克兰无人机战争中学习经验
专知会员服务
6+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
2+阅读 · 6月21日
学习数据的几何:形状空间分析数学综述
专知会员服务
10+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
12+阅读 · 6月17日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
7+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员