前沿人工智能模型可能在云端训练,但人工智能的未来将日益运行在云端和边缘——分布在数十亿台设备、本地网络和嵌入式系统中,在靠近使用地点处理智能。当前以大规模、集中式数据中心为特点的人工智能部署模式,在电力消耗、用水和运营成本方面带来了日益严峻的挑战,可能削弱该技术的变革潜力。在美国,数据中心目前已消耗全国电力容量的4%,按照当前趋势,到2030年可能达到20-25%。
在地缘政治背景下,随着美国和中国竞相在本国经济中推广和部署人工智能应用以刺激经济增长并开启下一代科技创新,计算能力的能源需求可能成为战略瓶颈的担忧与日俱增。政府和业界并未止步不前。在美国,白宫于7月发布了其“人工智能行动计划”,为政府设定了加速人工智能创新和简化人工智能基础设施建设进程的宏伟议程。中国也在8月公布了其“人工智能+”行动的细节,这是一项旨在将人工智能融入战略领域以提高生产力和增长的产业计划。与此同时,太平洋两岸的企业都在重新设计芯片,从通用处理器转向为推理阶段(即模型接触终端用户的阶段)优化的高度专用人工智能加速器。目标很明确:在扩展人工智能覆盖范围的同时,降低能耗和成本。
边缘计算——在更靠近数据产生的地方处理人工智能工作负载——为实现具有韧性、高能效的人工智能提供了一条途径。图形处理器效率和工作负载调度的进步已显著降低了云端环境推理的能源成本,而边缘计算为分布式应用提供了互补的收益。通过将专用的高能效硬件与优化的软件架构相结合,边缘人工智能可为同等工作负载降低高达60%的能耗,同时为延迟和安全敏感型应用提供更优的性能。这既得益于通常在电池供电设备上进行的更高效处理,也得益于避免了将数据从设备经网络传输到数据中心再返回所消耗的能量。
数据中心仍将是人工智能基础设施的基础组成部分,但边缘计算很可能是一个互补且必要的补充。数据中心将继续训练和运行最先进的前沿模型,而边缘部署将日益处理日常推理任务。这种混合方法将是规模化扩展人工智能,而不成比例地增加其资源需求的关键。
政府对于实现这一未来扮演着至关重要的角色。仅靠市场力量无法提供确保美国在高效人工智能领域保持领导地位所需的基础设施、研究和激励措施。产业创新必须与公共投资和明智的政策相匹配。这意味着扩大对高能效半导体研究的资助,建立奖励高效人工智能基础设施的联邦采购优先政策,并创建政府资助的测试平台,以在高价值的公共任务中验证边缘人工智能。这也意味着继续投资能源部、国家科学基金会等机构的研究与开发项目,以确保硬件、软件和模型创新同步推进。下一波人工智能浪潮将不是由最大的模型定义,而是由最智能、最高效的模型定义,应引领这一未来的实现。