Green or Fast? Learning to Balance Cold Starts and Idle Carbon in Serverless Computing - 专知论文

会员服务 ·

0

冷启动 · 服务器 · 华为 · 时变 · 负载 ·

Green or Fast? Learning to Balance Cold Starts and Idle Carbon in Serverless Computing

翻译：绿色还是快速？学习平衡无服务器计算中的冷启动与闲置碳排放

Bowen Sun,Christos D. Antonopoulos,Evgenia Smirni,Bin Ren,Nikolaos Bellas,Spyros Lalis

Serverless computing simplifies cloud deployment but introduces new challenges in managing service latency and carbon emissions. Reducing cold-start latency requires retaining warm function instances, while minimizing carbon emissions favors reclaiming idle resources. This balance is further complicated by time-varying grid carbon intensity and varying workload patterns, under which static keep-alive policies are inefficient. We present LACE-RL, a latency-aware and carbon-efficient management framework that formulates serverless pod retention as a sequential decision problem. LACE-RL uses deep reinforcement learning to dynamically tune keep-alive durations, jointly modeling cold-start probability, function-specific latency costs, and real-time carbon intensity. Using the Huawei Public Cloud Trace, we show that LACE-RL reduces cold starts by 51.69% and idle keep-alive carbon emissions by 77.08% compared to Huawei's static policy, while achieving better latency-carbon trade-offs than state-of-the-art heuristic and single-objective baselines, approaching Oracle performance.

翻译：无服务器计算简化了云部署，但在管理服务延迟和碳排放方面引入了新的挑战。减少冷启动延迟需要保留预热函数实例，而最小化碳排放则倾向于回收闲置资源。时变的电网碳强度与多变的工作负载模式进一步复杂化了这种平衡，静态保活策略在此场景下效率低下。本文提出LACE-RL——一个延迟感知且碳高效的管理框架，将无服务器容器保留问题建模为序贯决策问题。LACE-RL采用深度强化学习动态调整保活时长，联合建模冷启动概率、函数特定延迟成本与实时碳强度。基于华为公共云追踪数据的实验表明：相较于华为静态策略，LACE-RL减少51.69%的冷启动和77.08%的闲置保活碳排放，同时比现有启发式和单目标基线方法实现了更优的延迟-碳排放权衡，其性能接近Oracle基准。

0

相关内容

冷启动

冷启动关注的是产品早期获取早期核心用户，以及如何运营的问题。

《中国绿色算力发展研究报告（2024年）》，81页pdf

《中国绿色算力发展研究报告（2024年）》，81页pdf

专知会员服务

32+阅读 · 2024年7月14日

【AI+军事】附论文+PPT《气候、成本和行动效率：减少挪威武装部队的温室气体排放》，挪威国防研究机构

【AI+军事】附论文+PPT《气候、成本和行动效率：减少挪威武装部队的温室气体排放》，挪威国防研究机构

专知会员服务

19+阅读 · 2022年4月15日

【TOIS2022】TOIS：基于元学习的冷启动序列推荐，Learning to Learn a Cold-start Sequential Recommender

【TOIS2022】TOIS：基于元学习的冷启动序列推荐，Learning to Learn a Cold-start Sequential Recommender

专知会员服务

10+阅读 · 2022年3月29日

《数智碳中和》白皮书发布 | 以数智技术助力关键相关方实现碳达峰碳中和，46页pdf

《数智碳中和》白皮书发布 | 以数智技术助力关键相关方实现碳达峰碳中和，46页pdf

专知会员服务

80+阅读 · 2022年3月14日

IDC百度发布首份《人工智能助力中国“双碳”目标达成2021》白皮书（附下载），47页pdf

IDC百度发布首份《人工智能助力中国“双碳”目标达成2021》白皮书（附下载），47页pdf

专知会员服务

98+阅读 · 2022年2月25日

2022最新发表《绿色碳科学：双碳目标下的科学基础 ——第 292 期“双清论坛”学术综述》

2022最新发表《绿色碳科学：双碳目标下的科学基础 ——第 292 期“双清论坛”学术综述》

专知会员服务

18+阅读 · 2022年2月12日

要绿色AI而非红色深度大能耗模型？字节&UCSB李磊等发布《绿色深度学习》61页pdf阐述碳中和时代下深度学习发展之路

要绿色AI而非红色深度大能耗模型？字节&UCSB李磊等发布《绿色深度学习》61页pdf阐述碳中和时代下深度学习发展之路

专知会员服务

37+阅读 · 2021年11月11日

【AAAI2021】元学习器的冷启动序列推荐

【AAAI2021】元学习器的冷启动序列推荐

专知会员服务

41+阅读 · 2020年12月19日

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

专知会员服务

27+阅读 · 2020年3月24日

【CCF优秀博士学位论文奖-2019提名】面向绿色跨域数据中心的能效管理研究，华中科技大学周知

【CCF优秀博士学位论文奖-2019提名】面向绿色跨域数据中心的能效管理研究，华中科技大学周知

专知会员服务

14+阅读 · 2019年11月8日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

14+阅读 · 2022年10月15日

面向冷启动推荐的异构信息网络元学习 | 作者带你读论文（KDD2020）

面向冷启动推荐的异构信息网络元学习 | 作者带你读论文（KDD2020）

学术头条

12+阅读 · 2020年8月9日

浅谈主动学习（Active Learning）

浅谈主动学习（Active Learning）

凡人机器学习

32+阅读 · 2020年6月18日

小样本也能增量学习？CVPR 2020 Oral最新干货：小样本类增量学习

小样本也能增量学习？CVPR 2020 Oral最新干货：小样本类增量学习

CVer

54+阅读 · 2020年5月1日

【Uber AI新论文】持续元学习，Learning to Continually Learn

【Uber AI新论文】持续元学习，Learning to Continually Learn

专知

19+阅读 · 2020年2月27日

荐文 | 时序预测中的深度学习：以电力负载预测为例

荐文 | 时序预测中的深度学习：以电力负载预测为例

德先生

32+阅读 · 2019年9月18日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

深度 | 推荐系统如何冷启动？

深度 | 推荐系统如何冷启动？

AI100

17+阅读 · 2019年4月7日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

云计算平台中大规模交互式服务长尾延迟消减关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

异构云小区网络中基于时延保证的资源配置新方法

国家自然科学基金

0+阅读 · 2015年12月31日

云存储系统中节能关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向绿色数据中心的高效能分布式储能技术

国家自然科学基金

1+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于可再生能源的互联网节能路由研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于动态匹配的高能量利用率多层堆叠结构静态随机存储器（SRAM）关键技术

国家自然科学基金

0+阅读 · 2015年12月31日

碳交易、互惠偏好与供应链减排博弈研究

国家自然科学基金

1+阅读 · 2015年12月31日

电动汽车与可再生能源的时空耦合特性及能量调度和容量配置的协同进化方法

国家自然科学基金

1+阅读 · 2014年12月31日

云架构接入网中面向多业务的计算与无线资源分配研究

国家自然科学基金

2+阅读 · 2014年12月31日

Cache Your Prompt When It's Green: Carbon-Aware Caching for Large Language Model Serving

Arxiv

0+阅读 · 4月11日

Joint$λ$: Orchestrating Serverless Workflows on Jointcloud FaaS Systems

Arxiv

0+阅读 · 4月4日

Intelligent Cloud Orchestration: A Hybrid Predictive and Heuristic Framework for Cost Optimization

Arxiv

0+阅读 · 4月2日

CarbonEdge: Carbon-Aware Deep Learning Inference Framework for Sustainable Edge Computing

Arxiv

0+阅读 · 4月1日

Quantifying the Performance Gap for Simple Versus Optimal Dynamic Server Allocation Policies

Arxiv

0+阅读 · 3月22日

Aceso: Carbon-Aware and Cost-Effective Microservice Placement for Small and Medium-sized Enterprises

Arxiv

0+阅读 · 3月11日

Carbon-Aware Quality Adaptation for Energy-Intensive Services

Arxiv

0+阅读 · 3月4日

Serverless Abstractions for Short-Running, Lightweight Streams

Arxiv

0+阅读 · 3月3日

Carbon-aware decentralized dynamic task offloading in MIMO-MEC networks via multi-agent reinforcement learning

Arxiv

0+阅读 · 2月21日

Green by Design: Constraint-Based Adaptive Deployment in the Cloud Continuum

Arxiv

0+阅读 · 2月20日

VIP会员

文章信息

相关主题

最新内容

深入Project Maven：为何人工智能在战场上依然失灵

深入Project Maven：为何人工智能在战场上依然失灵

专知会员服务

12+阅读 · 7月19日

锻造未来士兵：外骨骼、基因工程与赛博格

锻造未来士兵：外骨骼、基因工程与赛博格

专知会员服务

7+阅读 · 7月19日

《无人机系统（UAS）通信网状网络试验性部署》50页报告

《无人机系统（UAS）通信网状网络试验性部署》50页报告

专知会员服务

6+阅读 · 7月19日

《无人机蜂群通信技术研究》50页

《无人机蜂群通信技术研究》50页

专知会员服务

7+阅读 · 7月19日

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

专知会员服务

10+阅读 · 7月18日

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

专知会员服务

8+阅读 · 7月18日

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

专知会员服务

13+阅读 · 7月18日

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

专知会员服务

9+阅读 · 7月18日

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

专知会员服务

10+阅读 · 7月17日

《边缘端实时无线感知赋能现场多机器人部署》200页

《边缘端实时无线感知赋能现场多机器人部署》200页

专知会员服务

10+阅读 · 7月17日

战力倍增器：自主武器系统与乌克兰及加沙冲突

战力倍增器：自主武器系统与乌克兰及加沙冲突

专知会员服务

6+阅读 · 7月17日

人工智能赋能战场情报：提速决策进程

人工智能赋能战场情报：提速决策进程

专知会员服务

6+阅读 · 7月17日

《拥抱新兴技术：面向未来军官的教育革新》

《拥抱新兴技术：面向未来军官的教育革新》

专知会员服务

8+阅读 · 7月17日

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

专知会员服务

6+阅读 · 7月17日

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

专知会员服务

7+阅读 · 7月17日

相关VIP内容

《中国绿色算力发展研究报告（2024年）》，81页pdf

《中国绿色算力发展研究报告（2024年）》，81页pdf

专知会员服务

32+阅读 · 2024年7月14日

【AI+军事】附论文+PPT《气候、成本和行动效率：减少挪威武装部队的温室气体排放》，挪威国防研究机构

【AI+军事】附论文+PPT《气候、成本和行动效率：减少挪威武装部队的温室气体排放》，挪威国防研究机构

专知会员服务

19+阅读 · 2022年4月15日

【TOIS2022】TOIS：基于元学习的冷启动序列推荐，Learning to Learn a Cold-start Sequential Recommender

【TOIS2022】TOIS：基于元学习的冷启动序列推荐，Learning to Learn a Cold-start Sequential Recommender

专知会员服务

10+阅读 · 2022年3月29日

《数智碳中和》白皮书发布 | 以数智技术助力关键相关方实现碳达峰碳中和，46页pdf

《数智碳中和》白皮书发布 | 以数智技术助力关键相关方实现碳达峰碳中和，46页pdf

专知会员服务

80+阅读 · 2022年3月14日

IDC百度发布首份《人工智能助力中国“双碳”目标达成2021》白皮书（附下载），47页pdf

IDC百度发布首份《人工智能助力中国“双碳”目标达成2021》白皮书（附下载），47页pdf

专知会员服务

98+阅读 · 2022年2月25日

2022最新发表《绿色碳科学：双碳目标下的科学基础 ——第 292 期“双清论坛”学术综述》

2022最新发表《绿色碳科学：双碳目标下的科学基础 ——第 292 期“双清论坛”学术综述》

专知会员服务

18+阅读 · 2022年2月12日

要绿色AI而非红色深度大能耗模型？字节&UCSB李磊等发布《绿色深度学习》61页pdf阐述碳中和时代下深度学习发展之路

要绿色AI而非红色深度大能耗模型？字节&UCSB李磊等发布《绿色深度学习》61页pdf阐述碳中和时代下深度学习发展之路

专知会员服务

37+阅读 · 2021年11月11日

【AAAI2021】元学习器的冷启动序列推荐

【AAAI2021】元学习器的冷启动序列推荐

专知会员服务

41+阅读 · 2020年12月19日

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

专知会员服务

27+阅读 · 2020年3月24日

【CCF优秀博士学位论文奖-2019提名】面向绿色跨域数据中心的能效管理研究，华中科技大学周知

【CCF优秀博士学位论文奖-2019提名】面向绿色跨域数据中心的能效管理研究，华中科技大学周知

专知会员服务

14+阅读 · 2019年11月8日

热门VIP内容

开通专知VIP会员享更多权益服务

锻造未来士兵：外骨骼、基因工程与赛博格

《无人机蜂群通信技术研究》50页

深入Project Maven：为何人工智能在战场上依然失灵

《无人机系统（UAS）通信网状网络试验性部署》50页报告

相关资讯

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

14+阅读 · 2022年10月15日

面向冷启动推荐的异构信息网络元学习 | 作者带你读论文（KDD2020）

面向冷启动推荐的异构信息网络元学习 | 作者带你读论文（KDD2020）

学术头条

12+阅读 · 2020年8月9日

浅谈主动学习（Active Learning）

浅谈主动学习（Active Learning）

凡人机器学习

32+阅读 · 2020年6月18日

小样本也能增量学习？CVPR 2020 Oral最新干货：小样本类增量学习

小样本也能增量学习？CVPR 2020 Oral最新干货：小样本类增量学习

CVer

54+阅读 · 2020年5月1日

【Uber AI新论文】持续元学习，Learning to Continually Learn

【Uber AI新论文】持续元学习，Learning to Continually Learn

专知

19+阅读 · 2020年2月27日

荐文 | 时序预测中的深度学习：以电力负载预测为例

荐文 | 时序预测中的深度学习：以电力负载预测为例

德先生

32+阅读 · 2019年9月18日

你的算法可靠吗？神经网络不确定性度量

你的算法可靠吗？神经网络不确定性度量

专知

40+阅读 · 2019年4月27日

深度 | 推荐系统如何冷启动？

深度 | 推荐系统如何冷启动？

AI100

17+阅读 · 2019年4月7日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

相关论文

Cache Your Prompt When It's Green: Carbon-Aware Caching for Large Language Model Serving

Arxiv

0+阅读 · 4月11日

Joint$λ$: Orchestrating Serverless Workflows on Jointcloud FaaS Systems

Arxiv

0+阅读 · 4月4日

Intelligent Cloud Orchestration: A Hybrid Predictive and Heuristic Framework for Cost Optimization

Arxiv

0+阅读 · 4月2日

CarbonEdge: Carbon-Aware Deep Learning Inference Framework for Sustainable Edge Computing

Arxiv

0+阅读 · 4月1日

Quantifying the Performance Gap for Simple Versus Optimal Dynamic Server Allocation Policies

Arxiv

0+阅读 · 3月22日

Aceso: Carbon-Aware and Cost-Effective Microservice Placement for Small and Medium-sized Enterprises

Arxiv

0+阅读 · 3月11日

Carbon-Aware Quality Adaptation for Energy-Intensive Services

Arxiv

0+阅读 · 3月4日

Serverless Abstractions for Short-Running, Lightweight Streams

Arxiv

0+阅读 · 3月3日

Carbon-aware decentralized dynamic task offloading in MIMO-MEC networks via multi-agent reinforcement learning

Arxiv

0+阅读 · 2月21日

Green by Design: Constraint-Based Adaptive Deployment in the Cloud Continuum

Arxiv

0+阅读 · 2月20日

相关基金

云计算平台中大规模交互式服务长尾延迟消减关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

异构云小区网络中基于时延保证的资源配置新方法

国家自然科学基金

0+阅读 · 2015年12月31日

云存储系统中节能关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向绿色数据中心的高效能分布式储能技术

国家自然科学基金

1+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于可再生能源的互联网节能路由研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于动态匹配的高能量利用率多层堆叠结构静态随机存储器（SRAM）关键技术

国家自然科学基金

0+阅读 · 2015年12月31日

碳交易、互惠偏好与供应链减排博弈研究

国家自然科学基金

1+阅读 · 2015年12月31日

电动汽车与可再生能源的时空耦合特性及能量调度和容量配置的协同进化方法

国家自然科学基金

1+阅读 · 2014年12月31日

云架构接入网中面向多业务的计算与无线资源分配研究

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员