Taming Cold Starts: Proactive Serverless Scheduling with Model Predictive Control - 专知论文

会员服务 ·

0

冷启动 · 服务器 · 调度 · 模型预测 · 模型预测控制 ·

Taming Cold Starts: Proactive Serverless Scheduling with Model Predictive Control

翻译：驯服冷启动：基于模型预测控制的主动式无服务器调度

Chanh Nguyen,Monowar Bhuyan,Erik Elmroth

from arxiv, 8 pages, 8 figures, preprint accepted at MASCOTS 2025

Serverless computing has transformed cloud application deployment by introducing a fine-grained, event-driven execution model that abstracts away infrastructure management. Its on-demand nature makes it especially appealing for latency-sensitive and bursty workloads. However, the cold start problem, i.e., where the platform incurs significant delay when provisioning new containers, remains the Achilles' heel of such platforms. This paper presents a predictive serverless scheduling framework based on Model Predictive Control to proactively mitigate cold starts, thereby improving end-to-end response time. By forecasting future invocations, the controller jointly optimizes container prewarming and request dispatching, improving latency while minimizing resource overhead. We implement our approach on Apache OpenWhisk, deployed on a Kubernetes-based testbed. Experimental results using real-world function traces and synthetic workloads demonstrate that our method significantly outperforms state-of-the-art baselines, achieving up to 85% lower tail latency and a 34% reduction in resource usage.

翻译：无服务器计算通过引入细粒度、事件驱动的执行模型，将基础设施管理抽象化，从而改变了云应用程序的部署方式。其按需特性使其对延迟敏感和突发性工作负载尤其具有吸引力。然而，冷启动问题——即平台在配置新容器时产生显著延迟——仍然是此类平台的致命弱点。本文提出了一种基于模型预测控制的预测性无服务器调度框架，以主动缓解冷启动，从而改善端到端响应时间。通过预测未来的函数调用，控制器联合优化容器预热和请求调度，在降低延迟的同时最小化资源开销。我们在基于Kubernetes的测试平台上，于Apache OpenWhisk中实现了我们的方法。使用真实函数追踪和合成工作负载的实验结果表明，我们的方法显著优于最先进的基线方法，实现了高达85%的尾部延迟降低和34%的资源使用减少。

0

相关内容

冷启动

冷启动关注的是产品早期获取早期核心用户，以及如何运营的问题。

面向大语言模型（LLMs）时代的冷启动推荐：一项全面的综述与路线图

面向大语言模型（LLMs）时代的冷启动推荐：一项全面的综述与路线图

专知会员服务

33+阅读 · 2025年1月6日

《分析将零信任模式应用于运行技术系统的可行性和益处》2023最新83页论文

《分析将零信任模式应用于运行技术系统的可行性和益处》2023最新83页论文

专知会员服务

33+阅读 · 2023年12月1日

【伯克利博士论文】理解和探索无服务器云计算，233页pdf

【伯克利博士论文】理解和探索无服务器云计算，233页pdf

专知会员服务

22+阅读 · 2022年12月31日

【TOIS2022】TOIS：基于元学习的冷启动序列推荐，Learning to Learn a Cold-start Sequential Recommender

【TOIS2022】TOIS：基于元学习的冷启动序列推荐，Learning to Learn a Cold-start Sequential Recommender

专知会员服务

10+阅读 · 2022年3月29日

【IJCAI2021】CUC：云计算中基于不确定约束的预测作业调度算法

【IJCAI2021】CUC：云计算中基于不确定约束的预测作业调度算法

专知会员服务

15+阅读 · 2021年8月26日

【KDD2021】半个性化用户冷启动推荐系统

专知会员服务

26+阅读 · 2021年6月9日

【WWW2021】用于用户冷启动推荐的任务自适应神经过程

专知会员服务

20+阅读 · 2021年3月12日

【AAAI2021】元学习器的冷启动序列推荐

【AAAI2021】元学习器的冷启动序列推荐

专知会员服务

41+阅读 · 2020年12月19日

【WSDM2021】通过知识图谱上的伪标记缓解推荐中的冷启动问题

专知会员服务

23+阅读 · 2020年11月13日

【2020新书】无服务器安全性，352页pdf，了解、评估和实现AWS、Azure和谷歌云中的安全可靠的应用程序

【2020新书】无服务器安全性，352页pdf，了解、评估和实现AWS、Azure和谷歌云中的安全可靠的应用程序

专知会员服务

29+阅读 · 2020年10月8日

TKDE 2020 | 面向严格冷启动推荐的属性图神经网络

TKDE 2020 | 面向严格冷启动推荐的属性图神经网络

PaperWeekly

13+阅读 · 2020年12月18日

前端微服务在字节跳动的落地之路

前端微服务在字节跳动的落地之路

前端之巅

41+阅读 · 2019年9月19日

【Github项目】基于Keras的BERT实现，可直接载入官方预训练模型

【Github项目】基于Keras的BERT实现，可直接载入官方预训练模型

专知

20+阅读 · 2019年6月27日

【预测性维护】从观望到涉足，如何开发一个预测性维护系统？

【预测性维护】从观望到涉足，如何开发一个预测性维护系统？

产业智能官

20+阅读 · 2019年5月18日

基于小样本学习的意图识别冷启动

基于小样本学习的意图识别冷启动

黑龙江大学自然语言处理实验室

19+阅读 · 2019年5月15日

专访阿里亚顿：Serverless与BFF与前端

专访阿里亚顿：Serverless与BFF与前端

前端之巅

45+阅读 · 2019年5月8日

深度 | 推荐系统如何冷启动？

深度 | 推荐系统如何冷启动？

AI100

17+阅读 · 2019年4月7日

【中台】什么是中台？企业为什么要建中台？从数据中台到AI中台。

【中台】什么是中台？企业为什么要建中台？从数据中台到AI中台。

产业智能官

12+阅读 · 2019年1月29日

【智能制造】德勤：预测性维护和智能工厂

【智能制造】德勤：预测性维护和智能工厂

产业智能官

11+阅读 · 2018年11月27日

FCS 11(3) 文章 | SaaS 多租户-子租户架构的访问控制模型

FCS 11(3) 文章 | SaaS 多租户-子租户架构的访问控制模型

FCS

11+阅读 · 2017年7月28日

云计算平台中大规模交互式服务长尾延迟消减关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向估计性能优化的网络化控制系统传感器调度

国家自然科学基金

0+阅读 · 2015年12月31日

面向云计算数据隐私保护的访问控制策略模型与技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

数据中心网络中延时敏感的传输控制协议

国家自然科学基金

0+阅读 · 2015年12月31日

可信工业控制系统中信任冷启动方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

非确定型Web服务流程重组的可靠性验证技术

国家自然科学基金

1+阅读 · 2015年12月31日

数据中心延迟敏感型应用尾端响应时延服务质量保障方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向云数据中心应用感知的参与式资源调度技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于多准则场景缩减的“零停机”设备状态预测与维护方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

MoToRec: Sparse-Regularized Multimodal Tokenization for Cold-Start Recommendation

Arxiv

0+阅读 · 2月11日

Online Fine-Tuning of Pretrained Controllers for Autonomous Driving via Real-Time Recurrent RL

Arxiv

0+阅读 · 2月3日

User-Adaptive Meta-Learning for Cold-Start Medication Recommendation with Uncertainty Filtering

Arxiv

0+阅读 · 1月30日

Learning-Based Sensor Scheduling for Delay-Aware and Stable Remote State Estimation

Arxiv

0+阅读 · 1月29日

DynQ: A Dynamic Topology-Agnostic Quantum Virtual Machine via Quality-Weighted Community Detection

Arxiv

0+阅读 · 1月27日

LLM Reasoning for Cold-Start Item Recommendation

Arxiv

0+阅读 · 1月23日

Warm-Starting Collision-Free Model Predictive Control With Object-Centric Diffusion

Arxiv

0+阅读 · 1月21日

CascadeInfer: Low-Latency and Load-Balanced LLM Serving via Length-Aware Scheduling

Arxiv

0+阅读 · 1月14日

Bit of a Close Talker: A Practical Guide to Serverless Cloud Co-Location Attacks

Arxiv

0+阅读 · 1月13日

Coordinated Cooling and Compute Management for AI Datacenters

Arxiv

0+阅读 · 1月13日

VIP会员

文章信息

相关主题

模型预测控制

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

0+阅读 · 32分钟前

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

0+阅读 · 36分钟前

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

7+阅读 · 今天2:06

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

5+阅读 · 今天1:37

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

3+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

5+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

4+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

7+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

4+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

6+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

6+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

5+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

4+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

相关VIP内容

面向大语言模型（LLMs）时代的冷启动推荐：一项全面的综述与路线图

面向大语言模型（LLMs）时代的冷启动推荐：一项全面的综述与路线图

专知会员服务

33+阅读 · 2025年1月6日

《分析将零信任模式应用于运行技术系统的可行性和益处》2023最新83页论文

《分析将零信任模式应用于运行技术系统的可行性和益处》2023最新83页论文

专知会员服务

33+阅读 · 2023年12月1日

【伯克利博士论文】理解和探索无服务器云计算，233页pdf

【伯克利博士论文】理解和探索无服务器云计算，233页pdf

专知会员服务

22+阅读 · 2022年12月31日

【TOIS2022】TOIS：基于元学习的冷启动序列推荐，Learning to Learn a Cold-start Sequential Recommender

【TOIS2022】TOIS：基于元学习的冷启动序列推荐，Learning to Learn a Cold-start Sequential Recommender

专知会员服务

10+阅读 · 2022年3月29日

【IJCAI2021】CUC：云计算中基于不确定约束的预测作业调度算法

【IJCAI2021】CUC：云计算中基于不确定约束的预测作业调度算法

专知会员服务

15+阅读 · 2021年8月26日

【KDD2021】半个性化用户冷启动推荐系统

专知会员服务

26+阅读 · 2021年6月9日

【WWW2021】用于用户冷启动推荐的任务自适应神经过程

专知会员服务

20+阅读 · 2021年3月12日

【AAAI2021】元学习器的冷启动序列推荐

【AAAI2021】元学习器的冷启动序列推荐

专知会员服务

41+阅读 · 2020年12月19日

【WSDM2021】通过知识图谱上的伪标记缓解推荐中的冷启动问题

专知会员服务

23+阅读 · 2020年11月13日

【2020新书】无服务器安全性，352页pdf，了解、评估和实现AWS、Azure和谷歌云中的安全可靠的应用程序

【2020新书】无服务器安全性，352页pdf，了解、评估和实现AWS、Azure和谷歌云中的安全可靠的应用程序

专知会员服务

29+阅读 · 2020年10月8日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

TKDE 2020 | 面向严格冷启动推荐的属性图神经网络

TKDE 2020 | 面向严格冷启动推荐的属性图神经网络

PaperWeekly

13+阅读 · 2020年12月18日

前端微服务在字节跳动的落地之路

前端微服务在字节跳动的落地之路

前端之巅

41+阅读 · 2019年9月19日

【Github项目】基于Keras的BERT实现，可直接载入官方预训练模型

【Github项目】基于Keras的BERT实现，可直接载入官方预训练模型

专知

20+阅读 · 2019年6月27日

【预测性维护】从观望到涉足，如何开发一个预测性维护系统？

【预测性维护】从观望到涉足，如何开发一个预测性维护系统？

产业智能官

20+阅读 · 2019年5月18日

基于小样本学习的意图识别冷启动

基于小样本学习的意图识别冷启动

黑龙江大学自然语言处理实验室

19+阅读 · 2019年5月15日

专访阿里亚顿：Serverless与BFF与前端

专访阿里亚顿：Serverless与BFF与前端

前端之巅

45+阅读 · 2019年5月8日

深度 | 推荐系统如何冷启动？

深度 | 推荐系统如何冷启动？

AI100

17+阅读 · 2019年4月7日

【中台】什么是中台？企业为什么要建中台？从数据中台到AI中台。

【中台】什么是中台？企业为什么要建中台？从数据中台到AI中台。

产业智能官

12+阅读 · 2019年1月29日

【智能制造】德勤：预测性维护和智能工厂

【智能制造】德勤：预测性维护和智能工厂

产业智能官

11+阅读 · 2018年11月27日

FCS 11(3) 文章 | SaaS 多租户-子租户架构的访问控制模型

FCS 11(3) 文章 | SaaS 多租户-子租户架构的访问控制模型

FCS

11+阅读 · 2017年7月28日

相关论文

MoToRec: Sparse-Regularized Multimodal Tokenization for Cold-Start Recommendation

Arxiv

0+阅读 · 2月11日

Online Fine-Tuning of Pretrained Controllers for Autonomous Driving via Real-Time Recurrent RL

Arxiv

0+阅读 · 2月3日

User-Adaptive Meta-Learning for Cold-Start Medication Recommendation with Uncertainty Filtering

Arxiv

0+阅读 · 1月30日

Learning-Based Sensor Scheduling for Delay-Aware and Stable Remote State Estimation

Arxiv

0+阅读 · 1月29日

DynQ: A Dynamic Topology-Agnostic Quantum Virtual Machine via Quality-Weighted Community Detection

Arxiv

0+阅读 · 1月27日

LLM Reasoning for Cold-Start Item Recommendation

Arxiv

0+阅读 · 1月23日

Warm-Starting Collision-Free Model Predictive Control With Object-Centric Diffusion

Arxiv

0+阅读 · 1月21日

CascadeInfer: Low-Latency and Load-Balanced LLM Serving via Length-Aware Scheduling

Arxiv

0+阅读 · 1月14日

Bit of a Close Talker: A Practical Guide to Serverless Cloud Co-Location Attacks

Arxiv

0+阅读 · 1月13日

Coordinated Cooling and Compute Management for AI Datacenters

Arxiv

0+阅读 · 1月13日

相关基金

云计算平台中大规模交互式服务长尾延迟消减关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向估计性能优化的网络化控制系统传感器调度

国家自然科学基金

0+阅读 · 2015年12月31日

面向云计算数据隐私保护的访问控制策略模型与技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

数据中心网络中延时敏感的传输控制协议

国家自然科学基金

0+阅读 · 2015年12月31日

可信工业控制系统中信任冷启动方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

非确定型Web服务流程重组的可靠性验证技术

国家自然科学基金

1+阅读 · 2015年12月31日

数据中心延迟敏感型应用尾端响应时延服务质量保障方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向云数据中心应用感知的参与式资源调度技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于多准则场景缩减的“零停机”设备状态预测与维护方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

微信扫码咨询专知VIP会员