Morphis: SLO-Aware Resource Scheduling for Microservices with Time-Varying Call Graphs - 专知论文

会员服务 ·

0

微服务 · 结构 · 时变 · 资源调度 · 调度 ·

Morphis: SLO-Aware Resource Scheduling for Microservices with Time-Varying Call Graphs

翻译：Morphis：面向时变调用图微服务的SLO感知资源调度

Yu Tang,Hailiang Zhao,Chuansheng Lu,Yifei Zhang,Kingsum Chow,Shuiguang Deng,Rui Shi

Modern microservice systems exhibit continuous structural evolution in their runtime call graphs due to workload fluctuations, fault responses, and deployment activities. Despite this complexity, our analysis of over 500,000 production traces from ByteDance reveals a latent regularity: execution paths concentrate around a small set of recurring invocation patterns. However, existing resource management approaches fail to exploit this structure. Industrial autoscalers like Kubernetes HPA ignore inter-service dependencies, while recent academic methods often assume static topologies, rendering them ineffective under dynamic execution contexts. In this work, we propose Morphis, a dependency-aware provisioning framework that unifies pattern-aware trace analysis with global optimization. It introduces structural fingerprinting that decomposes traces into a stable execution backbone and interpretable deviation subgraphs. Then, resource allocation is formulated as a constrained optimization problem over predicted pattern distributions, jointly minimizing aggregate CPU usage while satisfying end-to-end tail-latency SLOs. Our extensive evaluations on the TrainTicket benchmark demonstrate that Morphis reduces CPU consumption by 35-38% compared to state-of-the-art baselines while maintaining 98.8% SLO compliance.

翻译：现代微服务系统因其工作负载波动、故障响应及部署活动，其运行时调用图持续发生结构演化。尽管存在这种复杂性，我们对字节跳动超过50万条生产环境追踪的分析揭示了一种潜在规律：执行路径集中于少量重复出现的调用模式。然而，现有的资源管理方法未能利用此结构特征。工业级自动扩缩器（如Kubernetes HPA）忽略服务间依赖关系，而近期学术方法常假设静态拓扑，导致其在动态执行场景下失效。本研究提出Morphis——一个依赖感知的资源供给框架，将模式感知的追踪分析与全局优化相统一。该框架引入结构指纹技术，将追踪分解为稳定的执行主干与可解释的偏差子图。进而将资源分配建模为基于预测模式分布的约束优化问题，在满足端到端尾延迟SLO的同时，联合最小化聚合CPU使用率。我们在TrainTicket基准测试上的广泛评估表明，相较于前沿基线方法，Morphis在保持98.8% SLO达标率的同时，可降低35-38%的CPU消耗。

0

相关内容

微服务

【ICML2025】Proxy-FDA：基于代理的特征分布对齐方法，用于无遗忘地微调视觉基础模型

【ICML2025】Proxy-FDA：基于代理的特征分布对齐方法，用于无遗忘地微调视觉基础模型

专知会员服务

9+阅读 · 2025年6月3日

【斯坦福博士论文】时序平滑性假设下的深度神经网络自适应与正则化方法

【斯坦福博士论文】时序平滑性假设下的深度神经网络自适应与正则化方法

专知会员服务

15+阅读 · 2025年3月25日

国家标准《信息技术云计算参考架构》

国家标准《信息技术云计算参考架构》

专知会员服务

37+阅读 · 2024年5月24日

【WWW2024】HetGPT：在预训练的异质图神经网络中利用提示微调的力量

【WWW2024】HetGPT：在预训练的异质图神经网络中利用提示微调的力量

专知会员服务

22+阅读 · 2024年1月28日

算力调度：算力时代的国家电网

算力调度：算力时代的国家电网

专知会员服务

44+阅读 · 2023年11月7日

国防科大最新《时空图神经网络》综述，24页pdf详述其在城市计算预测学习应用进展

国防科大最新《时空图神经网络》综述，24页pdf详述其在城市计算预测学习应用进展

专知会员服务

72+阅读 · 2023年4月3日

第六届未来网络发展大会《确定性网络技术发展与产业应用白皮书》

第六届未来网络发展大会《确定性网络技术发展与产业应用白皮书》

专知会员服务

36+阅读 · 2022年9月21日

最新！《信息技术服务数字化转型第 2 部分：成熟度模型》国家标准征求意见稿

最新！《信息技术服务数字化转型第 2 部分：成熟度模型》国家标准征求意见稿

专知会员服务

38+阅读 · 2022年5月13日

【博士论文】基于轨迹分析的微服务故障定位

专知会员服务

31+阅读 · 2020年12月21日

【清华-百度】面向季节性时空数据的预测式循环网络及其在城市计算中的应用，计算机学报

【清华-百度】面向季节性时空数据的预测式循环网络及其在城市计算中的应用，计算机学报

专知会员服务

42+阅读 · 2020年3月10日

用户画像基础

用户画像基础

DataFunTalk

12+阅读 · 2020年8月1日

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

专知

20+阅读 · 2020年3月1日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

深度学习应用在图像匹配的效果如何？

深度学习应用在图像匹配的效果如何？

中国图象图形学报

10+阅读 · 2019年6月11日

【数字孪生】数字孪生是制造业实现“智能+”的技术接口

【数字孪生】数字孪生是制造业实现“智能+”的技术接口

产业智能官

35+阅读 · 2019年4月30日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

【知识图谱】基于知识图谱的用户画像技术

【知识图谱】基于知识图谱的用户画像技术

产业智能官

103+阅读 · 2019年1月9日

【CPS】社会物理信息系统（CPSS）及其典型应用

【CPS】社会物理信息系统（CPSS）及其典型应用

产业智能官

16+阅读 · 2018年9月18日

【微服务】工业互联网正确打开方式系列（三）：在IIOT的PAAS层，有了微服务还需要ESB吗？

【微服务】工业互联网正确打开方式系列（三）：在IIOT的PAAS层，有了微服务还需要ESB吗？

产业智能官

13+阅读 · 2018年8月18日

【技术分享】智能感知与计算研究中心NIPS 2017论文提出深度离散哈希算法，可用于图像检索

【技术分享】智能感知与计算研究中心NIPS 2017论文提出深度离散哈希算法，可用于图像检索

机器学习研究会

12+阅读 · 2017年11月3日

面向交通流微观结构的时空特征子空间分析方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向多用户行为的无线识别关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

时滞正Markov跳变系统的分布式控制与滤波

国家自然科学基金

0+阅读 · 2015年12月31日

基于超网络的云制造服务动态谱系及其时空结构演化机理研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向云数据中心应用感知的参与式资源调度技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于日常移动平台的用户状态感知与软件协同技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

传感器非线性的模糊随机系统H无穷控制和滤波问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

配送中心物流作业调度问题的建模与优化

国家自然科学基金

2+阅读 · 2014年12月31日

千万自由度量级并行有限元模态和振动分析软件研发

国家自然科学基金

0+阅读 · 2014年12月31日

面向时空变化的GIS数据模型

国家自然科学基金

6+阅读 · 2014年12月31日

Hestia: Hyperthread-Level Scheduling for Cloud Microservices with Interference-Aware Attention

Arxiv

0+阅读 · 2月27日

A Microservice-Based Platform for Sustainable and Intelligent SLO Fulfilment and Service Management

Arxiv

0+阅读 · 2月13日

Arcalis: Accelerating Remote Procedure Calls Using a Lightweight Near-Cache Solution

Arxiv

0+阅读 · 2月13日

OServe: Accelerating LLM Serving via Spatial-Temporal Workload Orchestration

Arxiv

0+阅读 · 2月12日

ByteHouse: A Cloud-Native OLAP Engine with Incremental Computation and Multi-Modal Retrieval

Arxiv

0+阅读 · 2月9日

ModARO: A Modular Approach to Architecture Reconstruction of Distributed Microservice Codebases

Arxiv

0+阅读 · 2月9日

ORACL: Optimized Reasoning for Autoscaling via Chain of Thought with LLMs for Microservices

Arxiv

0+阅读 · 2月5日

UniSage: A Unified and Post-Analysis-Aware Sampling for Microservices

Arxiv

0+阅读 · 2月4日

Morphis: SLO-Aware Resource Scheduling for Microservices with Time-Varying Call Graphs

Arxiv

0+阅读 · 2月1日

AnoMod: A Dataset for Anomaly Detection and Root Cause Analysis in Microservice Systems

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

最新内容

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

专知会员服务

2+阅读 · 今天14:36

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

专知会员服务

2+阅读 · 今天14:21

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

专知会员服务

1+阅读 · 今天14:27

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

专知会员服务

1+阅读 · 今天14:22

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

专知会员服务

4+阅读 · 7月17日

《边缘端实时无线感知赋能现场多机器人部署》200页

《边缘端实时无线感知赋能现场多机器人部署》200页

专知会员服务

6+阅读 · 7月17日

战力倍增器：自主武器系统与乌克兰及加沙冲突

战力倍增器：自主武器系统与乌克兰及加沙冲突

专知会员服务

4+阅读 · 7月17日

人工智能赋能战场情报：提速决策进程

人工智能赋能战场情报：提速决策进程

专知会员服务

2+阅读 · 7月17日

《拥抱新兴技术：面向未来军官的教育革新》

《拥抱新兴技术：面向未来军官的教育革新》

专知会员服务

5+阅读 · 7月17日

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

专知会员服务

2+阅读 · 7月17日

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

专知会员服务

3+阅读 · 7月17日

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

专知会员服务

11+阅读 · 7月16日

《无人地面战车（UGV）的崛起》报告

《无人地面战车（UGV）的崛起》报告

专知会员服务

7+阅读 · 7月16日

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

专知会员服务

6+阅读 · 7月16日

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

专知会员服务

14+阅读 · 7月16日

相关VIP内容

【ICML2025】Proxy-FDA：基于代理的特征分布对齐方法，用于无遗忘地微调视觉基础模型

【ICML2025】Proxy-FDA：基于代理的特征分布对齐方法，用于无遗忘地微调视觉基础模型

专知会员服务

9+阅读 · 2025年6月3日

【斯坦福博士论文】时序平滑性假设下的深度神经网络自适应与正则化方法

【斯坦福博士论文】时序平滑性假设下的深度神经网络自适应与正则化方法

专知会员服务

15+阅读 · 2025年3月25日

国家标准《信息技术云计算参考架构》

国家标准《信息技术云计算参考架构》

专知会员服务

37+阅读 · 2024年5月24日

【WWW2024】HetGPT：在预训练的异质图神经网络中利用提示微调的力量

【WWW2024】HetGPT：在预训练的异质图神经网络中利用提示微调的力量

专知会员服务

22+阅读 · 2024年1月28日

算力调度：算力时代的国家电网

算力调度：算力时代的国家电网

专知会员服务

44+阅读 · 2023年11月7日

国防科大最新《时空图神经网络》综述，24页pdf详述其在城市计算预测学习应用进展

国防科大最新《时空图神经网络》综述，24页pdf详述其在城市计算预测学习应用进展

专知会员服务

72+阅读 · 2023年4月3日

第六届未来网络发展大会《确定性网络技术发展与产业应用白皮书》

第六届未来网络发展大会《确定性网络技术发展与产业应用白皮书》

专知会员服务

36+阅读 · 2022年9月21日

最新！《信息技术服务数字化转型第 2 部分：成熟度模型》国家标准征求意见稿

最新！《信息技术服务数字化转型第 2 部分：成熟度模型》国家标准征求意见稿

专知会员服务

38+阅读 · 2022年5月13日

【博士论文】基于轨迹分析的微服务故障定位

专知会员服务

31+阅读 · 2020年12月21日

【清华-百度】面向季节性时空数据的预测式循环网络及其在城市计算中的应用，计算机学报

【清华-百度】面向季节性时空数据的预测式循环网络及其在城市计算中的应用，计算机学报

专知会员服务

42+阅读 · 2020年3月10日

热门VIP内容

开通专知VIP会员享更多权益服务

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

相关资讯

用户画像基础

用户画像基础

DataFunTalk

12+阅读 · 2020年8月1日

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

专知

20+阅读 · 2020年3月1日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

深度学习应用在图像匹配的效果如何？

深度学习应用在图像匹配的效果如何？

中国图象图形学报

10+阅读 · 2019年6月11日

【数字孪生】数字孪生是制造业实现“智能+”的技术接口

【数字孪生】数字孪生是制造业实现“智能+”的技术接口

产业智能官

35+阅读 · 2019年4月30日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

【知识图谱】基于知识图谱的用户画像技术

【知识图谱】基于知识图谱的用户画像技术

产业智能官

103+阅读 · 2019年1月9日

【CPS】社会物理信息系统（CPSS）及其典型应用

【CPS】社会物理信息系统（CPSS）及其典型应用

产业智能官

16+阅读 · 2018年9月18日

【微服务】工业互联网正确打开方式系列（三）：在IIOT的PAAS层，有了微服务还需要ESB吗？

【微服务】工业互联网正确打开方式系列（三）：在IIOT的PAAS层，有了微服务还需要ESB吗？

产业智能官

13+阅读 · 2018年8月18日

【技术分享】智能感知与计算研究中心NIPS 2017论文提出深度离散哈希算法，可用于图像检索

【技术分享】智能感知与计算研究中心NIPS 2017论文提出深度离散哈希算法，可用于图像检索

机器学习研究会

12+阅读 · 2017年11月3日

相关论文

Hestia: Hyperthread-Level Scheduling for Cloud Microservices with Interference-Aware Attention

Arxiv

0+阅读 · 2月27日

A Microservice-Based Platform for Sustainable and Intelligent SLO Fulfilment and Service Management

Arxiv

0+阅读 · 2月13日

Arcalis: Accelerating Remote Procedure Calls Using a Lightweight Near-Cache Solution

Arxiv

0+阅读 · 2月13日

OServe: Accelerating LLM Serving via Spatial-Temporal Workload Orchestration

Arxiv

0+阅读 · 2月12日

ByteHouse: A Cloud-Native OLAP Engine with Incremental Computation and Multi-Modal Retrieval

Arxiv

0+阅读 · 2月9日

ModARO: A Modular Approach to Architecture Reconstruction of Distributed Microservice Codebases

Arxiv

0+阅读 · 2月9日

ORACL: Optimized Reasoning for Autoscaling via Chain of Thought with LLMs for Microservices

Arxiv

0+阅读 · 2月5日

UniSage: A Unified and Post-Analysis-Aware Sampling for Microservices

Arxiv

0+阅读 · 2月4日

Morphis: SLO-Aware Resource Scheduling for Microservices with Time-Varying Call Graphs

Arxiv

0+阅读 · 2月1日

AnoMod: A Dataset for Anomaly Detection and Root Cause Analysis in Microservice Systems

Arxiv

0+阅读 · 1月30日

相关基金

面向交通流微观结构的时空特征子空间分析方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向多用户行为的无线识别关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

时滞正Markov跳变系统的分布式控制与滤波

国家自然科学基金

0+阅读 · 2015年12月31日

基于超网络的云制造服务动态谱系及其时空结构演化机理研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向云数据中心应用感知的参与式资源调度技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于日常移动平台的用户状态感知与软件协同技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

传感器非线性的模糊随机系统H无穷控制和滤波问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

配送中心物流作业调度问题的建模与优化

国家自然科学基金

2+阅读 · 2014年12月31日

千万自由度量级并行有限元模态和振动分析软件研发

国家自然科学基金

0+阅读 · 2014年12月31日

面向时空变化的GIS数据模型

国家自然科学基金

6+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员