Hestia: Hyperthread-Level Scheduling for Cloud Microservices with Interference-Aware Attention - 专知论文

会员服务 ·

0

调度 · 微服务 · 注意力机制 · 服务器 · 感知调度 ·

Hestia: Hyperthread-Level Scheduling for Cloud Microservices with Interference-Aware Attention

翻译：Hestia：基于干扰感知注意力机制的云微服务超线程级调度

Dingyu Yang,Fanyong Kong,Jie Dai,Shiyou Qian,Shuangwei Li,Jian Cao,Guangtao Xue,Gang Chen

from arxiv, This paper has been accepted for publication in Design Automation Conference(DAC 2026)

Modern cloud servers routinely co-locate multiple latency-sensitive microservice instances to improve resource efficiency. However, the diversity of microservice behaviors, coupled with mutual performance interference under simultaneous multithreading (SMT), makes large-scale placement increasingly complex. Existing interference aware schedulers and isolation techniques rely on coarse core-level profiling or static resource partitioning, leaving asymmetric hyperthread-level heterogeneity and SMT contention dynamics largely unmodeled. We present Hestia, a hyperthread-level, interference-aware scheduling framework powered by self-attention. Through an extensive analysis of production traces encompassing 32,408 instances across 3,132 servers, we identify two dominant contention patterns -- sharing-core (SC) and sharing-socket (SS) -- and reveal strong asymmetry in their impact. Guided by these insights, Hestia incorporates (1) a self-attention-based CPU usage predictor that models SC/SS contention and hardware heterogeneity, and (2) an interference scoring model that estimates pairwise contention risks to guide scheduling decisions. We evaluate Hestia through large-scale simulation and a real production deployment. Hestia reduces the 95th-percentile service latency by up to 80\%, lowers overall CPU consumption by 2.3\% under the same workload, and surpasses five state-of-the-art schedulers by up to 30.65\% across diverse contention scenarios.

翻译：现代云服务器通常将多个延迟敏感的微服务实例共置以提高资源效率。然而，微服务行为的多样性，加上同步多线程（SMT）下的相互性能干扰，使得大规模部署日益复杂。现有的干扰感知调度器和隔离技术依赖于粗粒度的核心级性能分析或静态资源分区，未能充分建模非对称的超线程级异构性和SMT争用动态。本文提出Hestia，一种由自注意力机制驱动的超线程级干扰感知调度框架。通过对涵盖3,132台服务器上32,408个实例的生产环境追踪数据进行广泛分析，我们识别出两种主要的争用模式——共享核心（SC）和共享插槽（SS），并揭示了其影响的强不对称性。基于这些发现，Hestia整合了（1）一个基于自注意力的CPU使用率预测器，用于建模SC/SS争用和硬件异构性；以及（2）一个干扰评分模型，用于估计成对争用风险以指导调度决策。我们通过大规模仿真和实际生产部署对Hestia进行评估。Hestia将第95百分位服务延迟降低高达80%，在相同工作负载下整体CPU消耗降低2.3%，并在多种争用场景中超越五种先进调度器高达30.65%。

0

相关内容

【ICML spotlight 2026】HELIX：通过可学习特征身份嵌入实现时间序列插补的混合编码框架

【ICML spotlight 2026】HELIX：通过可学习特征身份嵌入实现时间序列插补的混合编码框架

专知会员服务

8+阅读 · 5月6日

《安全战术微云对边缘任务的支持》21页slides

《安全战术微云对边缘任务的支持》21页slides

专知会员服务

26+阅读 · 2024年6月9日

国家标准《信息技术云计算参考架构》

国家标准《信息技术云计算参考架构》

专知会员服务

37+阅读 · 2024年5月24日

【WWW2024】HetGPT：在预训练的异质图神经网络中利用提示微调的力量

【WWW2024】HetGPT：在预训练的异质图神经网络中利用提示微调的力量

专知会员服务

22+阅读 · 2024年1月28日

《从联盟角度看弱势战术网络的联合云和自适应云》

《从联盟角度看弱势战术网络的联合云和自适应云》

专知会员服务

42+阅读 · 2023年11月10日

【网络中心战】《战术云中雾节点任务调度》，印度国立理工学院

【网络中心战】《战术云中雾节点任务调度》，印度国立理工学院

专知会员服务

40+阅读 · 2023年2月7日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知会员服务

147+阅读 · 2022年11月14日

【2022新书】构建微服务：设计细粒度系统，615页pdf

【2022新书】构建微服务：设计细粒度系统，615页pdf

专知会员服务

91+阅读 · 2022年9月4日

【IJCAI2021】CUC：云计算中基于不确定约束的预测作业调度算法

【IJCAI2021】CUC：云计算中基于不确定约束的预测作业调度算法

专知会员服务

15+阅读 · 2021年8月26日

【爱丁堡博士论文】深度神经移动网络，Deep Neural Mobile Networking

【爱丁堡博士论文】深度神经移动网络，Deep Neural Mobile Networking

专知会员服务

20+阅读 · 2020年11月12日

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知

39+阅读 · 2023年4月11日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

《使用网络数字孪生提高军事任务网络弹性》2022最新论文

《使用网络数字孪生提高军事任务网络弹性》2022最新论文

专知

34+阅读 · 2022年11月12日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

CVer

12+阅读 · 2020年6月30日

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

专知

21+阅读 · 2019年12月31日

前端微服务在字节跳动的落地之路

前端微服务在字节跳动的落地之路

前端之巅

41+阅读 · 2019年9月19日

【边缘智能】边缘计算驱动的深度学习加速技术

【边缘智能】边缘计算驱动的深度学习加速技术

产业智能官

20+阅读 · 2019年2月8日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

【360人工智能研究院与NUS颜水成团队】HashGAN:基于注意力机制的深度对抗哈希模型提升跨模态检索效果

【360人工智能研究院与NUS颜水成团队】HashGAN:基于注意力机制的深度对抗哈希模型提升跨模态检索效果

专知

16+阅读 · 2017年11月29日

云计算平台中大规模交互式服务长尾延迟消减关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

异构云小区网络中基于时延保证的资源配置新方法

国家自然科学基金

0+阅读 · 2015年12月31日

云环境下支持虚拟集群的跨层协同调度机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

数据中心网络中延时敏感的传输控制协议

国家自然科学基金

0+阅读 · 2015年12月31日

扩展空频自由度的机会式无干扰传输新技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

云端融合计算环境下QoS敏感的任务调度机制研究

国家自然科学基金

8+阅读 · 2015年12月31日

可信多云协作关键安全问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

云计算环境中面向时间约束的大规模并行业务流程的监控策略研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向云数据中心应用感知的参与式资源调度技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

Affinity Tailor: Dynamic Locality-Aware Scheduling at Scale

Arxiv

0+阅读 · 4月30日

Exact, Efficient, and Reliable Multi-Objective and Multi-Constrained IoT Workflow Scheduling in Edge-Hub-Cloud Cyber-Physical Systems

Arxiv

0+阅读 · 4月27日

Reliable Microservice Tail Latency Prediction via Decoupled Dual-Stream Learning and Gradient Modulation

Arxiv

0+阅读 · 4月26日

Intelligent Cloud Orchestration: A Hybrid Predictive and Heuristic Framework for Cost Optimization

Arxiv

0+阅读 · 4月2日

Missing-Aware Multimodal Fusion for Unified Microservice Incident Management

Arxiv

0+阅读 · 3月26日

CloudFormer: An Attention-based Performance Prediction for Public Clouds with Unknown Workload

Arxiv

0+阅读 · 3月25日

Serving Hybrid LLM Loads with SLO Guarantees Using CPU-GPU Attention Piggybacking

Arxiv

0+阅读 · 3月17日

DeFRiS: Silo-Cooperative IoT Applications Scheduling via Decentralized Federated Reinforcement Learning

Arxiv

0+阅读 · 3月16日

Serving Hybrid LLM Loads with SLO Guarantees Using CPU-GPU Attention Piggybacking

Arxiv

0+阅读 · 3月13日

Aceso: Carbon-Aware and Cost-Effective Microservice Placement for Small and Medium-sized Enterprises

Arxiv

0+阅读 · 3月11日

VIP会员

文章信息

相关主题

注意力机制

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

3+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

4+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

9+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

8+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

4+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

7+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

6+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

9+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

4+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

6+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

7+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

6+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

5+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

相关VIP内容

【ICML spotlight 2026】HELIX：通过可学习特征身份嵌入实现时间序列插补的混合编码框架

【ICML spotlight 2026】HELIX：通过可学习特征身份嵌入实现时间序列插补的混合编码框架

专知会员服务

8+阅读 · 5月6日

《安全战术微云对边缘任务的支持》21页slides

《安全战术微云对边缘任务的支持》21页slides

专知会员服务

26+阅读 · 2024年6月9日

国家标准《信息技术云计算参考架构》

国家标准《信息技术云计算参考架构》

专知会员服务

37+阅读 · 2024年5月24日

【WWW2024】HetGPT：在预训练的异质图神经网络中利用提示微调的力量

【WWW2024】HetGPT：在预训练的异质图神经网络中利用提示微调的力量

专知会员服务

22+阅读 · 2024年1月28日

《从联盟角度看弱势战术网络的联合云和自适应云》

《从联盟角度看弱势战术网络的联合云和自适应云》

专知会员服务

42+阅读 · 2023年11月10日

【网络中心战】《战术云中雾节点任务调度》，印度国立理工学院

【网络中心战】《战术云中雾节点任务调度》，印度国立理工学院

专知会员服务

40+阅读 · 2023年2月7日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知会员服务

147+阅读 · 2022年11月14日

【2022新书】构建微服务：设计细粒度系统，615页pdf

【2022新书】构建微服务：设计细粒度系统，615页pdf

专知会员服务

91+阅读 · 2022年9月4日

【IJCAI2021】CUC：云计算中基于不确定约束的预测作业调度算法

【IJCAI2021】CUC：云计算中基于不确定约束的预测作业调度算法

专知会员服务

15+阅读 · 2021年8月26日

【爱丁堡博士论文】深度神经移动网络，Deep Neural Mobile Networking

【爱丁堡博士论文】深度神经移动网络，Deep Neural Mobile Networking

专知会员服务

20+阅读 · 2020年11月12日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知

39+阅读 · 2023年4月11日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

《使用网络数字孪生提高军事任务网络弹性》2022最新论文

《使用网络数字孪生提高军事任务网络弹性》2022最新论文

专知

34+阅读 · 2022年11月12日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

CVer

12+阅读 · 2020年6月30日

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

专知

21+阅读 · 2019年12月31日

前端微服务在字节跳动的落地之路

前端微服务在字节跳动的落地之路

前端之巅

41+阅读 · 2019年9月19日

【边缘智能】边缘计算驱动的深度学习加速技术

【边缘智能】边缘计算驱动的深度学习加速技术

产业智能官

20+阅读 · 2019年2月8日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

【360人工智能研究院与NUS颜水成团队】HashGAN:基于注意力机制的深度对抗哈希模型提升跨模态检索效果

【360人工智能研究院与NUS颜水成团队】HashGAN:基于注意力机制的深度对抗哈希模型提升跨模态检索效果

专知

16+阅读 · 2017年11月29日

相关论文

Affinity Tailor: Dynamic Locality-Aware Scheduling at Scale

Arxiv

0+阅读 · 4月30日

Exact, Efficient, and Reliable Multi-Objective and Multi-Constrained IoT Workflow Scheduling in Edge-Hub-Cloud Cyber-Physical Systems

Arxiv

0+阅读 · 4月27日

Reliable Microservice Tail Latency Prediction via Decoupled Dual-Stream Learning and Gradient Modulation

Arxiv

0+阅读 · 4月26日

Intelligent Cloud Orchestration: A Hybrid Predictive and Heuristic Framework for Cost Optimization

Arxiv

0+阅读 · 4月2日

Missing-Aware Multimodal Fusion for Unified Microservice Incident Management

Arxiv

0+阅读 · 3月26日

CloudFormer: An Attention-based Performance Prediction for Public Clouds with Unknown Workload

Arxiv

0+阅读 · 3月25日

Serving Hybrid LLM Loads with SLO Guarantees Using CPU-GPU Attention Piggybacking

Arxiv

0+阅读 · 3月17日

DeFRiS: Silo-Cooperative IoT Applications Scheduling via Decentralized Federated Reinforcement Learning

Arxiv

0+阅读 · 3月16日

Serving Hybrid LLM Loads with SLO Guarantees Using CPU-GPU Attention Piggybacking

Arxiv

0+阅读 · 3月13日

Aceso: Carbon-Aware and Cost-Effective Microservice Placement for Small and Medium-sized Enterprises

Arxiv

0+阅读 · 3月11日

相关基金

云计算平台中大规模交互式服务长尾延迟消减关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

异构云小区网络中基于时延保证的资源配置新方法

国家自然科学基金

0+阅读 · 2015年12月31日

云环境下支持虚拟集群的跨层协同调度机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

数据中心网络中延时敏感的传输控制协议

国家自然科学基金

0+阅读 · 2015年12月31日

扩展空频自由度的机会式无干扰传输新技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

云端融合计算环境下QoS敏感的任务调度机制研究

国家自然科学基金

8+阅读 · 2015年12月31日

可信多云协作关键安全问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

云计算环境中面向时间约束的大规模并行业务流程的监控策略研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向云数据中心应用感知的参与式资源调度技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

微信扫码咨询专知VIP会员