Multi-Dimensional Autoscaling of Stream Processing Services on Edge Devices - 专知论文

会员服务 ·

0

边缘 · 边缘设备 · 弹性 · 弹性伸缩 · 推断 ·

Multi-Dimensional Autoscaling of Stream Processing Services on Edge Devices

翻译：面向边缘设备上流处理服务的多维弹性伸缩

Boris Sedlak,Philipp Raith,Andrea Morichetta,Víctor Casamayor Pujol,Schahram Dustdar

Edge devices have limited resources, which inevitably leads to situations where stream processing services cannot satisfy their needs. While existing autoscaling mechanisms focus entirely on resource scaling, Edge devices require alternative ways to sustain the Service Level Objectives (SLOs) of competing services. To address these issues, we introduce a Multi-dimensional Autoscaling Platform (MUDAP) that supports fine-grained vertical scaling across both service- and resource-level dimensions. MUDAP supports service-specific scaling tailored to available parameters, e.g., scale data quality or model size for a particular service. To optimize the execution across services, we present a scaling agent based on Regression Analysis of Structural Knowledge (RASK). The RASK agent efficiently explores the solution space and learns a continuous regression model of the processing environment for inferring optimal scaling actions. We compared our approach with two autoscalers, the Kubernetes VPA and a reinforcement learning agent, for scaling up to 9 services on a single Edge device. Our results showed that RASK can infer an accurate regression model in merely 20 iterations (i.e., observe 200s of processing). By increasingly adding elasticity dimensions, RASK sustained the highest request load with 28% less SLO violations, compared to baselines.

翻译：边缘设备资源有限，这不可避免地导致流处理服务无法满足其需求的情况。现有弹性伸缩机制完全聚焦于资源伸缩，而边缘设备需要其他方式来维持竞争性服务的服务等级目标（SLO）。为解决这些问题，我们提出了一种多维弹性伸缩平台（MUDAP），支持在服务级和资源级维度进行细粒度的垂直伸缩。MUDAP支持针对可用参数定制服务特定的伸缩策略，例如调整特定服务的数据质量或模型规模。为优化跨服务的执行过程，我们提出了一种基于结构知识回归分析（RASK）的伸缩代理。RASK代理高效地探索解空间，并学习处理环境的连续回归模型，以推断最优伸缩动作。我们将所提方法与Kubernetes VPA和强化学习代理两种自动伸缩器进行比较，在单个边缘设备上对最多9个服务进行伸缩测试。结果表明，RASK仅需20次迭代（即观察200秒处理时间）即可推断出准确的回归模型。通过逐步增加弹性维度，RASK在最高请求负载下相比基准方法减少了28%的SLO违反率。

0

相关内容

边缘侧具身基础模型：部署约束与缓解策略综述

边缘侧具身基础模型：部署约束与缓解策略综述

专知会员服务

8+阅读 · 3月19日

基于脉冲神经网络的边缘智能

基于脉冲神经网络的边缘智能

专知会员服务

21+阅读 · 2025年7月23日

【博士论文】面向边缘智能的高效微型机器学习系统，212页pdf

【博士论文】面向边缘智能的高效微型机器学习系统，212页pdf

专知会员服务

60+阅读 · 2024年2月25日

《边缘计算通信安全威胁及计算任务分类》

《边缘计算通信安全威胁及计算任务分类》

专知会员服务

36+阅读 · 2023年11月13日

【NeurIPS2023】MultiModN:多模态，多任务，可解释的模块化网络

【NeurIPS2023】MultiModN:多模态，多任务，可解释的模块化网络

专知会员服务

40+阅读 · 2023年9月27日

面向实时视频流分析的边缘计算技术

面向实时视频流分析的边缘计算技术

专知会员服务

79+阅读 · 2022年6月5日

边缘设备如何用AI？MIT韩松等最新《移动设备深度学习：方法系统应用》综述，50页pdf368篇文献全面阐述边缘深度学习技术

边缘设备如何用AI？MIT韩松等最新《移动设备深度学习：方法系统应用》综述，50页pdf368篇文献全面阐述边缘深度学习技术

专知会员服务

113+阅读 · 2022年5月6日

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

专知会员服务

37+阅读 · 2020年2月27日

【论文】边缘计算:对当前计划的全面调查和可持续边缘计算发展的路线图（Edge Computing: A Comprehensive Surveyof Current Initiativesand a Roadmap for a Sustainable Edge Computing Development）

【论文】边缘计算:对当前计划的全面调查和可持续边缘计算发展的路线图（Edge Computing: A Comprehensive Surveyof Current Initiativesand a Roadmap for a Sustainable Edge Computing Development）

专知会员服务

29+阅读 · 2019年12月19日

【中科院计算所】边缘计算与工具综述论文，A Survey on Edge Computing Systems and Tools

【中科院计算所】边缘计算与工具综述论文，A Survey on Edge Computing Systems and Tools

专知会员服务

96+阅读 · 2019年11月12日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

《“边缘计算+”技术白皮书》，82页pdf

《“边缘计算+”技术白皮书》，82页pdf

专知

11+阅读 · 2022年8月28日

Google at KDD 2020，提出MoSE框架显式建模用户行为序列提升多任务学习效果

Google at KDD 2020，提出MoSE框架显式建模用户行为序列提升多任务学习效果

AINLP

11+阅读 · 2020年7月7日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

【边缘计算】边缘计算面临的问题

【边缘计算】边缘计算面临的问题

产业智能官

17+阅读 · 2019年5月31日

【预测性维护】预测性维护是边缘计算与人工智能，在工业落地的最短路径？

【预测性维护】预测性维护是边缘计算与人工智能，在工业落地的最短路径？

产业智能官

14+阅读 · 2019年5月5日

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

产业智能官

16+阅读 · 2019年4月22日

【边缘智能】边缘计算驱动的深度学习加速技术

【边缘智能】边缘计算驱动的深度学习加速技术

产业智能官

20+阅读 · 2019年2月8日

【边缘计算】工业互联网正确打开方式系列（四）：边缘计算

【边缘计算】工业互联网正确打开方式系列（四）：边缘计算

产业智能官

19+阅读 · 2018年8月31日

边缘计算：万物互联时代新型计算模型

边缘计算：万物互联时代新型计算模型

计算机研究与发展

15+阅读 · 2017年5月19日

云计算平台中大规模交互式服务长尾延迟消减关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

有理小波理论在多途信号解析与水声网络设计中的应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

可压缩多介质流体的真正多维高保真算法

国家自然科学基金

0+阅读 · 2015年12月31日

数据中心延迟敏感型应用尾端响应时延服务质量保障方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向无线多媒体传感器网络的高效压缩视频感知

国家自然科学基金

0+阅读 · 2015年12月31日

动态自适应的可伸缩视频流媒体组播编码-传输联合优化

国家自然科学基金

0+阅读 · 2015年12月31日

弹性QoS的快速多目标优化软件定义卫星网络流控制方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向可重构多核处理器系统的分层次自适应优化机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多准则场景缩减的“零停机”设备状态预测与维护方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

随机运输服务网络设计场景树压缩及应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

Diagonal Scaling: A Multi-Dimensional Resource Model and Optimization Framework for Distributed Databases

Diagonal Scaling: A Multi-Dimensional Resource Model and Optimization Framework for Distributed Databases

Arxiv

0+阅读 · 5月4日

GradMAP: Gradient-Based Multi-Agent Proximal Learning for Grid-Edge Flexibility

Arxiv

0+阅读 · 4月27日

Exact, Efficient, and Reliable Multi-Objective and Multi-Constrained IoT Workflow Scheduling in Edge-Hub-Cloud Cyber-Physical Systems

Arxiv

0+阅读 · 4月27日

Scalable Explainability-as-a-Service (XaaS) for Edge AI Systems

Arxiv

0+阅读 · 4月27日

Reliable Microservice Tail Latency Prediction via Decoupled Dual-Stream Learning and Gradient Modulation

Arxiv

0+阅读 · 4月26日

Administrative Decentralization in Edge-Cloud Multi-Agent for Mobile Automation

Arxiv

0+阅读 · 4月9日

Enabling SLO-Aware 5G Multi-Access Edge Computing with SMEC

Arxiv

0+阅读 · 3月21日

A Systematic Evaluation of On-Device LLMs: Quantization, Performance, and Resources

Arxiv

0+阅读 · 3月16日

Transformer-Based Multipath Congestion Control: A Decoupled Approach for Wireless Uplinks

Arxiv

0+阅读 · 3月4日

FuxiShuffle: An Adaptive and Resilient Shuffle Service for Distributed Data Processing on Alibaba Cloud

Arxiv

0+阅读 · 2月26日

VIP会员

文章信息

相关主题

最新内容

综述 | 从问答到任务完成：Agent系统与Harness设计

综述 | 从问答到任务完成：Agent系统与Harness设计

专知会员服务

1+阅读 · 今天16:54

Agentic RL：框架、实践与长程智能体训练

Agentic RL：框架、实践与长程智能体训练

专知会员服务

1+阅读 · 今天16:52

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

6+阅读 · 今天8:00

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

5+阅读 · 今天7:44

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

4+阅读 · 今天7:28

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

4+阅读 · 今天7:18

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

专知会员服务

5+阅读 · 今天7:07

军事欺骗：供作战战术指挥官使用的工具

军事欺骗：供作战战术指挥官使用的工具

专知会员服务

4+阅读 · 今天7:03

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

4+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

6+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

10+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

4+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

5+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

8+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

7+阅读 · 6月23日

相关VIP内容

边缘侧具身基础模型：部署约束与缓解策略综述

边缘侧具身基础模型：部署约束与缓解策略综述

专知会员服务

8+阅读 · 3月19日

基于脉冲神经网络的边缘智能

基于脉冲神经网络的边缘智能

专知会员服务

21+阅读 · 2025年7月23日

【博士论文】面向边缘智能的高效微型机器学习系统，212页pdf

【博士论文】面向边缘智能的高效微型机器学习系统，212页pdf

专知会员服务

60+阅读 · 2024年2月25日

《边缘计算通信安全威胁及计算任务分类》

《边缘计算通信安全威胁及计算任务分类》

专知会员服务

36+阅读 · 2023年11月13日

【NeurIPS2023】MultiModN:多模态，多任务，可解释的模块化网络

【NeurIPS2023】MultiModN:多模态，多任务，可解释的模块化网络

专知会员服务

40+阅读 · 2023年9月27日

面向实时视频流分析的边缘计算技术

面向实时视频流分析的边缘计算技术

专知会员服务

79+阅读 · 2022年6月5日

边缘设备如何用AI？MIT韩松等最新《移动设备深度学习：方法系统应用》综述，50页pdf368篇文献全面阐述边缘深度学习技术

边缘设备如何用AI？MIT韩松等最新《移动设备深度学习：方法系统应用》综述，50页pdf368篇文献全面阐述边缘深度学习技术

专知会员服务

113+阅读 · 2022年5月6日

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

专知会员服务

37+阅读 · 2020年2月27日

【论文】边缘计算:对当前计划的全面调查和可持续边缘计算发展的路线图（Edge Computing: A Comprehensive Surveyof Current Initiativesand a Roadmap for a Sustainable Edge Computing Development）

【论文】边缘计算:对当前计划的全面调查和可持续边缘计算发展的路线图（Edge Computing: A Comprehensive Surveyof Current Initiativesand a Roadmap for a Sustainable Edge Computing Development）

专知会员服务

29+阅读 · 2019年12月19日

【中科院计算所】边缘计算与工具综述论文，A Survey on Edge Computing Systems and Tools

【中科院计算所】边缘计算与工具综述论文，A Survey on Edge Computing Systems and Tools

专知会员服务

96+阅读 · 2019年11月12日

热门VIP内容

开通专知VIP会员享更多权益服务

Agentic RL：框架、实践与长程智能体训练

重新思考无人机时代的生存能力

综述 | 从问答到任务完成：Agent系统与Harness设计

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

相关资讯

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

《“边缘计算+”技术白皮书》，82页pdf

《“边缘计算+”技术白皮书》，82页pdf

专知

11+阅读 · 2022年8月28日

Google at KDD 2020，提出MoSE框架显式建模用户行为序列提升多任务学习效果

Google at KDD 2020，提出MoSE框架显式建模用户行为序列提升多任务学习效果

AINLP

11+阅读 · 2020年7月7日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

【边缘计算】边缘计算面临的问题

【边缘计算】边缘计算面临的问题

产业智能官

17+阅读 · 2019年5月31日

【预测性维护】预测性维护是边缘计算与人工智能，在工业落地的最短路径？

【预测性维护】预测性维护是边缘计算与人工智能，在工业落地的最短路径？

产业智能官

14+阅读 · 2019年5月5日

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

产业智能官

16+阅读 · 2019年4月22日

【边缘智能】边缘计算驱动的深度学习加速技术

【边缘智能】边缘计算驱动的深度学习加速技术

产业智能官

20+阅读 · 2019年2月8日

【边缘计算】工业互联网正确打开方式系列（四）：边缘计算

【边缘计算】工业互联网正确打开方式系列（四）：边缘计算

产业智能官

19+阅读 · 2018年8月31日

边缘计算：万物互联时代新型计算模型

边缘计算：万物互联时代新型计算模型

计算机研究与发展

15+阅读 · 2017年5月19日

相关论文

Diagonal Scaling: A Multi-Dimensional Resource Model and Optimization Framework for Distributed Databases

Diagonal Scaling: A Multi-Dimensional Resource Model and Optimization Framework for Distributed Databases

Arxiv

0+阅读 · 5月4日

GradMAP: Gradient-Based Multi-Agent Proximal Learning for Grid-Edge Flexibility

Arxiv

0+阅读 · 4月27日

Exact, Efficient, and Reliable Multi-Objective and Multi-Constrained IoT Workflow Scheduling in Edge-Hub-Cloud Cyber-Physical Systems

Arxiv

0+阅读 · 4月27日

Scalable Explainability-as-a-Service (XaaS) for Edge AI Systems

Arxiv

0+阅读 · 4月27日

Reliable Microservice Tail Latency Prediction via Decoupled Dual-Stream Learning and Gradient Modulation

Arxiv

0+阅读 · 4月26日

Administrative Decentralization in Edge-Cloud Multi-Agent for Mobile Automation

Arxiv

0+阅读 · 4月9日

Enabling SLO-Aware 5G Multi-Access Edge Computing with SMEC

Arxiv

0+阅读 · 3月21日

A Systematic Evaluation of On-Device LLMs: Quantization, Performance, and Resources

Arxiv

0+阅读 · 3月16日

Transformer-Based Multipath Congestion Control: A Decoupled Approach for Wireless Uplinks

Arxiv

0+阅读 · 3月4日

FuxiShuffle: An Adaptive and Resilient Shuffle Service for Distributed Data Processing on Alibaba Cloud

Arxiv

0+阅读 · 2月26日

相关基金

云计算平台中大规模交互式服务长尾延迟消减关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

有理小波理论在多途信号解析与水声网络设计中的应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

可压缩多介质流体的真正多维高保真算法

国家自然科学基金

0+阅读 · 2015年12月31日

数据中心延迟敏感型应用尾端响应时延服务质量保障方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向无线多媒体传感器网络的高效压缩视频感知

国家自然科学基金

0+阅读 · 2015年12月31日

动态自适应的可伸缩视频流媒体组播编码-传输联合优化

国家自然科学基金

0+阅读 · 2015年12月31日

弹性QoS的快速多目标优化软件定义卫星网络流控制方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向可重构多核处理器系统的分层次自适应优化机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多准则场景缩减的“零停机”设备状态预测与维护方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

随机运输服务网络设计场景树压缩及应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员