To Offload or Not To Offload: Model-driven Comparison of Edge-native and On-device Processing In the Era of Accelerators - 专知论文

会员服务 ·

0

卸载 · 边缘 · 模型驱动 · 服务器 · 自适应 ·

To Offload or Not To Offload: Model-driven Comparison of Edge-native and On-device Processing In the Era of Accelerators

翻译：卸载与否：加速器时代下边缘原生与设备内处理的模型驱动比较

Nathan Ng,David Irwin,Ananthram Swami,Don Towsley,Prashant Shenoy

Computational offloading is a promising approach for overcoming resource constraints on client devices by moving some or all of an application's computations to remote servers. With the advent of specialized hardware accelerators, client devices can now perform fast local processing of specific tasks, such as machine learning inference, reducing the need for offloading computations. However, edge servers with accelerators also offer faster processing for offloaded tasks than was previously possible. In this paper, we present an analytic and experimental comparison of on-device processing and edge offloading for a range of accelerator, network, multi-tenant, and application workload scenarios, with the goal of understanding when to use local on-device processing and when to offload computations. We present models that leverage analytical queuing results to derive explainable closed-form equations for the expected end-to-end latencies of both strategies, which yield precise, quantitative performance crossover predictions that guide adaptive offloading. We experimentally validate our models across a range of scenarios and show that they achieve a mean absolute percentage error of 2.2% compared to observed latencies. We further use our models to develop a resource manager for adaptive offloading and show its effectiveness under variable network conditions and dynamic multi-tenant edge settings.

翻译：计算卸载是一种通过将应用程序的部分或全部计算任务迁移至远程服务器来克服客户端设备资源限制的有效方法。随着专用硬件加速器的出现，客户端设备现在能够对特定任务（如机器学习推理）进行快速的本地处理，从而减少对计算卸载的需求。然而，配备加速器的边缘服务器也为卸载任务提供了比以往更快的处理能力。本文通过分析和实验，比较了设备内处理与边缘卸载在多种加速器、网络、多租户及应用负载场景下的表现，旨在明确何时应采用本地设备内处理，何时应进行卸载计算。我们提出了利用解析排队论结果的模型，推导出两种策略预期端到端延迟的可解释闭式方程，这些方程能够产生精确的、定量的性能交叉预测，从而指导自适应卸载决策。我们通过一系列实验验证了所提模型，结果显示其预测延迟与实测值相比的平均绝对百分比误差为2.2%。进一步地，我们基于模型开发了一个用于自适应卸载的资源管理器，并展示了其在可变网络条件和动态多租户边缘环境下的有效性。

0

相关内容

卸载从硬盘删除程序文件和文件夹以及从注册表删除相关数据的操作

《云边计算中加速器虚拟化技术研究》187页

《云边计算中加速器虚拟化技术研究》187页

专知会员服务

31+阅读 · 2025年4月10日

【新书】边缘智能:深度学习驱动的边缘计算,277页pdf

【新书】边缘智能:深度学习驱动的边缘计算,277页pdf

专知会员服务

57+阅读 · 2024年8月18日

《移动云中安全可信的任务卸载》论文

《移动云中安全可信的任务卸载》论文

专知会员服务

18+阅读 · 2023年3月25日

【美国陆军·新方法加速人工智能战场决策】《深度压缩卸载：通过交易边缘计算加速神经网络推理以改善网络延迟》网络传感领域的顶级会议（2020）最佳论文奖

【美国陆军·新方法加速人工智能战场决策】《深度压缩卸载：通过交易边缘计算加速神经网络推理以改善网络延迟》网络传感领域的顶级会议（2020）最佳论文奖

专知会员服务

55+阅读 · 2022年11月1日

《边缘计算网络安全最佳实践概述》

《边缘计算网络安全最佳实践概述》

专知会员服务

39+阅读 · 2022年7月6日

万字长文！离线强化学习(OfflineRL)总结(原理、数据集、算法、复杂性分析、超参数调优等）

万字长文！离线强化学习(OfflineRL)总结(原理、数据集、算法、复杂性分析、超参数调优等）

专知会员服务

42+阅读 · 2022年5月12日

离散制造业边缘计算解决方案白皮书，46页pdf

离散制造业边缘计算解决方案白皮书，46页pdf

专知会员服务

33+阅读 · 2022年3月23日

移动边缘计算中基于深度强化学习的任务卸载研究进展

专知会员服务

37+阅读 · 2021年7月8日

面向自动驾驶的边缘计算技术研究综述

专知会员服务

66+阅读 · 2021年5月3日

【中科院计算所】边缘计算与工具综述论文，A Survey on Edge Computing Systems and Tools

【中科院计算所】边缘计算与工具综述论文，A Survey on Edge Computing Systems and Tools

专知会员服务

96+阅读 · 2019年11月12日

《“边缘计算+”技术白皮书》，82页pdf

《“边缘计算+”技术白皮书》，82页pdf

专知

11+阅读 · 2022年8月28日

【边缘计算】边缘计算面临的问题

【边缘计算】边缘计算面临的问题

产业智能官

17+阅读 · 2019年5月31日

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

产业智能官

16+阅读 · 2019年4月22日

【边缘智能】边缘计算驱动的深度学习加速技术

【边缘智能】边缘计算驱动的深度学习加速技术

产业智能官

20+阅读 · 2019年2月8日

边缘计算（一）——边缘计算的兴起

边缘计算（一）——边缘计算的兴起

大数据和云计算技术

12+阅读 · 2018年12月25日

【边缘计算】工业互联网正确打开方式系列（四）：边缘计算

【边缘计算】工业互联网正确打开方式系列（四）：边缘计算

产业智能官

19+阅读 · 2018年8月31日

边缘计算应用：传感数据异常实时检测算法

边缘计算应用：传感数据异常实时检测算法

计算机研究与发展

11+阅读 · 2018年4月10日

什么是迁移学习？它都用在深度学习的哪些场景上？这篇文章替你讲清楚了

什么是迁移学习？它都用在深度学习的哪些场景上？这篇文章替你讲清楚了

AI100

16+阅读 · 2017年12月23日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

边缘计算：万物互联时代新型计算模型

边缘计算：万物互联时代新型计算模型

计算机研究与发展

15+阅读 · 2017年5月19日

重复数据删除存储系统的可靠性关键技术研究

国家自然科学基金

1+阅读 · 2017年12月31日

面向用户体验的无线异构软件定义网络资源管理研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向多云块并行移动计算迁移的环境自适应程序分割技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

缓存路由器存储架构及其关键技术的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于非易失内存设备的数据读写性能优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

属性驱动的自适应多agent系统设计关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

移动云计算中数据流应用的动态计算切分技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

移动云计算环境下密码计算可证安全负载迁移研究

国家自然科学基金

0+阅读 · 2014年12月31日

云移植中遗留系统组件重用研究

国家自然科学基金

0+阅读 · 2014年12月31日

Deep Reinforcement Learning-driven Edge Offloading for Latency-constrained XR pipelines

Arxiv

0+阅读 · 3月17日

MEC Task Offloading in AIoT: A User-Centric DRL Model Splitting Inference Scheme

Arxiv

0+阅读 · 3月5日

Joint Hardware-Workload Co-Optimization for In-Memory Computing Accelerators

Arxiv

0+阅读 · 3月4日

Sequential Task Assignment and Resource Allocation in V2X-Enabled Mobile Edge Computing

Arxiv

0+阅读 · 2月27日

Task-Oriented Computation Offloading for Edge Inference: An Integrated Bayesian Optimization and Deep Reinforcement Learning Framework

Arxiv

0+阅读 · 2月23日

Compact LLM Deployment and World Model Assisted Offloading in Mobile Edge Computing

Arxiv

0+阅读 · 2月14日

QoE-Driven Multi-Task Offloading for Semantic-Aware Edge Computing Systems

Arxiv

0+阅读 · 2月12日

A Generic Service-Oriented Function Offloading Framework for Connected Automated Vehicles

Arxiv

0+阅读 · 2月9日

Accuracy-Delay Trade-Off in LLM Offloading via Token-Level Uncertainty

Arxiv

0+阅读 · 2月8日

Makespan Minimization in Split Learning: From Theory to Practice

Arxiv

0+阅读 · 2月6日

VIP会员

文章信息

相关主题

最新内容

《无人机对海面作战影响评估》

《无人机对海面作战影响评估》

专知会员服务

10+阅读 · 7月21日

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

专知会员服务

9+阅读 · 7月21日

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

专知会员服务

3+阅读 · 7月21日

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

专知会员服务

5+阅读 · 7月21日

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

专知会员服务

7+阅读 · 7月21日

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

5+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

7+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

6+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

8+阅读 · 7月20日

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

7+阅读 · 7月20日

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

9+阅读 · 7月20日

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

专知会员服务

9+阅读 · 7月20日

深入Project Maven：为何人工智能在战场上依然失灵

深入Project Maven：为何人工智能在战场上依然失灵

专知会员服务

15+阅读 · 7月19日

锻造未来士兵：外骨骼、基因工程与赛博格

锻造未来士兵：外骨骼、基因工程与赛博格

专知会员服务

8+阅读 · 7月19日

《无人机系统（UAS）通信网状网络试验性部署》50页报告

《无人机系统（UAS）通信网状网络试验性部署》50页报告

专知会员服务

10+阅读 · 7月19日

相关VIP内容

《云边计算中加速器虚拟化技术研究》187页

《云边计算中加速器虚拟化技术研究》187页

专知会员服务

31+阅读 · 2025年4月10日

【新书】边缘智能:深度学习驱动的边缘计算,277页pdf

【新书】边缘智能:深度学习驱动的边缘计算,277页pdf

专知会员服务

57+阅读 · 2024年8月18日

《移动云中安全可信的任务卸载》论文

《移动云中安全可信的任务卸载》论文

专知会员服务

18+阅读 · 2023年3月25日

【美国陆军·新方法加速人工智能战场决策】《深度压缩卸载：通过交易边缘计算加速神经网络推理以改善网络延迟》网络传感领域的顶级会议（2020）最佳论文奖

【美国陆军·新方法加速人工智能战场决策】《深度压缩卸载：通过交易边缘计算加速神经网络推理以改善网络延迟》网络传感领域的顶级会议（2020）最佳论文奖

专知会员服务

55+阅读 · 2022年11月1日

《边缘计算网络安全最佳实践概述》

《边缘计算网络安全最佳实践概述》

专知会员服务

39+阅读 · 2022年7月6日

万字长文！离线强化学习(OfflineRL)总结(原理、数据集、算法、复杂性分析、超参数调优等）

万字长文！离线强化学习(OfflineRL)总结(原理、数据集、算法、复杂性分析、超参数调优等）

专知会员服务

42+阅读 · 2022年5月12日

离散制造业边缘计算解决方案白皮书，46页pdf

离散制造业边缘计算解决方案白皮书，46页pdf

专知会员服务

33+阅读 · 2022年3月23日

移动边缘计算中基于深度强化学习的任务卸载研究进展

专知会员服务

37+阅读 · 2021年7月8日

面向自动驾驶的边缘计算技术研究综述

专知会员服务

66+阅读 · 2021年5月3日

【中科院计算所】边缘计算与工具综述论文，A Survey on Edge Computing Systems and Tools

【中科院计算所】边缘计算与工具综述论文，A Survey on Edge Computing Systems and Tools

专知会员服务

96+阅读 · 2019年11月12日

热门VIP内容

开通专知VIP会员享更多权益服务

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

《无人机对海面作战影响评估》

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

相关资讯

《“边缘计算+”技术白皮书》，82页pdf

《“边缘计算+”技术白皮书》，82页pdf

专知

11+阅读 · 2022年8月28日

【边缘计算】边缘计算面临的问题

【边缘计算】边缘计算面临的问题

产业智能官

17+阅读 · 2019年5月31日

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

【边缘计算】支撑边缘智能计算的软件体系：语言、工具与信息框架

产业智能官

16+阅读 · 2019年4月22日

【边缘智能】边缘计算驱动的深度学习加速技术

【边缘智能】边缘计算驱动的深度学习加速技术

产业智能官

20+阅读 · 2019年2月8日

边缘计算（一）——边缘计算的兴起

边缘计算（一）——边缘计算的兴起

大数据和云计算技术

12+阅读 · 2018年12月25日

【边缘计算】工业互联网正确打开方式系列（四）：边缘计算

【边缘计算】工业互联网正确打开方式系列（四）：边缘计算

产业智能官

19+阅读 · 2018年8月31日

边缘计算应用：传感数据异常实时检测算法

边缘计算应用：传感数据异常实时检测算法

计算机研究与发展

11+阅读 · 2018年4月10日

什么是迁移学习？它都用在深度学习的哪些场景上？这篇文章替你讲清楚了

什么是迁移学习？它都用在深度学习的哪些场景上？这篇文章替你讲清楚了

AI100

16+阅读 · 2017年12月23日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

边缘计算：万物互联时代新型计算模型

边缘计算：万物互联时代新型计算模型

计算机研究与发展

15+阅读 · 2017年5月19日

相关论文

Deep Reinforcement Learning-driven Edge Offloading for Latency-constrained XR pipelines

Arxiv

0+阅读 · 3月17日

MEC Task Offloading in AIoT: A User-Centric DRL Model Splitting Inference Scheme

Arxiv

0+阅读 · 3月5日

Joint Hardware-Workload Co-Optimization for In-Memory Computing Accelerators

Arxiv

0+阅读 · 3月4日

Sequential Task Assignment and Resource Allocation in V2X-Enabled Mobile Edge Computing

Arxiv

0+阅读 · 2月27日

Task-Oriented Computation Offloading for Edge Inference: An Integrated Bayesian Optimization and Deep Reinforcement Learning Framework

Arxiv

0+阅读 · 2月23日

Compact LLM Deployment and World Model Assisted Offloading in Mobile Edge Computing

Arxiv

0+阅读 · 2月14日

QoE-Driven Multi-Task Offloading for Semantic-Aware Edge Computing Systems

Arxiv

0+阅读 · 2月12日

A Generic Service-Oriented Function Offloading Framework for Connected Automated Vehicles

Arxiv

0+阅读 · 2月9日

Accuracy-Delay Trade-Off in LLM Offloading via Token-Level Uncertainty

Arxiv

0+阅读 · 2月8日

Makespan Minimization in Split Learning: From Theory to Practice

Arxiv

0+阅读 · 2月6日

相关基金

重复数据删除存储系统的可靠性关键技术研究

国家自然科学基金

1+阅读 · 2017年12月31日

面向用户体验的无线异构软件定义网络资源管理研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向多云块并行移动计算迁移的环境自适应程序分割技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

缓存路由器存储架构及其关键技术的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于非易失内存设备的数据读写性能优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

属性驱动的自适应多agent系统设计关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

移动云计算中数据流应用的动态计算切分技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

移动云计算环境下密码计算可证安全负载迁移研究

国家自然科学基金

0+阅读 · 2014年12月31日

云移植中遗留系统组件重用研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员