MEC Task Offloading in AIoT: A User-Centric DRL Model Splitting Inference Scheme - 专知论文

会员服务 ·

0

卸载 · 模型分割 · 分割 · 算法 · 任务卸载 ·

MEC Task Offloading in AIoT: A User-Centric DRL Model Splitting Inference Scheme

翻译：面向AIoT的MEC任务卸载：一种以用户为中心的DRL模型分割推理方案

Weixi Li,Rongzuo Guo,Yuning Wang,Fangying Chen

from arxiv, 43 pages,13 figures,3 tables

With the rapid development of the Artificial Intelligence of Things (AIoT), mobile edge computing (MEC) becomes an essential technology underpinning AIoT applications. However, multi-angle resource constraints, multi-user task competition, and the complexity of task offloading decisions in dynamic MEC environments present new technical challenges. Therefore, a user-centric deep reinforcement learning (DRL) model splitting inference scheme is proposed to address the problem. This scheme combines model splitting inference technology and designs a UCMS_MADDPG-based offloading algorithm to realize efficient model splitting inference responses in the dynamic MEC environment with multi-angle resource constraints. Specifically, we formulate a joint optimization problem that integrates resource allocation, server selection, and task offloading, aiming to minimize the weighted sum of task execution delay and energy consumption. We also introduce a user-server co-selection algorithm to address the selection issue between users and servers. Furthermore, we design an algorithm centered on user pre-decision to coordinate the outputs of continuous and discrete hybrid decisions, and introduce a priority sampling mechanism based on reward-error trade-off to optimize the experience replay mechanism of the network. Simulation results show that the proposed UCMS_MADDPG-based offloading algorithm demonstrates superior overall performance compared with other benchmark algorithms in dynamic environments.

翻译：随着人工智能物联网（AIoT）的快速发展，移动边缘计算（MEC）成为支撑AIoT应用的关键技术。然而，动态MEC环境中的多维度资源约束、多用户任务竞争以及任务卸载决策的复杂性带来了新的技术挑战。为此，本文提出了一种以用户为中心的深度强化学习（DRL）模型分割推理方案来解决该问题。该方案结合模型分割推理技术，并设计了一种基于UCMS_MADDPG的卸载算法，以在多维度资源约束的动态MEC环境中实现高效的模型分割推理响应。具体而言，我们将资源分配、服务器选择和任务卸载整合为一个联合优化问题，旨在最小化任务执行延迟与能耗的加权和。我们还引入了一种用户-服务器协同选择算法来解决用户与服务器之间的选择问题。此外，我们设计了一种以用户预决策为中心的算法来协调连续与离散混合决策的输出，并引入了一种基于奖励-误差权衡的优先级采样机制来优化网络的经验回放机制。仿真结果表明，在动态环境中，与其它基准算法相比，所提出的基于UCMS_MADDPG的卸载算法展现出更优的综合性能。

0

相关内容

卸载从硬盘删除程序文件和文件夹以及从注册表删除相关数据的操作

《可解释深度强化学习综述》

《可解释深度强化学习综述》

专知会员服务

40+阅读 · 2025年2月12日

面向 AIoT 的协同智能综述

面向 AIoT 的协同智能综述

专知会员服务

27+阅读 · 2024年11月16日

面向AIoT的协同智能综述

面向AIoT的协同智能综述

专知会员服务

39+阅读 · 2024年9月12日

《移动云中安全可信的任务卸载》论文

《移动云中安全可信的任务卸载》论文

专知会员服务

17+阅读 · 2023年3月25日

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

专知会员服务

89+阅读 · 2022年11月17日

【美国陆军·新方法加速人工智能战场决策】《深度压缩卸载：通过交易边缘计算加速神经网络推理以改善网络延迟》网络传感领域的顶级会议（2020）最佳论文奖

【美国陆军·新方法加速人工智能战场决策】《深度压缩卸载：通过交易边缘计算加速神经网络推理以改善网络延迟》网络传感领域的顶级会议（2020）最佳论文奖

专知会员服务

54+阅读 · 2022年11月1日

腾讯&百度等发布《 AIoT智能边缘计算网关技术规范》，21页pdf

腾讯&百度等发布《 AIoT智能边缘计算网关技术规范》，21页pdf

专知会员服务

62+阅读 · 2021年11月12日

移动边缘计算中基于深度强化学习的任务卸载研究进展

专知会员服务

37+阅读 · 2021年7月8日

深度学习模型的中毒攻击与防御综述

专知会员服务

67+阅读 · 2021年1月10日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

176+阅读 · 2020年2月8日

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

专知

10+阅读 · 2022年11月17日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

55+阅读 · 2022年10月6日

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

专知

15+阅读 · 2022年2月16日

蚂蚁金服人工智能部论文《AGL:可扩展工业图机器学习系统》，处理十亿节点千亿边图数据的GNNs训练推理

蚂蚁金服人工智能部论文《AGL:可扩展工业图机器学习系统》，处理十亿节点千亿边图数据的GNNs训练推理

专知

33+阅读 · 2020年3月9日

干货教程！百度AutoDL「自动深度学习: 理论、算法、平台和应用」132PPT

干货教程！百度AutoDL「自动深度学习: 理论、算法、平台和应用」132PPT

专知

21+阅读 · 2020年2月5日

基于机器阅读理解（MRC）的信息抽取方法

基于机器阅读理解（MRC）的信息抽取方法

DataFunTalk

13+阅读 · 2019年11月1日

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

10+阅读 · 2019年2月18日

深度强化学习在NLP怎么用？看清华黄民烈老师这一份120页《自然语言处理和搜索中的深度强化学习应用》讲义

深度强化学习在NLP怎么用？看清华黄民烈老师这一份120页《自然语言处理和搜索中的深度强化学习应用》讲义

专知

31+阅读 · 2018年9月1日

NLP中自动生产文摘（auto text summarization）

NLP中自动生产文摘（auto text summarization）

机器学习研究会

14+阅读 · 2017年10月10日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

顾及扫描上下文的预测与判决相结合的点云在线分类方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

大数据背景下面向操作模式的约简算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

云端融合计算环境下QoS敏感的任务调度机制研究

国家自然科学基金

8+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

31+阅读 · 2015年12月31日

动态群稀疏约束场景知识建模的感兴趣监控目标超分辨率重建

国家自然科学基金

1+阅读 · 2014年12月31日

Deep Reinforcement Learning-driven Edge Offloading for Latency-constrained XR pipelines

Arxiv

0+阅读 · 3月17日

vAccSOL: Efficient and Transparent AI Vision Offloading for Mobile Robots

Arxiv

0+阅读 · 3月17日

Task-Oriented Computation Offloading for Edge Inference: An Integrated Bayesian Optimization and Deep Reinforcement Learning Framework

Arxiv

0+阅读 · 2月23日

Carbon-aware decentralized dynamic task offloading in MIMO-MEC networks via multi-agent reinforcement learning

Arxiv

0+阅读 · 2月21日

Hierarchical Edge-Cloud Task Offloading in NTN for Remote Healthcare

Arxiv

0+阅读 · 2月19日

ReaCritic: Reasoning Transformer-based DRL Critic-model Scaling For Wireless Networks

Arxiv

0+阅读 · 2月18日

QoE-Driven Multi-Task Offloading for Semantic-Aware Edge Computing Systems

Arxiv

0+阅读 · 2月12日

Accuracy-Delay Trade-Off in LLM Offloading via Token-Level Uncertainty

Arxiv

0+阅读 · 2月8日

Messaging-based Adaptive Vector Computing (MAVeC) Accelerator for AI Workloads

Arxiv

0+阅读 · 2月4日

medR: Reward Engineering for Clinical Offline Reinforcement Learning via Tri-Drive Potential Functions

Arxiv

0+阅读 · 2月4日

VIP会员

文章信息

相关主题

最新内容

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

专知会员服务

2+阅读 · 32分钟前

《人工智能在全球军事与武器工业中的应用、方法论与影响》

《人工智能在全球军事与武器工业中的应用、方法论与影响》

专知会员服务

1+阅读 · 35分钟前

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

专知会员服务

3+阅读 · 43分钟前

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

专知会员服务

3+阅读 · 今天0:51

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

机器人领域中的视觉-语言-动作模型：数据集、基准测试与数据引擎综述

专知会员服务

4+阅读 · 4月29日

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

主权智能前沿：战略霸权与算法战争代差的比较分析——第二部分

专知会员服务

6+阅读 · 4月29日

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

万亿美元智能竞赛：OpenAI的主权崛起与数字神经系统的高风险博弈——第一部分

专知会员服务

5+阅读 · 4月29日

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

《忠诚僚机、人工智能与认知增强：对赛博格-无人机战争的警示》

专知会员服务

5+阅读 · 4月29日

《化繁为简：军事模拟器配置的对话式方法》报告

《化繁为简：军事模拟器配置的对话式方法》报告

专知会员服务

8+阅读 · 4月29日

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

《人机协同研究报告——衡量与预测技术流利性：知识、技能、能力及其他行为如何促成技术精通》146页

专知会员服务

11+阅读 · 4月29日

《新兴技术武器化及其对全球风险的影响》

《新兴技术武器化及其对全球风险的影响》

专知会员服务

7+阅读 · 4月29日

《帕兰泰尔平台介绍：信息分析平台》

《帕兰泰尔平台介绍：信息分析平台》

专知会员服务

18+阅读 · 4月29日

Maven智能系统（MSS）如何赋能第三方解决方案：北约视角

Maven智能系统（MSS）如何赋能第三方解决方案：北约视角

专知会员服务

10+阅读 · 4月29日

【伯克利博士论文】深度解析 AI 智能体的失配问题

【伯克利博士论文】深度解析 AI 智能体的失配问题

专知会员服务

8+阅读 · 4月28日

智能体化世界建模：基础、能力、规律及展望

智能体化世界建模：基础、能力、规律及展望

专知会员服务

11+阅读 · 4月28日

相关VIP内容

《可解释深度强化学习综述》

《可解释深度强化学习综述》

专知会员服务

40+阅读 · 2025年2月12日

面向 AIoT 的协同智能综述

面向 AIoT 的协同智能综述

专知会员服务

27+阅读 · 2024年11月16日

面向AIoT的协同智能综述

面向AIoT的协同智能综述

专知会员服务

39+阅读 · 2024年9月12日

《移动云中安全可信的任务卸载》论文

《移动云中安全可信的任务卸载》论文

专知会员服务

17+阅读 · 2023年3月25日

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

专知会员服务

89+阅读 · 2022年11月17日

【美国陆军·新方法加速人工智能战场决策】《深度压缩卸载：通过交易边缘计算加速神经网络推理以改善网络延迟》网络传感领域的顶级会议（2020）最佳论文奖

【美国陆军·新方法加速人工智能战场决策】《深度压缩卸载：通过交易边缘计算加速神经网络推理以改善网络延迟》网络传感领域的顶级会议（2020）最佳论文奖

专知会员服务

54+阅读 · 2022年11月1日

腾讯&百度等发布《 AIoT智能边缘计算网关技术规范》，21页pdf

腾讯&百度等发布《 AIoT智能边缘计算网关技术规范》，21页pdf

专知会员服务

62+阅读 · 2021年11月12日

移动边缘计算中基于深度强化学习的任务卸载研究进展

专知会员服务

37+阅读 · 2021年7月8日

深度学习模型的中毒攻击与防御综述

专知会员服务

67+阅读 · 2021年1月10日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

176+阅读 · 2020年2月8日

热门VIP内容

开通专知VIP会员享更多权益服务

《人工智能在全球军事与武器工业中的应用、方法论与影响》

美国力量的新架构：Anduril、Palantir、SpaceX 与美国军工格局的转型

《未来打击作战中有人-无人协同的扩展杀伤链分析》130页

《“史诗怒火”行动中美军平台的战略协同：基于开源数据的网络分析》200页报告

相关资讯

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

专知

10+阅读 · 2022年11月17日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

55+阅读 · 2022年10月6日

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

专知

15+阅读 · 2022年2月16日

蚂蚁金服人工智能部论文《AGL:可扩展工业图机器学习系统》，处理十亿节点千亿边图数据的GNNs训练推理

蚂蚁金服人工智能部论文《AGL:可扩展工业图机器学习系统》，处理十亿节点千亿边图数据的GNNs训练推理

专知

33+阅读 · 2020年3月9日

干货教程！百度AutoDL「自动深度学习: 理论、算法、平台和应用」132PPT

干货教程！百度AutoDL「自动深度学习: 理论、算法、平台和应用」132PPT

专知

21+阅读 · 2020年2月5日

基于机器阅读理解（MRC）的信息抽取方法

基于机器阅读理解（MRC）的信息抽取方法

DataFunTalk

13+阅读 · 2019年11月1日

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

10+阅读 · 2019年2月18日

深度强化学习在NLP怎么用？看清华黄民烈老师这一份120页《自然语言处理和搜索中的深度强化学习应用》讲义

深度强化学习在NLP怎么用？看清华黄民烈老师这一份120页《自然语言处理和搜索中的深度强化学习应用》讲义

专知

31+阅读 · 2018年9月1日

NLP中自动生产文摘（auto text summarization）

NLP中自动生产文摘（auto text summarization）

机器学习研究会

14+阅读 · 2017年10月10日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

相关论文

Deep Reinforcement Learning-driven Edge Offloading for Latency-constrained XR pipelines

Arxiv

0+阅读 · 3月17日

vAccSOL: Efficient and Transparent AI Vision Offloading for Mobile Robots

Arxiv

0+阅读 · 3月17日

Task-Oriented Computation Offloading for Edge Inference: An Integrated Bayesian Optimization and Deep Reinforcement Learning Framework

Arxiv

0+阅读 · 2月23日

Carbon-aware decentralized dynamic task offloading in MIMO-MEC networks via multi-agent reinforcement learning

Arxiv

0+阅读 · 2月21日

Hierarchical Edge-Cloud Task Offloading in NTN for Remote Healthcare

Arxiv

0+阅读 · 2月19日

ReaCritic: Reasoning Transformer-based DRL Critic-model Scaling For Wireless Networks

Arxiv

0+阅读 · 2月18日

QoE-Driven Multi-Task Offloading for Semantic-Aware Edge Computing Systems

Arxiv

0+阅读 · 2月12日

Accuracy-Delay Trade-Off in LLM Offloading via Token-Level Uncertainty

Arxiv

0+阅读 · 2月8日

Messaging-based Adaptive Vector Computing (MAVeC) Accelerator for AI Workloads

Arxiv

0+阅读 · 2月4日

medR: Reward Engineering for Clinical Offline Reinforcement Learning via Tri-Drive Potential Functions

Arxiv

0+阅读 · 2月4日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

顾及扫描上下文的预测与判决相结合的点云在线分类方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

大数据背景下面向操作模式的约简算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

云端融合计算环境下QoS敏感的任务调度机制研究

国家自然科学基金

8+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向健康管理数据的关联型知识深度挖掘方法研究

国家自然科学基金

12+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

31+阅读 · 2015年12月31日

动态群稀疏约束场景知识建模的感兴趣监控目标超分辨率重建

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员