With the rapid development of the Artificial Intelligence of Things (AIoT), mobile edge computing (MEC) becomes an essential technology underpinning AIoT applications. However, multi-angle resource constraints, multi-user task competition, and the complexity of task offloading decisions in dynamic MEC environments present new technical challenges. Therefore, a user-centric deep reinforcement learning (DRL) model splitting inference scheme is proposed to address the problem. This scheme combines model splitting inference technology and designs a UCMS_MADDPG-based offloading algorithm to realize efficient model splitting inference responses in the dynamic MEC environment with multi-angle resource constraints. Specifically, we formulate a joint optimization problem that integrates resource allocation, server selection, and task offloading, aiming to minimize the weighted sum of task execution delay and energy consumption. We also introduce a user-server co-selection algorithm to address the selection issue between users and servers. Furthermore, we design an algorithm centered on user pre-decision to coordinate the outputs of continuous and discrete hybrid decisions, and introduce a priority sampling mechanism based on reward-error trade-off to optimize the experience replay mechanism of the network. Simulation results show that the proposed UCMS_MADDPG-based offloading algorithm demonstrates superior overall performance compared with other benchmark algorithms in dynamic environments.


翻译:随着人工智能物联网(AIoT)的快速发展,移动边缘计算(MEC)成为支撑AIoT应用的关键技术。然而,动态MEC环境中的多维度资源约束、多用户任务竞争以及任务卸载决策的复杂性带来了新的技术挑战。为此,本文提出了一种以用户为中心的深度强化学习(DRL)模型分割推理方案来解决该问题。该方案结合模型分割推理技术,并设计了一种基于UCMS_MADDPG的卸载算法,以在多维度资源约束的动态MEC环境中实现高效的模型分割推理响应。具体而言,我们将资源分配、服务器选择和任务卸载整合为一个联合优化问题,旨在最小化任务执行延迟与能耗的加权和。我们还引入了一种用户-服务器协同选择算法来解决用户与服务器之间的选择问题。此外,我们设计了一种以用户预决策为中心的算法来协调连续与离散混合决策的输出,并引入了一种基于奖励-误差权衡的优先级采样机制来优化网络的经验回放机制。仿真结果表明,在动态环境中,与其它基准算法相比,所提出的基于UCMS_MADDPG的卸载算法展现出更优的综合性能。

0
下载
关闭预览

相关内容

卸载从硬盘删除程序文件和文件夹以及从注册表删除相关数据的操作
《可解释深度强化学习综述》
专知会员服务
40+阅读 · 2025年2月12日
面向 AIoT 的协同智能综述
专知会员服务
27+阅读 · 2024年11月16日
面向AIoT的协同智能综述
专知会员服务
39+阅读 · 2024年9月12日
《移动云中安全可信的任务卸载》论文
专知会员服务
17+阅读 · 2023年3月25日
专知会员服务
37+阅读 · 2021年7月8日
专知会员服务
67+阅读 · 2021年1月10日
【综述】自动驾驶领域中的强化学习,附18页论文下载
专知会员服务
176+阅读 · 2020年2月8日
基于机器阅读理解(MRC)的信息抽取方法
DataFunTalk
13+阅读 · 2019年11月1日
深度学习中Attention Mechanism详细介绍:原理、分类及应用
深度学习与NLP
10+阅读 · 2019年2月18日
NLP中自动生产文摘(auto text summarization)
机器学习研究会
14+阅读 · 2017年10月10日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员