基于深度强化学习的下行链路NOMA系统最优功率分配与次优信道分配 (Optimal Power Allocation and Sub-Optimal Channel Assignment for Downlink NOMA Systems Using Deep Reinforcement Learning) - 专知论文

会员服务 ·

0

NOMA · 系统 · 功率分配 · 信道分配 · 接入 ·

Optimal Power Allocation and Sub-Optimal Channel Assignment for Downlink NOMA Systems Using Deep Reinforcement Learning

翻译：基于深度强化学习的下行链路NOMA系统最优功率分配与次优信道分配

WooSeok Kim,Jeonghoon Lee,Sangho Kim,Taesun An,WonMin Lee,Dowon Kim,Kyungseop Shin

In recent years, Non-Orthogonal Multiple Access (NOMA) system has emerged as a promising candidate for multiple access frameworks due to the evolution of deep machine learning, trying to incorporate deep machine learning into the NOMA system. The main motivation for such active studies is the growing need to optimize the utilization of network resources as the expansion of the internet of things (IoT) caused a scarcity of network resources. The NOMA addresses this need by power multiplexing, allowing multiple users to access the network simultaneously. Nevertheless, the NOMA system has few limitations. Several works have proposed to mitigate this, including the optimization of power allocation known as joint resource allocation(JRA) method, and integration of the JRA method and deep reinforcement learning (JRA-DRL). Despite this, the channel assignment problem remains unclear and requires further investigation. In this paper, we propose a deep reinforcement learning framework incorporating replay memory with an on-policy algorithm, allocating network resources in a NOMA system to generalize the learning. Also, we provide extensive simulations to evaluate the effects of varying the learning rate, batch size, type of model, and the number of features in the state.

翻译：近年来，随着深度机器学习的发展，非正交多址接入系统因其尝试将深度机器学习融入其中，已成为多址接入框架中极具前景的候选方案。此类研究活跃的主要动因在于，随着物联网的扩展导致网络资源日益稀缺，优化网络资源利用的需求不断增长。NOMA通过功率复用技术满足这一需求，允许多个用户同时接入网络。然而，NOMA系统仍存在一些局限性。已有若干研究工作提出了缓解方案，包括被称为联合资源分配方法的功率分配优化，以及JRA方法与深度强化学习的结合。尽管如此，信道分配问题仍未明确，需要进一步研究。本文提出了一种结合回放记忆与同策略算法的深度强化学习框架，用于在NOMA系统中分配网络资源以实现泛化学习。同时，我们通过大量仿真评估了学习率、批处理大小、模型类型以及状态特征数量变化的影响。

0

相关内容

NOMA

面向深度研究系统的强化学习基础：综述

面向深度研究系统的强化学习基础：综述

专知会员服务

23+阅读 · 2025年9月22日

《多智能体系统的神经协调：多领域任务环境中基于深度学习的智能体最优选择框架》

《多智能体系统的神经协调：多领域任务环境中基于深度学习的智能体最优选择框架》

专知会员服务

25+阅读 · 2025年5月7日

同济等最新《多智能体强化学习》综述，43页pdf详述MARL方法、应用、展望与挑战

同济等最新《多智能体强化学习》综述，43页pdf详述MARL方法、应用、展望与挑战

专知会员服务

64+阅读 · 2023年5月19日

基于多智能体深度强化学习的体系任务分配方法

基于多智能体深度强化学习的体系任务分配方法

专知会员服务

157+阅读 · 2023年5月4日

《深度强化学习在集群系统中的应用》31页论文

《深度强化学习在集群系统中的应用》31页论文

专知会员服务

60+阅读 · 2023年3月14日

【博士论文】面向分布式深度学习的数据中心网络拓扑优化和流量调度

【博士论文】面向分布式深度学习的数据中心网络拓扑优化和流量调度

专知会员服务

29+阅读 · 2022年12月30日

《时间连通性作为非正交多址无线网络鲁棒性的度量》美海军2022最新151页博士论文

《时间连通性作为非正交多址无线网络鲁棒性的度量》美海军2022最新151页博士论文

专知会员服务

16+阅读 · 2022年12月27日

《深度学习在增强型无线通信系统设计中的应用》贝尔实验室 - 里昂大学2022最新168页博士论文

《深度学习在增强型无线通信系统设计中的应用》贝尔实验室 - 里昂大学2022最新168页博士论文

专知会员服务

26+阅读 · 2022年8月4日

分布式深度学习训练网络综述

专知会员服务

48+阅读 · 2021年2月2日

南洋理工大学，深度学习推荐系统综述

南洋理工大学，深度学习推荐系统综述

专知会员服务

177+阅读 · 2019年10月14日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知

58+阅读 · 2022年4月30日

多智能体强化学习（MARL）近年研究概览

多智能体强化学习（MARL）近年研究概览

PaperWeekly

38+阅读 · 2020年3月15日

论文 | 基于深度学习的序列推荐系统综述：概念、方法与实验评估

论文 | 基于深度学习的序列推荐系统综述：概念、方法与实验评估

LibRec智能推荐

41+阅读 · 2019年5月9日

十种深度学习推荐系统代码实现，持续更新中！！！

十种深度学习推荐系统代码实现，持续更新中！！！

专知

113+阅读 · 2019年4月25日

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

专知

26+阅读 · 2019年2月12日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

专知

24+阅读 · 2018年9月6日

深度学习在推荐系统中的应用综述（最全）

深度学习在推荐系统中的应用综述（最全）

七月在线实验室

17+阅读 · 2018年5月5日

深度学习在推荐系统上的应用

深度学习在推荐系统上的应用

架构文摘

13+阅读 · 2018年2月22日

再生能源供电分布式无线随机接入关键技术

国家自然科学基金

0+阅读 · 2015年12月31日

信息隐藏技术在OFDM系统峰值功率问题中的应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于混合多址的物与物通信资源分配技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于智慧的下一代网络资源优化机制研究

国家自然科学基金

2+阅读 · 2015年12月31日

集中式协作频谱感知系统的多层次优化

国家自然科学基金

2+阅读 · 2015年12月31日

基于机会路由的数据分流及共享最优化研究

国家自然科学基金

0+阅读 · 2015年12月31日

噪声不确定下基于计算智能的多跳认知无线电网络协作频谱感知优化

国家自然科学基金

0+阅读 · 2015年12月31日

多输入-多输出网络量化系统的分析与综合研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向全双工的新型MIMO系统传输优化

国家自然科学基金

0+阅读 · 2015年12月31日

基于认知技术的分层异构网络能效分析与资源分配研究

国家自然科学基金

0+阅读 · 2014年12月31日

Energy-Efficient Routing Protocol in Vehicular Opportunistic Networks: A Dynamic Cluster-based Routing Using Deep Reinforcement Learning

Arxiv

0+阅读 · 2月17日

End-to-End NOMA with Perfect and Quantized CSI Over Rayleigh Fading Channels

Arxiv

0+阅读 · 2月13日

Deep learning based Channel Estimation and Beamforming in Movable Antenna Systems

Arxiv

0+阅读 · 2月10日

NOMA-Assisted Multi-BS MEC Networks for Delay-Sensitive and Computation-Intensive IoT Applications

Arxiv

0+阅读 · 2月7日

Federated Learning Meets Random Access: Energy-Efficient Uplink Resource Allocation

Arxiv

0+阅读 · 2月2日

Energy Efficient Downlink mMIMO Using Dynamic Antenna and Power Adaptation

Arxiv

0+阅读 · 1月28日

Design of RIS-aided mMTC+ Networks for Rate Maximization under the Finite Blocklength Regime with Imperfect Channel Knowledge

Arxiv

0+阅读 · 1月27日

Knowledge Distillation Driven Semantic NOMA for Image Transmission with Diffusion Model

Arxiv

0+阅读 · 1月26日

NOMADS: Non-Markovian Optimization-based Modeling for Approximate Dynamics with Spatially-homogeneous Memory

Arxiv

0+阅读 · 1月25日

Communication Methods in Multi-Agent Reinforcement Learning

Arxiv

0+阅读 · 1月19日

VIP会员

文章信息

相关主题

最新内容

《为码头高价值舰艇提供反无人机系统防御方案研究》80页

《为码头高价值舰艇提供反无人机系统防御方案研究》80页

专知会员服务

4+阅读 · 4月15日

《认知战作为一个战略域：媒体生态系统、社交网络与社会韧性的侵蚀》

《认知战作为一个战略域：媒体生态系统、社交网络与社会韧性的侵蚀》

专知会员服务

2+阅读 · 4月15日

美陆军设想无人系统司令部

美陆军设想无人系统司令部

专知会员服务

2+阅读 · 4月15日

【博士论文】已对齐人工智能系统的持久脆弱性

【博士论文】已对齐人工智能系统的持久脆弱性

专知会员服务

0+阅读 · 4月15日

人工智能对指挥控制的加速及其对陆军的影响（中文报告）

人工智能对指挥控制的加速及其对陆军的影响（中文报告）

专知会员服务

3+阅读 · 4月15日

扭曲还是编造？视频大语言模型幻觉研究综述

扭曲还是编造？视频大语言模型幻觉研究综述

专知会员服务

0+阅读 · 4月15日

美欧最新（2026）反无人机系统选项、技术与获取一览

美欧最新（2026）反无人机系统选项、技术与获取一览

专知会员服务

3+阅读 · 4月15日

《大语言模型作为战术规划支持工具——来自两项应用研究的结论》2026最新100页报告

《大语言模型作为战术规划支持工具——来自两项应用研究的结论》2026最新100页报告

专知会员服务

2+阅读 · 4月15日

《采用系统思维应对混合战争》125页

《采用系统思维应对混合战争》125页

专知会员服务

4+阅读 · 4月15日

战争机器学习：数据生态系统构建（155页）

战争机器学习：数据生态系统构建（155页）

专知会员服务

7+阅读 · 4月15日

乌克兰军事人工智能助手：NeoLens军事装备人工智能辅助维护平台

乌克兰军事人工智能助手：NeoLens军事装备人工智能辅助维护平台

专知会员服务

2+阅读 · 4月15日

2026 年 Agentic AI 工程师完全指南：一份系统化的学习路线图

2026 年 Agentic AI 工程师完全指南：一份系统化的学习路线图

专知会员服务

15+阅读 · 4月14日

内省扩散语言模型

内省扩散语言模型

专知会员服务

6+阅读 · 4月14日

美伊停火协议：评估、各方反应及美国会面临的问题

美伊停火协议：评估、各方反应及美国会面临的问题

专知会员服务

4+阅读 · 4月14日

国外反无人机系统与技术动态

国外反无人机系统与技术动态

专知会员服务

4+阅读 · 4月14日

相关VIP内容

面向深度研究系统的强化学习基础：综述

面向深度研究系统的强化学习基础：综述

专知会员服务

23+阅读 · 2025年9月22日

《多智能体系统的神经协调：多领域任务环境中基于深度学习的智能体最优选择框架》

《多智能体系统的神经协调：多领域任务环境中基于深度学习的智能体最优选择框架》

专知会员服务

25+阅读 · 2025年5月7日

同济等最新《多智能体强化学习》综述，43页pdf详述MARL方法、应用、展望与挑战

同济等最新《多智能体强化学习》综述，43页pdf详述MARL方法、应用、展望与挑战

专知会员服务

64+阅读 · 2023年5月19日

基于多智能体深度强化学习的体系任务分配方法

基于多智能体深度强化学习的体系任务分配方法

专知会员服务

157+阅读 · 2023年5月4日

《深度强化学习在集群系统中的应用》31页论文

《深度强化学习在集群系统中的应用》31页论文

专知会员服务

60+阅读 · 2023年3月14日

【博士论文】面向分布式深度学习的数据中心网络拓扑优化和流量调度

【博士论文】面向分布式深度学习的数据中心网络拓扑优化和流量调度

专知会员服务

29+阅读 · 2022年12月30日

《时间连通性作为非正交多址无线网络鲁棒性的度量》美海军2022最新151页博士论文

《时间连通性作为非正交多址无线网络鲁棒性的度量》美海军2022最新151页博士论文

专知会员服务

16+阅读 · 2022年12月27日

《深度学习在增强型无线通信系统设计中的应用》贝尔实验室 - 里昂大学2022最新168页博士论文

《深度学习在增强型无线通信系统设计中的应用》贝尔实验室 - 里昂大学2022最新168页博士论文

专知会员服务

26+阅读 · 2022年8月4日

分布式深度学习训练网络综述

专知会员服务

48+阅读 · 2021年2月2日

南洋理工大学，深度学习推荐系统综述

南洋理工大学，深度学习推荐系统综述

专知会员服务

177+阅读 · 2019年10月14日

热门VIP内容

开通专知VIP会员享更多权益服务

《认知战作为一个战略域：媒体生态系统、社交网络与社会韧性的侵蚀》

【博士论文】已对齐人工智能系统的持久脆弱性

《为码头高价值舰艇提供反无人机系统防御方案研究》80页

美陆军设想无人系统司令部

相关资讯

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知

58+阅读 · 2022年4月30日

多智能体强化学习（MARL）近年研究概览

多智能体强化学习（MARL）近年研究概览

PaperWeekly

38+阅读 · 2020年3月15日

论文 | 基于深度学习的序列推荐系统综述：概念、方法与实验评估

论文 | 基于深度学习的序列推荐系统综述：概念、方法与实验评估

LibRec智能推荐

41+阅读 · 2019年5月9日

十种深度学习推荐系统代码实现，持续更新中！！！

十种深度学习推荐系统代码实现，持续更新中！！！

专知

113+阅读 · 2019年4月25日

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

WSDM 2019教程—李航、何向南等，深度学习匹配在搜索和推荐中的应用

专知

26+阅读 · 2019年2月12日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

36页最新《深度学习在推荐系统上的应用》综述论文，209篇参考论文

专知

24+阅读 · 2018年9月6日

深度学习在推荐系统中的应用综述（最全）

深度学习在推荐系统中的应用综述（最全）

七月在线实验室

17+阅读 · 2018年5月5日

深度学习在推荐系统上的应用

深度学习在推荐系统上的应用

架构文摘

13+阅读 · 2018年2月22日

相关论文

Energy-Efficient Routing Protocol in Vehicular Opportunistic Networks: A Dynamic Cluster-based Routing Using Deep Reinforcement Learning

Arxiv

0+阅读 · 2月17日

End-to-End NOMA with Perfect and Quantized CSI Over Rayleigh Fading Channels

Arxiv

0+阅读 · 2月13日

Deep learning based Channel Estimation and Beamforming in Movable Antenna Systems

Arxiv

0+阅读 · 2月10日

NOMA-Assisted Multi-BS MEC Networks for Delay-Sensitive and Computation-Intensive IoT Applications

Arxiv

0+阅读 · 2月7日

Federated Learning Meets Random Access: Energy-Efficient Uplink Resource Allocation

Arxiv

0+阅读 · 2月2日

Energy Efficient Downlink mMIMO Using Dynamic Antenna and Power Adaptation

Arxiv

0+阅读 · 1月28日

Design of RIS-aided mMTC+ Networks for Rate Maximization under the Finite Blocklength Regime with Imperfect Channel Knowledge

Arxiv

0+阅读 · 1月27日

Knowledge Distillation Driven Semantic NOMA for Image Transmission with Diffusion Model

Arxiv

0+阅读 · 1月26日

NOMADS: Non-Markovian Optimization-based Modeling for Approximate Dynamics with Spatially-homogeneous Memory

Arxiv

0+阅读 · 1月25日

Communication Methods in Multi-Agent Reinforcement Learning

Arxiv

0+阅读 · 1月19日

相关基金

再生能源供电分布式无线随机接入关键技术

国家自然科学基金

0+阅读 · 2015年12月31日

信息隐藏技术在OFDM系统峰值功率问题中的应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于混合多址的物与物通信资源分配技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于智慧的下一代网络资源优化机制研究

国家自然科学基金

2+阅读 · 2015年12月31日

集中式协作频谱感知系统的多层次优化

国家自然科学基金

2+阅读 · 2015年12月31日

基于机会路由的数据分流及共享最优化研究

国家自然科学基金

0+阅读 · 2015年12月31日

噪声不确定下基于计算智能的多跳认知无线电网络协作频谱感知优化

国家自然科学基金

0+阅读 · 2015年12月31日

多输入-多输出网络量化系统的分析与综合研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向全双工的新型MIMO系统传输优化

国家自然科学基金

0+阅读 · 2015年12月31日

基于认知技术的分层异构网络能效分析与资源分配研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员