Intelligent resource allocation in wireless networks via deep reinforcement learning - 专知论文

会员服务 ·

0

网络智能 · 系统 · 算法 · 深度强化学习 · 深度Q网络 ·

Intelligent resource allocation in wireless networks via deep reinforcement learning

翻译：基于深度强化学习的无线网络智能资源分配

Marie Diane Iradukunda,Chabi F. Elégbédé,Yaé Ulrich Gaba

from arxiv, 7 figures

This study addresses the challenge of optimal power allocation in stochastic wireless networks by employing a Deep Reinforcement Learning (DRL) framework. Specifically, we design a Deep Q-Network (DQN) agent capable of learning adaptive power control policies directly from channel state observations, effectively bypassing the need for explicit system models. We formulate the resource allocation problem as a Markov Decision Process (MDP) and benchmark the proposed approach against classical heuristics, including fixed allocation, random assignment, and the theoretical water-filling algorithm. Empirical results demonstrate that the DQN agent achieves a system throughput of 3.88 Mbps, effectively matching the upper limit of the water fill, while outperforming the random and fixed allocation strategies by approximately 73% and 27%, respectively. Moreover, the agent exhibits emergent fairness, maintaining a Jain's Index of 0.91, and successfully optimizes the trade-off between spectral efficiency and energy consumption. These findings substantiate the efficacy of model-free DRL as a robust and scalable solution for resource management in next-generation communication systems.

翻译：本研究通过采用深度强化学习框架，解决了随机无线网络中功率最优分配的难题。具体而言，我们设计了一个深度Q网络智能体，能够直接从信道状态观测中学习自适应功率控制策略，从而有效绕过了对显式系统模型的需求。我们将资源分配问题建模为马尔可夫决策过程，并将所提出的方法与经典启发式算法（包括固定分配、随机分配以及理论上的注水算法）进行了基准测试。实验结果表明，深度Q网络智能体实现了3.88 Mbps的系统吞吐量，有效匹配了注水算法的理论上限，同时分别以约73%和27%的优势超越了随机分配与固定分配策略。此外，该智能体展现出良好的公平性，维持了0.91的Jain指数，并成功优化了频谱效率与能耗之间的权衡关系。这些发现证实了无模型深度强化学习作为下一代通信系统中资源管理的一种鲁棒且可扩展解决方案的有效性。

0

相关内容

网络智能

【新书】深度强化学习在可重构智能表面和无人机赋能智能6G通信中的应用

【新书】深度强化学习在可重构智能表面和无人机赋能智能6G通信中的应用

专知会员服务

27+阅读 · 2025年1月3日

《基于深度强化学习的安全约束分布式多无人机协同》最新130页博士论文

《基于深度强化学习的安全约束分布式多无人机协同》最新130页博士论文

专知会员服务

69+阅读 · 2024年11月19日

基于强化学习的无人机自组网路由研究综述

基于强化学习的无人机自组网路由研究综述

专知会员服务

48+阅读 · 2023年9月9日

基于多智能体强化学习的协同目标分配

基于多智能体强化学习的协同目标分配

专知会员服务

141+阅读 · 2023年9月5日

基于深度强化学习的海上编队防空任务分配

基于深度强化学习的海上编队防空任务分配

专知会员服务

91+阅读 · 2023年8月14日

基于深度强化学习算法的无人机智能规避决策

基于深度强化学习算法的无人机智能规避决策

专知会员服务

84+阅读 · 2023年6月27日

基于多智能体深度强化学习的体系任务分配方法

基于多智能体深度强化学习的体系任务分配方法

专知会员服务

158+阅读 · 2023年5月4日

【AI+商业投资】法国兴业银行《深度强化学习在投资组合分配中的应用》26页PPT，Deep Reinforcement Learning for portfolio allocation

【AI+商业投资】法国兴业银行《深度强化学习在投资组合分配中的应用》26页PPT，Deep Reinforcement Learning for portfolio allocation

专知会员服务

24+阅读 · 2022年4月1日

无线网络中的分布式深度学习:概念、方法与应用，140页ppt，IEEE GLOBECOM 2020 Tutorial

无线网络中的分布式深度学习:概念、方法与应用，140页ppt，IEEE GLOBECOM 2020 Tutorial

专知会员服务

54+阅读 · 2020年11月27日

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

专知会员服务

26+阅读 · 2019年10月3日

【综述】多智能体强化学习算法理论研究

【综述】多智能体强化学习算法理论研究

深度强化学习实验室

16+阅读 · 2020年9月9日

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

专知

37+阅读 · 2020年7月2日

【DeepMind深度学习课程】神经网络基础，104页ppt，Neural Networks Foundations

【DeepMind深度学习课程】神经网络基础，104页ppt，Neural Networks Foundations

专知

13+阅读 · 2020年6月24日

当深度强化学习遇见图神经网络

当深度强化学习遇见图神经网络

专知

227+阅读 · 2019年10月21日

PlaNet 简介：用于强化学习的深度规划网络

PlaNet 简介：用于强化学习的深度规划网络

谷歌开发者

13+阅读 · 2019年3月16日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

【知识图谱】知识图谱+人工智能=新型网络信息体系

【知识图谱】知识图谱+人工智能=新型网络信息体系

产业智能官

14+阅读 · 2018年11月18日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

一文读懂深度适配网络（DAN）

一文读懂深度适配网络（DAN）

数据派THU

29+阅读 · 2017年7月14日

再生能源供电分布式无线随机接入关键技术

国家自然科学基金

0+阅读 · 2015年12月31日

网络化非线性系统的协调控制及其在分布式可重构航天器中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

面向用户体验的无线异构软件定义网络资源管理研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于智慧的下一代网络资源优化机制研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于投影动态系统理论的认知无线网络实时功率分配问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

光与无线融合接入网资源协同优化理论与实现机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

噪声不确定下基于计算智能的多跳认知无线电网络协作频谱感知优化

国家自然科学基金

0+阅读 · 2015年12月31日

云架构接入网中面向多业务的计算与无线资源分配研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于认知技术的分层异构网络能效分析与资源分配研究

国家自然科学基金

0+阅读 · 2014年12月31日

Bandwidth-constrained Variational Message Encoding for Cooperative Multi-agent Reinforcement Learning

Arxiv

0+阅读 · 2月4日

Federated Learning Meets Random Access: Energy-Efficient Uplink Resource Allocation

Arxiv

0+阅读 · 2月2日

Variational Quantum Circuit-Based Reinforcement Learning for Dynamic Portfolio Optimization

Arxiv

0+阅读 · 1月28日

Feasibility-Aware Learning-to-Optimize in Wireless Communication Resource Allocation

Arxiv

0+阅读 · 1月25日

Digital Twin-Empowered Deep Reinforcement Learning for Intelligent VNF Migration in Edge-Core Networks

Arxiv

0+阅读 · 1月21日

Safe Heterogeneous Multi-Agent RL with Communication Regularization for Coordinated Target Acquisition

Arxiv

0+阅读 · 1月13日

ReinFlow: Fine-tuning Flow Matching Policy with Online Reinforcement Learning

Arxiv

0+阅读 · 1月8日

Enabling Deep Reinforcement Learning Research for Energy Saving in Open RAN

Enabling Deep Reinforcement Learning Research for Energy Saving in Open RAN

Arxiv

0+阅读 · 1月6日

Enabling Deep Reinforcement Learning Research for Energy Saving in Open RAN

Arxiv

0+阅读 · 1月5日

Adaptive GPU Resource Allocation for Multi-Agent Collaborative Reasoning in Serverless Environments

Arxiv

0+阅读 · 1月1日

VIP会员

文章信息

相关主题

深度强化学习

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

2+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

2+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

4+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

3+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

3+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

【新书】深度强化学习在可重构智能表面和无人机赋能智能6G通信中的应用

【新书】深度强化学习在可重构智能表面和无人机赋能智能6G通信中的应用

专知会员服务

27+阅读 · 2025年1月3日

《基于深度强化学习的安全约束分布式多无人机协同》最新130页博士论文

《基于深度强化学习的安全约束分布式多无人机协同》最新130页博士论文

专知会员服务

69+阅读 · 2024年11月19日

基于强化学习的无人机自组网路由研究综述

基于强化学习的无人机自组网路由研究综述

专知会员服务

48+阅读 · 2023年9月9日

基于多智能体强化学习的协同目标分配

基于多智能体强化学习的协同目标分配

专知会员服务

141+阅读 · 2023年9月5日

基于深度强化学习的海上编队防空任务分配

基于深度强化学习的海上编队防空任务分配

专知会员服务

91+阅读 · 2023年8月14日

基于深度强化学习算法的无人机智能规避决策

基于深度强化学习算法的无人机智能规避决策

专知会员服务

84+阅读 · 2023年6月27日

基于多智能体深度强化学习的体系任务分配方法

基于多智能体深度强化学习的体系任务分配方法

专知会员服务

158+阅读 · 2023年5月4日

【AI+商业投资】法国兴业银行《深度强化学习在投资组合分配中的应用》26页PPT，Deep Reinforcement Learning for portfolio allocation

【AI+商业投资】法国兴业银行《深度强化学习在投资组合分配中的应用》26页PPT，Deep Reinforcement Learning for portfolio allocation

专知会员服务

24+阅读 · 2022年4月1日

无线网络中的分布式深度学习:概念、方法与应用，140页ppt，IEEE GLOBECOM 2020 Tutorial

无线网络中的分布式深度学习:概念、方法与应用，140页ppt，IEEE GLOBECOM 2020 Tutorial

专知会员服务

54+阅读 · 2020年11月27日

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

【强化学习研讨会|Microsoft Research】多智能体强化学习 Scalable and Robust Multi-Agent Reinforcement Learning，46页pdf，美国东北大学|Christopher Amato

专知会员服务

26+阅读 · 2019年10月3日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

【综述】多智能体强化学习算法理论研究

【综述】多智能体强化学习算法理论研究

深度强化学习实验室

16+阅读 · 2020年9月9日

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

专知

37+阅读 · 2020年7月2日

【DeepMind深度学习课程】神经网络基础，104页ppt，Neural Networks Foundations

【DeepMind深度学习课程】神经网络基础，104页ppt，Neural Networks Foundations

专知

13+阅读 · 2020年6月24日

当深度强化学习遇见图神经网络

当深度强化学习遇见图神经网络

专知

227+阅读 · 2019年10月21日

PlaNet 简介：用于强化学习的深度规划网络

PlaNet 简介：用于强化学习的深度规划网络

谷歌开发者

13+阅读 · 2019年3月16日

深度强化学习简介

深度强化学习简介

专知

30+阅读 · 2018年12月3日

【知识图谱】知识图谱+人工智能=新型网络信息体系

【知识图谱】知识图谱+人工智能=新型网络信息体系

产业智能官

14+阅读 · 2018年11月18日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

一文读懂深度适配网络（DAN）

一文读懂深度适配网络（DAN）

数据派THU

29+阅读 · 2017年7月14日

相关论文

Bandwidth-constrained Variational Message Encoding for Cooperative Multi-agent Reinforcement Learning

Arxiv

0+阅读 · 2月4日

Federated Learning Meets Random Access: Energy-Efficient Uplink Resource Allocation

Arxiv

0+阅读 · 2月2日

Variational Quantum Circuit-Based Reinforcement Learning for Dynamic Portfolio Optimization

Arxiv

0+阅读 · 1月28日

Feasibility-Aware Learning-to-Optimize in Wireless Communication Resource Allocation

Arxiv

0+阅读 · 1月25日

Digital Twin-Empowered Deep Reinforcement Learning for Intelligent VNF Migration in Edge-Core Networks

Arxiv

0+阅读 · 1月21日

Safe Heterogeneous Multi-Agent RL with Communication Regularization for Coordinated Target Acquisition

Arxiv

0+阅读 · 1月13日

ReinFlow: Fine-tuning Flow Matching Policy with Online Reinforcement Learning

Arxiv

0+阅读 · 1月8日

Enabling Deep Reinforcement Learning Research for Energy Saving in Open RAN

Enabling Deep Reinforcement Learning Research for Energy Saving in Open RAN

Arxiv

0+阅读 · 1月6日

Enabling Deep Reinforcement Learning Research for Energy Saving in Open RAN

Arxiv

0+阅读 · 1月5日

Adaptive GPU Resource Allocation for Multi-Agent Collaborative Reasoning in Serverless Environments

Arxiv

0+阅读 · 1月1日

相关基金

再生能源供电分布式无线随机接入关键技术

国家自然科学基金

0+阅读 · 2015年12月31日

网络化非线性系统的协调控制及其在分布式可重构航天器中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

面向用户体验的无线异构软件定义网络资源管理研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于智慧的下一代网络资源优化机制研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于投影动态系统理论的认知无线网络实时功率分配问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

光与无线融合接入网资源协同优化理论与实现机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

噪声不确定下基于计算智能的多跳认知无线电网络协作频谱感知优化

国家自然科学基金

0+阅读 · 2015年12月31日

云架构接入网中面向多业务的计算与无线资源分配研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于认知技术的分层异构网络能效分析与资源分配研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员