SliceFed: Federated Constrained Multi-Agent DRL for Dynamic Spectrum Slicing in 6G - 专知论文

会员服务 ·

0

频谱 · 约束 · 6G · 时延 · 多智能体深度强化学习 ·

SliceFed: Federated Constrained Multi-Agent DRL for Dynamic Spectrum Slicing in 6G

翻译：SliceFed：面向6G动态频谱切片的联邦约束多智能体深度强化学习

Hossein Mohammadi,Seyed Bagher Hashemi Natanzi,Ramak Nassiri,Jamshid Hassanpour,Bo Tang,Vuk Marojevic

from arxiv, 4 figures, 3 algorithms charts

Dynamic spectrum slicing is a critical enabler for 6G Radio Access Networks (RANs), allowing the coexistence of heterogeneous services. However, optimizing resource allocation in dense, interference-limited deployments remains challenging due to non-stationary channel dynamics, strict Quality-of-Service (QoS) requirements, and the need for data privacy. In this paper, we propose SliceFed, a novel Federated Constrained Multi-Agent Deep Reinforcement Learning (F-MADRL) framework. SliceFed formulates the slicing problem as a Constrained Markov Decision Process (CMDP) where autonomous gNB agents maximize spectral efficiency while explicitly satisfying inter-cell interference budgets and hard ultra-reliable low-latency communication (URLLC) latency deadlines. We employ a Lagrangian primal-dual approach integrated with Proximal Policy Optimization (PPO) to enforce constraints, while Federated Averaging enables collaborative learning without exchanging raw local data. Extensive simulations in a dense multi-cell environment demonstrate that SliceFed converges to a stable, safety-aware policy. Unlike heuristic and unconstrained baselines, SliceFed achieves nearly 100% satisfaction of 1~ms URLLC latency deadlines and exhibits superior robustness to traffic load variations, verifying its potential for reliable and scalable 6G spectrum management.

翻译：动态频谱切片是实现6G无线接入网（RAN）中异构服务共存的关键使能技术。然而，在密集且干扰受限的部署场景中，由于非平稳的信道动态特性、严格的服务质量（QoS）要求以及数据隐私保护需求，资源分配优化仍面临挑战。本文提出SliceFed，一种新颖的联邦约束多智能体深度强化学习（F-MADRL）框架。SliceFed将频谱切片问题建模为约束马尔可夫决策过程（CMDP），其中自主的gNB智能体在明确满足小区间干扰预算与严格的超可靠低时延通信（URLLC）时延截止期限的同时，最大化频谱效率。我们采用与近端策略优化（PPO）相结合的拉格朗日对偶方法以强化约束条件，同时通过联邦平均实现无需交换原始本地数据的协同学习。在密集多小区环境中的大量仿真表明，SliceFed能够收敛至稳定且具备安全意识的策略。与启发式及无约束基线方法相比，SliceFed实现了对1毫秒URLLC时延截止期限的近100%满足率，并对流量负载变化展现出卓越的鲁棒性，验证了其在可靠且可扩展的6G频谱管理方面的潜力。

0

相关内容

《抗干扰协同无人机中继网络的多智能体深度强化学习》

《抗干扰协同无人机中继网络的多智能体深度强化学习》

专知会员服务

28+阅读 · 2025年12月31日

《多智能体系统的神经协调：多领域任务环境中基于深度学习的智能体最优选择框架》

《多智能体系统的神经协调：多领域任务环境中基于深度学习的智能体最优选择框架》

专知会员服务

27+阅读 · 2025年5月7日

【新书】深度强化学习在可重构智能表面和无人机赋能智能6G通信中的应用

【新书】深度强化学习在可重构智能表面和无人机赋能智能6G通信中的应用

专知会员服务

27+阅读 · 2025年1月3日

《可重构智能表面 (RIS)：下一代一体化传感与通信的关键？》

《可重构智能表面 (RIS)：下一代一体化传感与通信的关键？》

专知会员服务

34+阅读 · 2024年3月14日

最新论文《基于无人机基站的下一代物联网：群体智能方法的比较》西马其顿大学等高校6位 Senior Member, IEEE，Drone-Base-Station for Next-Generation Internet-of-Things: A Comparison of Swarm Intelligence Approaches

最新论文《基于无人机基站的下一代物联网：群体智能方法的比较》西马其顿大学等高校6位 Senior Member, IEEE，Drone-Base-Station for Next-Generation Internet-of-Things: A Comparison of Swarm Intelligence Approaches

专知会员服务

32+阅读 · 2022年4月7日

最新论文《战术网络的强化学习环境：基于多智能体的场景生成》德国弗劳恩霍夫研究所

最新论文《战术网络的强化学习环境：基于多智能体的场景生成》德国弗劳恩霍夫研究所

专知会员服务

148+阅读 · 2022年4月5日

上海科技大学石远明等《联邦机器学习在6G中的机会与挑战》，附133页PPT

上海科技大学石远明等《联邦机器学习在6G中的机会与挑战》，附133页PPT

专知会员服务

28+阅读 · 2022年3月28日

《6G 可见光通信技术白皮书（2022）》，中国移动通信有限公司研究院

《6G 可见光通信技术白皮书（2022）》，中国移动通信有限公司研究院

专知会员服务

19+阅读 · 2022年3月23日

【AI/ML+6G】22页pdf为你解读AI/ML如何助力6G发展？（附报告）

【AI/ML+6G】22页pdf为你解读AI/ML如何助力6G发展？（附报告）

专知会员服务

39+阅读 · 2022年3月15日

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

专知会员服务

27+阅读 · 2020年3月24日

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知

39+阅读 · 2023年4月11日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

55+阅读 · 2022年10月6日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

ICCV 2019 开源论文 | 适用于视频分割的全新Attention机制

ICCV 2019 开源论文 | 适用于视频分割的全新Attention机制

PaperWeekly

10+阅读 · 2019年11月9日

专家报告|深度学习+图像多模态融合

专家报告|深度学习+图像多模态融合

中国图象图形学报

12+阅读 · 2019年10月23日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

【泡泡点云时空】SpiderCNN：利用参数化卷积滤波进行点集深度学习（ECCV2018-13）

【泡泡点云时空】SpiderCNN：利用参数化卷积滤波进行点集深度学习（ECCV2018-13）

泡泡机器人SLAM

10+阅读 · 2018年11月8日

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

机器之心

16+阅读 · 2018年3月12日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

面向5G频谱共享的群智频谱数据统计学习方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

集中式协作频谱感知系统的多层次优化

国家自然科学基金

2+阅读 · 2015年12月31日

基于滤波器组多载波调制技术的动态频谱共享研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向无线多媒体传感器网络的高效压缩视频感知

国家自然科学基金

0+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

动态自适应的可伸缩视频流媒体组播编码-传输联合优化

国家自然科学基金

0+阅读 · 2015年12月31日

噪声不确定下基于计算智能的多跳认知无线电网络协作频谱感知优化

国家自然科学基金

0+阅读 · 2015年12月31日

高频谱效率/动态可重构的光码分多址技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

动态群稀疏约束场景知识建模的感兴趣监控目标超分辨率重建

国家自然科学基金

1+阅读 · 2014年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

FLEX: Joint UL/DL and QoS-Aware Scheduling for Dynamic TDD in Industrial 5G and Beyond

Arxiv

0+阅读 · 4月16日

Network Slice Embedding over Space Division Multiplexed Elastic Optical Networks

Arxiv

0+阅读 · 4月13日

FORSLICE: An Automated Formal Framework for Efficient PRB-Allocation towards Slicing Multiple Network Services

Arxiv

0+阅读 · 4月9日

Optimisation of Resource Allocation in Heterogeneous Wireless Networks Using Deep Reinforcement Learning

Arxiv

0+阅读 · 4月7日

UAV-Assisted Resilience in 6G and Beyond Network Energy Saving: A Multi-Agent DRL Approach

Arxiv

0+阅读 · 4月7日

DRASTIC: A Dynamic Resource Allocation Framework over 6G Network Slicing in Task-aware Closed-Loop Tactile Internet Applications

Arxiv

0+阅读 · 3月28日

FLEX: Joint UL/DL and QoS-Aware Scheduling for Dynamic TDD in Industrial 5G and Beyond

Arxiv

0+阅读 · 3月21日

SliceMapper: Intelligent Mapping of O-CU and O-DU onto O-Cloud Sites in 6G O-RAN

Arxiv

0+阅读 · 3月16日

Intelligent 6G Edge Connectivity: A Knowledge Driven Optimization Framework for Small Cell Selection

Arxiv

0+阅读 · 3月12日

Hierarchical Decision Mamba Meets Agentic AI: A Novel Approach for RAN Slicing in 6G

Arxiv

0+阅读 · 2月24日

VIP会员

文章信息

相关主题

多智能体深度强化学习

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

4+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

5+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

9+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

6+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

8+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

7+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

11+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

5+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

7+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

7+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

6+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

7+阅读 · 6月16日

相关VIP内容

《抗干扰协同无人机中继网络的多智能体深度强化学习》

《抗干扰协同无人机中继网络的多智能体深度强化学习》

专知会员服务

28+阅读 · 2025年12月31日

《多智能体系统的神经协调：多领域任务环境中基于深度学习的智能体最优选择框架》

《多智能体系统的神经协调：多领域任务环境中基于深度学习的智能体最优选择框架》

专知会员服务

27+阅读 · 2025年5月7日

【新书】深度强化学习在可重构智能表面和无人机赋能智能6G通信中的应用

【新书】深度强化学习在可重构智能表面和无人机赋能智能6G通信中的应用

专知会员服务

27+阅读 · 2025年1月3日

《可重构智能表面 (RIS)：下一代一体化传感与通信的关键？》

《可重构智能表面 (RIS)：下一代一体化传感与通信的关键？》

专知会员服务

34+阅读 · 2024年3月14日

最新论文《基于无人机基站的下一代物联网：群体智能方法的比较》西马其顿大学等高校6位 Senior Member, IEEE，Drone-Base-Station for Next-Generation Internet-of-Things: A Comparison of Swarm Intelligence Approaches

最新论文《基于无人机基站的下一代物联网：群体智能方法的比较》西马其顿大学等高校6位 Senior Member, IEEE，Drone-Base-Station for Next-Generation Internet-of-Things: A Comparison of Swarm Intelligence Approaches

专知会员服务

32+阅读 · 2022年4月7日

最新论文《战术网络的强化学习环境：基于多智能体的场景生成》德国弗劳恩霍夫研究所

最新论文《战术网络的强化学习环境：基于多智能体的场景生成》德国弗劳恩霍夫研究所

专知会员服务

148+阅读 · 2022年4月5日

上海科技大学石远明等《联邦机器学习在6G中的机会与挑战》，附133页PPT

上海科技大学石远明等《联邦机器学习在6G中的机会与挑战》，附133页PPT

专知会员服务

28+阅读 · 2022年3月28日

《6G 可见光通信技术白皮书（2022）》，中国移动通信有限公司研究院

《6G 可见光通信技术白皮书（2022）》，中国移动通信有限公司研究院

专知会员服务

19+阅读 · 2022年3月23日

【AI/ML+6G】22页pdf为你解读AI/ML如何助力6G发展？（附报告）

【AI/ML+6G】22页pdf为你解读AI/ML如何助力6G发展？（附报告）

专知会员服务

39+阅读 · 2022年3月15日

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

【CVPR2020-Oral-计算所-旷视】学习用于语义分割的动态路由，Learning Dynamic Routing

专知会员服务

27+阅读 · 2020年3月24日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知

39+阅读 · 2023年4月11日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

55+阅读 · 2022年10月6日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

ICCV 2019 开源论文 | 适用于视频分割的全新Attention机制

ICCV 2019 开源论文 | 适用于视频分割的全新Attention机制

PaperWeekly

10+阅读 · 2019年11月9日

专家报告|深度学习+图像多模态融合

专家报告|深度学习+图像多模态融合

中国图象图形学报

12+阅读 · 2019年10月23日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

【泡泡点云时空】SpiderCNN：利用参数化卷积滤波进行点集深度学习（ECCV2018-13）

【泡泡点云时空】SpiderCNN：利用参数化卷积滤波进行点集深度学习（ECCV2018-13）

泡泡机器人SLAM

10+阅读 · 2018年11月8日

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

CVPR 2018 | 优于Mask R-CNN，港中文&腾讯优图提出PANet实例分割框架

机器之心

16+阅读 · 2018年3月12日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

相关论文

FLEX: Joint UL/DL and QoS-Aware Scheduling for Dynamic TDD in Industrial 5G and Beyond

Arxiv

0+阅读 · 4月16日

Network Slice Embedding over Space Division Multiplexed Elastic Optical Networks

Arxiv

0+阅读 · 4月13日

FORSLICE: An Automated Formal Framework for Efficient PRB-Allocation towards Slicing Multiple Network Services

Arxiv

0+阅读 · 4月9日

Optimisation of Resource Allocation in Heterogeneous Wireless Networks Using Deep Reinforcement Learning

Arxiv

0+阅读 · 4月7日

UAV-Assisted Resilience in 6G and Beyond Network Energy Saving: A Multi-Agent DRL Approach

Arxiv

0+阅读 · 4月7日

DRASTIC: A Dynamic Resource Allocation Framework over 6G Network Slicing in Task-aware Closed-Loop Tactile Internet Applications

Arxiv

0+阅读 · 3月28日

FLEX: Joint UL/DL and QoS-Aware Scheduling for Dynamic TDD in Industrial 5G and Beyond

Arxiv

0+阅读 · 3月21日

SliceMapper: Intelligent Mapping of O-CU and O-DU onto O-Cloud Sites in 6G O-RAN

Arxiv

0+阅读 · 3月16日

Intelligent 6G Edge Connectivity: A Knowledge Driven Optimization Framework for Small Cell Selection

Arxiv

0+阅读 · 3月12日

Hierarchical Decision Mamba Meets Agentic AI: A Novel Approach for RAN Slicing in 6G

Arxiv

0+阅读 · 2月24日

相关基金

面向5G频谱共享的群智频谱数据统计学习方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

集中式协作频谱感知系统的多层次优化

国家自然科学基金

2+阅读 · 2015年12月31日

基于滤波器组多载波调制技术的动态频谱共享研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向无线多媒体传感器网络的高效压缩视频感知

国家自然科学基金

0+阅读 · 2015年12月31日

具有动态不确定性的下三角多智能体系统分布式自适应协同控制

国家自然科学基金

3+阅读 · 2015年12月31日

动态自适应的可伸缩视频流媒体组播编码-传输联合优化

国家自然科学基金

0+阅读 · 2015年12月31日

噪声不确定下基于计算智能的多跳认知无线电网络协作频谱感知优化

国家自然科学基金

0+阅读 · 2015年12月31日

高频谱效率/动态可重构的光码分多址技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

动态群稀疏约束场景知识建模的感兴趣监控目标超分辨率重建

国家自然科学基金

1+阅读 · 2014年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员