MAGRPO: Accelerated MARL Training for Fluid Antenna-Assisted Wireless Network Optimization - 专知论文

会员服务 ·

0

策略优化 · 多智能体 · 智能体 · 多智能体强化学习 · 系统 ·

MAGRPO: Accelerated MARL Training for Fluid Antenna-Assisted Wireless Network Optimization

翻译：MAGRPO: 面向流体天线辅助无线网络优化的加速多智能体强化学习训练

Wanzhe Wang,Tong Zhang,Hao Xu,Shuai Wang,Rui Wang,Kai-Kit Wong

from arxiv, 13 pages,9 figures

Fluid antenna system (FAS) becomes a promising paradigm for next-generation wireless networks, which enables position-flexible antenna elements that can dynamically adjust to more favorable channel conditions. However, the optimization of fluid antenna (FA) positions, beamforming, and power allocation in FA-assisted wireless networks is challenging, due to the non-convexity and the lack of base station (BS) coordination. In this paper, we first formulate this challenging optimization problem as a decentralized partially observable Markov decision process, and then propose a multi-agent group relative policy optimization (MAGRPO) algorithm under the centralized training decentralized execution (CTDE) paradigm. Compared with multi-agent proximal policy optimization (MAPPO), MAGRPO replaces the critic network with group relative advantage estimation. This design reduces computational complexity by nearly half under parameter sharing. Furthermore, we derive a variance upper bound of the cumulative reward, which scales with network parameters, e.g., the number of BSs, users, and FAs. Simulation results show that compared with wireless networks with fixed antenna positions, FA-assisted wireless networks achieve multiple-fold sum-rate enhancement. Moreover, the proposed MAGRPO attains sum-rates comparable to those of MAPPO in testing, while reducing training time by $30\% \sim 40\%$.

翻译：流体天线系统（FAS）为下一代无线网络提供了极具前景的范式，其配备位置灵活的单元件天线，可动态调整至更有利的信道条件。然而，由于非凸性及基站间缺乏协调，流体天线位置、波束赋形与功率分配在FA辅助无线网络中的优化极具挑战性。本文首先将该优化问题建模为去中心化部分可观测马尔可夫决策过程，进而提出基于集中式训练去中心化执行范式的多智能体群体相对策略优化算法。相较于多智能体近端策略优化，MAGRPO采用群体相对优势估计替代评论家网络。在参数共享机制下，该设计使计算复杂度降低近50%。此外，我们推导了累积奖励的方差上界，该上界随网络参数（如基站数、用户数与FA数）扩展。仿真结果表明，相较于固定天线位置的无线网络，FA辅助无线网络可实现数倍的和速率提升。同时，所提MAGRPO在测试阶段达到与MAPPO相当的和速率，同时训练时间减少30%-40%。

0

相关内容

策略优化

【ICML2026】MASPO：面向基于大语言模型的多智能体系统的联合提示词优化

【ICML2026】MASPO：面向基于大语言模型的多智能体系统的联合提示词优化

专知会员服务

12+阅读 · 5月9日

《抗干扰协同无人机中继网络的多智能体深度强化学习》

《抗干扰协同无人机中继网络的多智能体深度强化学习》

专知会员服务

28+阅读 · 2025年12月31日

《基于智能体的自组织任务分配：面向涌现型多智能体系统的强化学习》260页

《基于智能体的自组织任务分配：面向涌现型多智能体系统的强化学习》260页

专知会员服务

47+阅读 · 2025年5月6日

《先进优化与机器学习技术赋能高效无线通信网络》最新225页

《先进优化与机器学习技术赋能高效无线通信网络》最新225页

专知会员服务

36+阅读 · 2025年4月29日

《空天地一体化网络智能可靠无线通信增强研究》123页

《空天地一体化网络智能可靠无线通信增强研究》123页

专知会员服务

32+阅读 · 2025年4月2日

《无人机辅助的天空地一体化网络：学习算法技术综述》

《无人机辅助的天空地一体化网络：学习算法技术综述》

专知会员服务

51+阅读 · 2025年3月11日

《人工智能与天空地一体化网络的相互作用研究综述》61页长综述

《人工智能与天空地一体化网络的相互作用研究综述》61页长综述

专知会员服务

57+阅读 · 2025年3月6日

【新书】深度强化学习在可重构智能表面和无人机赋能智能6G通信中的应用

【新书】深度强化学习在可重构智能表面和无人机赋能智能6G通信中的应用

专知会员服务

27+阅读 · 2025年1月3日

《多无人机智能反射面辅助通信：通过深度强化学习进行多节点信道建模和公平和率优化》

《多无人机智能反射面辅助通信：通过深度强化学习进行多节点信道建模和公平和率优化》

专知会员服务

29+阅读 · 2024年2月1日

基于多智能体深度强化学习的体系任务分配方法

基于多智能体深度强化学习的体系任务分配方法

专知会员服务

158+阅读 · 2023年5月4日

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

专知

69+阅读 · 2022年12月3日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

55+阅读 · 2022年10月6日

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

专知

37+阅读 · 2020年7月2日

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

CVer

12+阅读 · 2020年6月30日

多智能体强化学习（MARL）近年研究概览

多智能体强化学习（MARL）近年研究概览

PaperWeekly

38+阅读 · 2020年3月15日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

【知识图谱】知识图谱+人工智能=新型网络信息体系

【知识图谱】知识图谱+人工智能=新型网络信息体系

产业智能官

14+阅读 · 2018年11月18日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

高通量天基信息网络容量与多址技术研究

国家自然科学基金

0+阅读 · 2017年12月31日

网络化非线性系统的协调控制及其在分布式可重构航天器中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

立体多面圆极化天线

国家自然科学基金

1+阅读 · 2015年12月31日

基于广义输出调节的非线性多个体系统的协调控制与优化

国家自然科学基金

1+阅读 · 2015年12月31日

噪声不确定下基于计算智能的多跳认知无线电网络协作频谱感知优化

国家自然科学基金

0+阅读 · 2015年12月31日

面向人体运动干扰和生物安全的无线体域网协作通信技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

弹性QoS的快速多目标优化软件定义卫星网络流控制方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

采用大规模分布式基站天线的移动通信系统容量分析与性能优化

国家自然科学基金

0+阅读 · 2015年12月31日

基于多域认知的空天信息网络智能拓扑构建机制基础研究

国家自然科学基金

0+阅读 · 2015年12月31日

大规模天线系统中基于网络编码的协作中继与信号处理技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

DRL-Based Antenna Position Optimization For MA-Assisted OTFS System Under Imperfect CSI

Arxiv

0+阅读 · 4月26日

GLo-MAPPO: Multi-Agent Deep Reinforcement Learning for Energy-Efficient UAV-Assisted LoRa Networks

Arxiv

0+阅读 · 4月18日

Jointly Correlated Dual-Side Fluid Antenna System

Arxiv

0+阅读 · 4月18日

Aerial Multi-Functional RIS in Fluid Antennas-Aided Full-Duplex Networks: A Self-Optimized Hybrid Deep Reinforcement Learning Approach

Arxiv

0+阅读 · 4月17日

Rotatable Antenna-Enabled Wireless Communication: Modeling and Optimization

Arxiv

0+阅读 · 3月28日

Rotatable Antenna-Empowered Wireless Networks: A Tutorial

Arxiv

0+阅读 · 3月28日

Rotatable Antenna-Empowered Wireless Networks: A Tutorial

Arxiv

0+阅读 · 3月26日

Spatio-Temporal Attention Enhanced Multi-Agent DRL for UAV-Assisted Wireless Networks with Limited Communications

Arxiv

0+阅读 · 3月23日

Effective Rank Analysis and Optimization of Flexible Antenna-Enabled Wireless Systems: Movable Antennas or Pinching Antennas?

Arxiv

0+阅读 · 3月21日

Fluid Antenna Networks Beyond Beamforming: An AI-Native Control Paradigm for 6G

Arxiv

0+阅读 · 3月20日

VIP会员

文章信息

相关主题

多智能体强化学习

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

3+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

4+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

6+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

6+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

21+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

【ICML2026】MASPO：面向基于大语言模型的多智能体系统的联合提示词优化

【ICML2026】MASPO：面向基于大语言模型的多智能体系统的联合提示词优化

专知会员服务

12+阅读 · 5月9日

《抗干扰协同无人机中继网络的多智能体深度强化学习》

《抗干扰协同无人机中继网络的多智能体深度强化学习》

专知会员服务

28+阅读 · 2025年12月31日

《基于智能体的自组织任务分配：面向涌现型多智能体系统的强化学习》260页

《基于智能体的自组织任务分配：面向涌现型多智能体系统的强化学习》260页

专知会员服务

47+阅读 · 2025年5月6日

《先进优化与机器学习技术赋能高效无线通信网络》最新225页

《先进优化与机器学习技术赋能高效无线通信网络》最新225页

专知会员服务

36+阅读 · 2025年4月29日

《空天地一体化网络智能可靠无线通信增强研究》123页

《空天地一体化网络智能可靠无线通信增强研究》123页

专知会员服务

32+阅读 · 2025年4月2日

《无人机辅助的天空地一体化网络：学习算法技术综述》

《无人机辅助的天空地一体化网络：学习算法技术综述》

专知会员服务

51+阅读 · 2025年3月11日

《人工智能与天空地一体化网络的相互作用研究综述》61页长综述

《人工智能与天空地一体化网络的相互作用研究综述》61页长综述

专知会员服务

57+阅读 · 2025年3月6日

【新书】深度强化学习在可重构智能表面和无人机赋能智能6G通信中的应用

【新书】深度强化学习在可重构智能表面和无人机赋能智能6G通信中的应用

专知会员服务

27+阅读 · 2025年1月3日

《多无人机智能反射面辅助通信：通过深度强化学习进行多节点信道建模和公平和率优化》

《多无人机智能反射面辅助通信：通过深度强化学习进行多节点信道建模和公平和率优化》

专知会员服务

29+阅读 · 2024年2月1日

基于多智能体深度强化学习的体系任务分配方法

基于多智能体深度强化学习的体系任务分配方法

专知会员服务

158+阅读 · 2023年5月4日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

专知

69+阅读 · 2022年12月3日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

55+阅读 · 2022年10月6日

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

【ICML2020-天津大学】多智能体深度强化学习中的Q值路径分解

专知

37+阅读 · 2020年7月2日

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

将U-Net用于图像去雾任务，一种具有密集特征融合的多尺度增强去雾网络 | CVPR2020

CVer

12+阅读 · 2020年6月30日

多智能体强化学习（MARL）近年研究概览

多智能体强化学习（MARL）近年研究概览

PaperWeekly

38+阅读 · 2020年3月15日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

【知识图谱】知识图谱+人工智能=新型网络信息体系

【知识图谱】知识图谱+人工智能=新型网络信息体系

产业智能官

14+阅读 · 2018年11月18日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

相关论文

DRL-Based Antenna Position Optimization For MA-Assisted OTFS System Under Imperfect CSI

Arxiv

0+阅读 · 4月26日

GLo-MAPPO: Multi-Agent Deep Reinforcement Learning for Energy-Efficient UAV-Assisted LoRa Networks

Arxiv

0+阅读 · 4月18日

Jointly Correlated Dual-Side Fluid Antenna System

Arxiv

0+阅读 · 4月18日

Aerial Multi-Functional RIS in Fluid Antennas-Aided Full-Duplex Networks: A Self-Optimized Hybrid Deep Reinforcement Learning Approach

Arxiv

0+阅读 · 4月17日

Rotatable Antenna-Enabled Wireless Communication: Modeling and Optimization

Arxiv

0+阅读 · 3月28日

Rotatable Antenna-Empowered Wireless Networks: A Tutorial

Arxiv

0+阅读 · 3月28日

Rotatable Antenna-Empowered Wireless Networks: A Tutorial

Arxiv

0+阅读 · 3月26日

Spatio-Temporal Attention Enhanced Multi-Agent DRL for UAV-Assisted Wireless Networks with Limited Communications

Arxiv

0+阅读 · 3月23日

Effective Rank Analysis and Optimization of Flexible Antenna-Enabled Wireless Systems: Movable Antennas or Pinching Antennas?

Arxiv

0+阅读 · 3月21日

Fluid Antenna Networks Beyond Beamforming: An AI-Native Control Paradigm for 6G

Arxiv

0+阅读 · 3月20日

相关基金

高通量天基信息网络容量与多址技术研究

国家自然科学基金

0+阅读 · 2017年12月31日

网络化非线性系统的协调控制及其在分布式可重构航天器中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

立体多面圆极化天线

国家自然科学基金

1+阅读 · 2015年12月31日

基于广义输出调节的非线性多个体系统的协调控制与优化

国家自然科学基金

1+阅读 · 2015年12月31日

噪声不确定下基于计算智能的多跳认知无线电网络协作频谱感知优化

国家自然科学基金

0+阅读 · 2015年12月31日

面向人体运动干扰和生物安全的无线体域网协作通信技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

弹性QoS的快速多目标优化软件定义卫星网络流控制方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

采用大规模分布式基站天线的移动通信系统容量分析与性能优化

国家自然科学基金

0+阅读 · 2015年12月31日

基于多域认知的空天信息网络智能拓扑构建机制基础研究

国家自然科学基金

0+阅读 · 2015年12月31日

大规模天线系统中基于网络编码的协作中继与信号处理技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员