基于群体相对策略优化的鲁棒盲干扰对齐与流体天线 (Group Relative Policy Optimization for Robust Blind Interference Alignment with Fluid Antennas) - 专知论文

会员服务 ·

0

鲁棒 · 策略优化 · 干扰对齐 · 对齐 · 盲干扰对齐 ·

Group Relative Policy Optimization for Robust Blind Interference Alignment with Fluid Antennas

翻译：基于群体相对策略优化的鲁棒盲干扰对齐与流体天线

Jianqiu Peng,Tong Zhang,Shuai Wang,Mingjie Shao,Hao Xu,Rui Wang

from arxiv, Accepted by IEEE ICC 2026

Fluid antenna system (FAS) leverages dynamic reconfigurability to unlock spatial degrees of freedom and reshape wireless channels. Blind interference alignment (BIA) aligns interference through antenna switching. This paper proposes, for the first time, a robust fluid antenna-driven BIA framework for a K-user MISO downlink under imperfect channel state information (CSI). We formulate a robust sum-rate maximization problem through optimizing fluid antenna positions (switching positions). To solve this challenging non-convex problem, we employ group relative policy optimization (GRPO), a novel deep reinforcement learning algorithm that eliminates the critic network. This robust design reduces model size and floating point operations (FLOPs) by nearly half compared to proximal policy optimization (PPO) while significantly enhancing performance through group-based exploration that escapes bad local optima. Simulation results demonstrate that GRPO outperforms PPO by 4.17%, and a 100K-step pre-trained PPO by 30.29%. Due to error distribution learning, GRPO exceeds heuristic MaximumGain and RandomGain by 200.78% and 465.38%, respectively.

翻译：流体天线系统（FAS）利用动态可重构性解锁空间自由度并重塑无线信道。盲干扰对齐（BIA）通过天线切换实现干扰对齐。本文首次针对不完美信道状态信息（CSI）下的K用户MISO下行链路，提出了一种鲁棒的流体天线驱动BIA框架。我们通过优化流体天线位置（切换位置）构建了一个鲁棒的和速率最大化问题。为解决这一具有挑战性的非凸问题，我们采用了群体相对策略优化（GRPO），这是一种无需评论家网络的新型深度强化学习算法。该鲁棒设计相较于近端策略优化（PPO），模型大小和浮点运算（FLOPs）减少了近一半，同时通过基于群体的探索逃离不良局部最优解，显著提升了性能。仿真结果表明，GRPO的性能优于PPO 4.17%，优于经过10万步预训练的PPO 30.29%。得益于误差分布学习，GRPO分别超过启发式MaximumGain和RandomGain算法200.78%和465.38%。

0

相关内容

《复合人工智能决策优势：面向军事行动的人类数字孪生智能体编队与群体建模》最新文献

《复合人工智能决策优势：面向军事行动的人类数字孪生智能体编队与群体建模》最新文献

专知会员服务

35+阅读 · 2025年9月26日

《基于扫频信号的射频模块与无人机干扰算法优化研究》

《基于扫频信号的射频模块与无人机干扰算法优化研究》

专知会员服务

14+阅读 · 2025年8月1日

《人工智能与天空地一体化网络的相互作用研究综述》61页长综述

《人工智能与天空地一体化网络的相互作用研究综述》61页长综述

专知会员服务

56+阅读 · 2025年3月6日

《为移动环境中的战术异构网络开发频谱感知合作与融合策略》105页

《为移动环境中的战术异构网络开发频谱感知合作与融合策略》105页

专知会员服务

21+阅读 · 2025年2月11日

【NeurIPS2024】协作！迈向用于路径问题的鲁棒神经方法

【NeurIPS2024】协作！迈向用于路径问题的鲁棒神经方法

专知会员服务

15+阅读 · 2024年10月9日

《为移动环境中的军事战术异构网络开发频谱感知协作与融合策略》105页

《为移动环境中的军事战术异构网络开发频谱感知协作与融合策略》105页

专知会员服务

36+阅读 · 2024年4月1日

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

专知会员服务

93+阅读 · 2022年12月2日

【MIT博士论文】非线性系统鲁棒验证与优化，123页pdf

【MIT博士论文】非线性系统鲁棒验证与优化，123页pdf

专知会员服务

29+阅读 · 2022年9月23日

【干货书】鲁棒优化Robust Optimization，570页pdf

专知会员服务

144+阅读 · 2021年3月17日

【MIT】对抗鲁棒性的流形正则化，Manifold Regularization for Adversarial Robustness

【MIT】对抗鲁棒性的流形正则化，Manifold Regularization for Adversarial Robustness

专知会员服务

28+阅读 · 2020年3月11日

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

专知

69+阅读 · 2022年12月3日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

中美国防创新体系分析《国防创新中的体系性竞争》，美国海军研究生院2022最新72页研究报告

中美国防创新体系分析《国防创新中的体系性竞争》，美国海军研究生院2022最新72页研究报告

专知

13+阅读 · 2022年5月28日

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

专知

67+阅读 · 2022年4月9日

浅析Faiss在推荐系统中的应用及原理

浅析Faiss在推荐系统中的应用及原理

凡人机器学习

11+阅读 · 2020年5月5日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

跨多个异构数据源的实体对齐

跨多个异构数据源的实体对齐

FCS

15+阅读 · 2019年3月13日

基于车路协同的群体智能协同

基于车路协同的群体智能协同

智能交通技术

10+阅读 · 2019年1月23日

基于数据的分布式鲁棒优化算法及其应用【附PPT与视频资料】

基于数据的分布式鲁棒优化算法及其应用【附PPT与视频资料】

人工智能前沿讲习班

27+阅读 · 2018年12月13日

无人机集群对抗研究的关键问题

无人机集群对抗研究的关键问题

无人机

65+阅读 · 2018年9月16日

滤波天线及其阵列综合设计研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于广义输出调节的非线性多个体系统的协调控制与优化

国家自然科学基金

1+阅读 · 2015年12月31日

通信网络在不确定业务流量需求下的路由鲁棒性优化研究

国家自然科学基金

1+阅读 · 2015年12月31日

非线性切换系统在线鲁棒近似优化控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

被动声纳中的导向自校正鲁棒自适应波束形成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

循环干扰信道的容量和高效编码传输方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于动态增益非线性干扰观测器的多智能体系统协调跟踪和干扰抑制

国家自然科学基金

1+阅读 · 2015年12月31日

干扰多址接入信道中干扰对齐与删除技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

差分双模介质谐振器天线特性分析及应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于势场法的多智能体系统鲁棒自适应刚性编队控制

国家自然科学基金

3+阅读 · 2015年12月31日

Reciprocity Calibration of Dual-Antenna Repeaters via MMSE Estimation

Arxiv

0+阅读 · 2月5日

Joint Transmit and Pinching Beamforming for Pinching Antenna Systems (PASS): Optimization-Based or Learning-Based?

Arxiv

0+阅读 · 2月2日

Robust and Secure Blockage-Aware Pinching Antenna-assisted Wireless Communication

Arxiv

0+阅读 · 1月30日

Joint Power Allocation and Antenna Placement for Pinching-Antenna Systems under User Location Uncertainty

Arxiv

0+阅读 · 1月27日

Finite-Aperture Fluid Antenna Array Design: Analysis and Algorithm

Arxiv

0+阅读 · 1月26日

Study of Robust Power Allocation for User-Centric Cell-Free Massive MIMO Networks

Arxiv

0+阅读 · 1月24日

Group Relative Policy Optimization for Robust Blind Interference Alignment with Fluid Antennas

Arxiv

0+阅读 · 1月20日

Ergodic Rate Analysis of Two-State Pinching-Antenna Systems

Arxiv

0+阅读 · 1月19日

Movable Antenna for Integrating Near-field Channel Estimation and Localization

Arxiv

0+阅读 · 1月13日

Indoor Fluid Antenna Systems Enabled by Layout-Specific Modeling and Group Relative Policy Optimization

Arxiv

0+阅读 · 1月4日

VIP会员

文章信息

相关主题

盲干扰对齐

相关VIP内容

《复合人工智能决策优势：面向军事行动的人类数字孪生智能体编队与群体建模》最新文献

《复合人工智能决策优势：面向军事行动的人类数字孪生智能体编队与群体建模》最新文献

专知会员服务

35+阅读 · 2025年9月26日

《基于扫频信号的射频模块与无人机干扰算法优化研究》

《基于扫频信号的射频模块与无人机干扰算法优化研究》

专知会员服务

14+阅读 · 2025年8月1日

《人工智能与天空地一体化网络的相互作用研究综述》61页长综述

《人工智能与天空地一体化网络的相互作用研究综述》61页长综述

专知会员服务

56+阅读 · 2025年3月6日

《为移动环境中的战术异构网络开发频谱感知合作与融合策略》105页

《为移动环境中的战术异构网络开发频谱感知合作与融合策略》105页

专知会员服务

21+阅读 · 2025年2月11日

【NeurIPS2024】协作！迈向用于路径问题的鲁棒神经方法

【NeurIPS2024】协作！迈向用于路径问题的鲁棒神经方法

专知会员服务

15+阅读 · 2024年10月9日

《为移动环境中的军事战术异构网络开发频谱感知协作与融合策略》105页

《为移动环境中的军事战术异构网络开发频谱感知协作与融合策略》105页

专知会员服务

36+阅读 · 2024年4月1日

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

专知会员服务

93+阅读 · 2022年12月2日

【MIT博士论文】非线性系统鲁棒验证与优化，123页pdf

【MIT博士论文】非线性系统鲁棒验证与优化，123页pdf

专知会员服务

29+阅读 · 2022年9月23日

【干货书】鲁棒优化Robust Optimization，570页pdf

专知会员服务

144+阅读 · 2021年3月17日

【MIT】对抗鲁棒性的流形正则化，Manifold Regularization for Adversarial Robustness

【MIT】对抗鲁棒性的流形正则化，Manifold Regularization for Adversarial Robustness

专知会员服务

28+阅读 · 2020年3月11日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】基于自适应表征的高效视觉建模

《多域作战中融合网络、电子战与动能机动》

AI智能体时代大模型安全风险与攻防新挑战

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

相关资讯

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

专知

69+阅读 · 2022年12月3日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

中美国防创新体系分析《国防创新中的体系性竞争》，美国海军研究生院2022最新72页研究报告

中美国防创新体系分析《国防创新中的体系性竞争》，美国海军研究生院2022最新72页研究报告

专知

13+阅读 · 2022年5月28日

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

专知

67+阅读 · 2022年4月9日

浅析Faiss在推荐系统中的应用及原理

浅析Faiss在推荐系统中的应用及原理

凡人机器学习

11+阅读 · 2020年5月5日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

跨多个异构数据源的实体对齐

跨多个异构数据源的实体对齐

FCS

15+阅读 · 2019年3月13日

基于车路协同的群体智能协同

基于车路协同的群体智能协同

智能交通技术

10+阅读 · 2019年1月23日

基于数据的分布式鲁棒优化算法及其应用【附PPT与视频资料】

基于数据的分布式鲁棒优化算法及其应用【附PPT与视频资料】

人工智能前沿讲习班

27+阅读 · 2018年12月13日

无人机集群对抗研究的关键问题

无人机集群对抗研究的关键问题

无人机

65+阅读 · 2018年9月16日

相关论文

Reciprocity Calibration of Dual-Antenna Repeaters via MMSE Estimation

Arxiv

0+阅读 · 2月5日

Joint Transmit and Pinching Beamforming for Pinching Antenna Systems (PASS): Optimization-Based or Learning-Based?

Arxiv

0+阅读 · 2月2日

Robust and Secure Blockage-Aware Pinching Antenna-assisted Wireless Communication

Arxiv

0+阅读 · 1月30日

Joint Power Allocation and Antenna Placement for Pinching-Antenna Systems under User Location Uncertainty

Arxiv

0+阅读 · 1月27日

Finite-Aperture Fluid Antenna Array Design: Analysis and Algorithm

Arxiv

0+阅读 · 1月26日

Study of Robust Power Allocation for User-Centric Cell-Free Massive MIMO Networks

Arxiv

0+阅读 · 1月24日

Group Relative Policy Optimization for Robust Blind Interference Alignment with Fluid Antennas

Arxiv

0+阅读 · 1月20日

Ergodic Rate Analysis of Two-State Pinching-Antenna Systems

Arxiv

0+阅读 · 1月19日

Movable Antenna for Integrating Near-field Channel Estimation and Localization

Arxiv

0+阅读 · 1月13日

Indoor Fluid Antenna Systems Enabled by Layout-Specific Modeling and Group Relative Policy Optimization

Arxiv

0+阅读 · 1月4日

相关基金

滤波天线及其阵列综合设计研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于广义输出调节的非线性多个体系统的协调控制与优化

国家自然科学基金

1+阅读 · 2015年12月31日

通信网络在不确定业务流量需求下的路由鲁棒性优化研究

国家自然科学基金

1+阅读 · 2015年12月31日

非线性切换系统在线鲁棒近似优化控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

被动声纳中的导向自校正鲁棒自适应波束形成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

循环干扰信道的容量和高效编码传输方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于动态增益非线性干扰观测器的多智能体系统协调跟踪和干扰抑制

国家自然科学基金

1+阅读 · 2015年12月31日

干扰多址接入信道中干扰对齐与删除技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

差分双模介质谐振器天线特性分析及应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于势场法的多智能体系统鲁棒自适应刚性编队控制

国家自然科学基金

3+阅读 · 2015年12月31日

微信扫码咨询专知VIP会员