Group Relative Policy Optimization for Robust Blind Interference Alignment with Fluid Antennas - 专知论文

会员服务 ·

0

鲁棒 · 策略优化 · 盲干扰对齐 · 干扰对齐 · 对齐 ·

Group Relative Policy Optimization for Robust Blind Interference Alignment with Fluid Antennas

翻译：基于流体天线的鲁棒盲干扰对齐的组相对策略优化

Jianqiu Peng,Tong Zhang,Shuai Wang,Mingjie Shao,Hao Xu,Rui Wang

from arxiv, Accepted by IEEE ICC 2026

Fluid antenna system (FAS) leverages dynamic reconfigurability to unlock spatial degrees of freedom and reshape wireless channels. This paper proposes, for the first time, a robust fluid antenna-driven blind interference alignment (BIA) framework for a K-user MISO downlink under imperfect channel state information (CSI). We formulate a robust sum-rate maximization problem through optimizing fluid antenna positions. To solve this challenging non-convex problem, we employ group relative policy optimization (GRPO), a novel deep reinforcement learning algorithm that eliminates the critic network. This robust design reduces model size and floating point operations (FLOPs) by nearly half compared to proximal policy optimization (PPO) while significantly enhancing performance through group-based exploration that escapes bad local optima. Simulation results demonstrate that GRPO outperforms PPO by 4.17%, and a 100K-step pre-trained PPO by 30.29%. Due to error distribution learning, GRPO exceeds heuristic MaximumGain and RandomGain by 200.78% and 465.38%, respectively.

翻译：流体天线系统（FAS）利用动态可重构性来解锁空间自由度并重塑无线信道。本文首次提出了一种针对不完美信道状态信息（CSI）下K用户MISO下行链路的鲁棒流体天线驱动盲干扰对齐（BIA）框架。我们通过优化流体天线位置，构建了一个鲁棒的和速率最大化问题。为了解决这一具有挑战性的非凸问题，我们采用了组相对策略优化（GRPO），这是一种无需评论家网络的新型深度强化学习算法。与近端策略优化（PPO）相比，这种鲁棒设计将模型大小和浮点运算（FLOPs）减少了近一半，同时通过基于组的探索来逃离不良局部最优解，从而显著提升了性能。仿真结果表明，GRPO的性能优于PPO 4.17%，优于经过100K步预训练的PPO 30.29%。由于误差分布学习，GRPO的性能分别超过启发式MaximumGain和RandomGain方法200.78%和465.38%。

0

相关内容

《复合人工智能决策优势：面向军事行动的人类数字孪生智能体编队与群体建模》最新文献

《复合人工智能决策优势：面向军事行动的人类数字孪生智能体编队与群体建模》最新文献

专知会员服务

39+阅读 · 2025年9月26日

《基于扫频信号的射频模块与无人机干扰算法优化研究》

《基于扫频信号的射频模块与无人机干扰算法优化研究》

专知会员服务

16+阅读 · 2025年8月1日

《战场鲁棒路径规划》14页

《战场鲁棒路径规划》14页

专知会员服务

17+阅读 · 2025年5月13日

【NeurIPS2024】协作！迈向用于路径问题的鲁棒神经方法

【NeurIPS2024】协作！迈向用于路径问题的鲁棒神经方法

专知会员服务

15+阅读 · 2024年10月9日

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

专知会员服务

94+阅读 · 2022年12月2日

【MIT博士论文】非线性系统鲁棒验证与优化，123页pdf

【MIT博士论文】非线性系统鲁棒验证与优化，123页pdf

专知会员服务

29+阅读 · 2022年9月23日

【ICML2022】鲁棒强化学习的策略梯度法

【ICML2022】鲁棒强化学习的策略梯度法

专知会员服务

38+阅读 · 2022年5月21日

复杂网络能控性鲁棒性研究进展

专知会员服务

26+阅读 · 2021年6月9日

【干货书】鲁棒优化Robust Optimization，570页pdf

专知会员服务

144+阅读 · 2021年3月17日

【MIT】对抗鲁棒性的流形正则化，Manifold Regularization for Adversarial Robustness

【MIT】对抗鲁棒性的流形正则化，Manifold Regularization for Adversarial Robustness

专知会员服务

28+阅读 · 2020年3月11日

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

专知

69+阅读 · 2022年12月3日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

专知

69+阅读 · 2022年4月9日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

浅析Faiss在推荐系统中的应用及原理

浅析Faiss在推荐系统中的应用及原理

凡人机器学习

11+阅读 · 2020年5月5日

【泡泡一分钟】GOMSF——基于多传感器融合的图优化无人机鲁棒位姿估计方法

【泡泡一分钟】GOMSF——基于多传感器融合的图优化无人机鲁棒位姿估计方法

泡泡机器人SLAM

25+阅读 · 2019年7月2日

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

专知

42+阅读 · 2019年4月9日

基于车路协同的群体智能协同

基于车路协同的群体智能协同

智能交通技术

10+阅读 · 2019年1月23日

基于数据的分布式鲁棒优化算法及其应用【附PPT与视频资料】

基于数据的分布式鲁棒优化算法及其应用【附PPT与视频资料】

人工智能前沿讲习班

27+阅读 · 2018年12月13日

用Rasa NLU构建自己的中文NLU系统

用Rasa NLU构建自己的中文NLU系统

待字闺中

18+阅读 · 2017年9月18日

滤波天线及其阵列综合设计研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于广义输出调节的非线性多个体系统的协调控制与优化

国家自然科学基金

1+阅读 · 2015年12月31日

通信网络在不确定业务流量需求下的路由鲁棒性优化研究

国家自然科学基金

1+阅读 · 2015年12月31日

非线性切换系统在线鲁棒近似优化控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

被动声纳中的导向自校正鲁棒自适应波束形成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

干扰多址接入信道中干扰对齐与删除技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

不确定环境下具有稀疏特征的鲁棒投资组合选择问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

低保守性自适应鲁棒优化及其在含大规模风电电网调度中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于势场法的多智能体系统鲁棒自适应刚性编队控制

国家自然科学基金

3+阅读 · 2015年12月31日

非线性不确定系统的齐次控制理论及应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

Joint Transmit and Pinching Beamforming for Pinching Antenna Systems (PASS): Optimization-Based or Learning-Based?

Arxiv

0+阅读 · 2月2日

Robust and Secure Blockage-Aware Pinching Antenna-assisted Wireless Communication

Arxiv

0+阅读 · 1月30日

Joint Power Allocation and Antenna Placement for Pinching-Antenna Systems under User Location Uncertainty

Arxiv

0+阅读 · 1月27日

Group Relative Policy Optimization for Robust Blind Interference Alignment with Fluid Antennas

Arxiv

0+阅读 · 1月27日

Finite-Aperture Fluid Antenna Array Design: Analysis and Algorithm

Arxiv

0+阅读 · 1月26日

Study of Robust Power Allocation for User-Centric Cell-Free Massive MIMO Networks

Arxiv

0+阅读 · 1月24日

Ergodic Rate Analysis of Two-State Pinching-Antenna Systems

Arxiv

0+阅读 · 1月19日

Robust Stable Matchings: Dealing with Changes in Preferences

Arxiv

0+阅读 · 1月12日

On Achievable Spectral Efficiency Using Adaptive Transmission Over Terrestrial Coherent FSO Links

Arxiv

0+阅读 · 1月7日

Indoor Fluid Antenna Systems Enabled by Layout-Specific Modeling and Group Relative Policy Optimization

Arxiv

0+阅读 · 1月4日

VIP会员

文章信息

相关主题

盲干扰对齐

最新内容

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

1+阅读 · 今天13:56

多模态代码智能综述：从视觉输入到可执行代码系统

多模态代码智能综述：从视觉输入到可执行代码系统

专知会员服务

1+阅读 · 今天13:54

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

专知会员服务

4+阅读 · 今天8:18

《面向导弹有效发射时机的监督机器学习方法：基于超视距空战仿真》

《面向导弹有效发射时机的监督机器学习方法：基于超视距空战仿真》

专知会员服务

3+阅读 · 今天7:39

《通用大语言模型：无人机指挥与控制接口》最新40页

《通用大语言模型：无人机指挥与控制接口》最新40页

专知会员服务

10+阅读 · 今天7:33

《通过小型无人机系统将情报能力“作战化”》

《通过小型无人机系统将情报能力“作战化”》

专知会员服务

3+阅读 · 今天7:28

《神经安全型有人–无人协同：面向认知自适应作战能力的参考架构》

《神经安全型有人–无人协同：面向认知自适应作战能力的参考架构》

专知会员服务

6+阅读 · 今天7:14

《在指挥链中通过多准则决策分析传达指挥官意图：空战实验》

《在指挥链中通过多准则决策分析传达指挥官意图：空战实验》

专知会员服务

19+阅读 · 6月15日

消耗优势：美军的“精确规模化”概念

消耗优势：美军的“精确规模化”概念

专知会员服务

8+阅读 · 6月15日

五角大楼的AI优先战略及其对现代战争的启示：来自与伊朗冲突的经验教训

五角大楼的AI优先战略及其对现代战争的启示：来自与伊朗冲突的经验教训

专知会员服务

9+阅读 · 6月15日

《网络空间兵棋推演：挑战、局限性与混合路径》报告

《网络空间兵棋推演：挑战、局限性与混合路径》报告

专知会员服务

9+阅读 · 6月15日

《离线语言支持系统：面向空战战术决策》

《离线语言支持系统：面向空战战术决策》

专知会员服务

8+阅读 · 6月15日

《以通信为中心的6G–LLM架构：面向可扩展的战术自主防御车辆网络》

《以通信为中心的6G–LLM架构：面向可扩展的战术自主防御车辆网络》

专知会员服务

8+阅读 · 6月15日

ICML 2026｜ECA：面向开放式图文生成的高效持续对齐

ICML 2026｜ECA：面向开放式图文生成的高效持续对齐

专知会员服务

6+阅读 · 6月14日

可信智能体AI综述：安全、鲁棒性、隐私与系统安全

可信智能体AI综述：安全、鲁棒性、隐私与系统安全

专知会员服务

6+阅读 · 6月14日

相关VIP内容

《复合人工智能决策优势：面向军事行动的人类数字孪生智能体编队与群体建模》最新文献

《复合人工智能决策优势：面向军事行动的人类数字孪生智能体编队与群体建模》最新文献

专知会员服务

39+阅读 · 2025年9月26日

《基于扫频信号的射频模块与无人机干扰算法优化研究》

《基于扫频信号的射频模块与无人机干扰算法优化研究》

专知会员服务

16+阅读 · 2025年8月1日

《战场鲁棒路径规划》14页

《战场鲁棒路径规划》14页

专知会员服务

17+阅读 · 2025年5月13日

【NeurIPS2024】协作！迈向用于路径问题的鲁棒神经方法

【NeurIPS2024】协作！迈向用于路径问题的鲁棒神经方法

专知会员服务

15+阅读 · 2024年10月9日

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

专知会员服务

94+阅读 · 2022年12月2日

【MIT博士论文】非线性系统鲁棒验证与优化，123页pdf

【MIT博士论文】非线性系统鲁棒验证与优化，123页pdf

专知会员服务

29+阅读 · 2022年9月23日

【ICML2022】鲁棒强化学习的策略梯度法

【ICML2022】鲁棒强化学习的策略梯度法

专知会员服务

38+阅读 · 2022年5月21日

复杂网络能控性鲁棒性研究进展

专知会员服务

26+阅读 · 2021年6月9日

【干货书】鲁棒优化Robust Optimization，570页pdf

专知会员服务

144+阅读 · 2021年3月17日

【MIT】对抗鲁棒性的流形正则化，Manifold Regularization for Adversarial Robustness

【MIT】对抗鲁棒性的流形正则化，Manifold Regularization for Adversarial Robustness

专知会员服务

28+阅读 · 2020年3月11日

热门VIP内容

开通专知VIP会员享更多权益服务

多模态代码智能综述：从视觉输入到可执行代码系统

《面向导弹有效发射时机的监督机器学习方法：基于超视距空战仿真》

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

相关资讯

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

专知

69+阅读 · 2022年12月3日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

专知

69+阅读 · 2022年4月9日

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

【干货书-斯坦福】最优化算法，521页pdf，《Algorithms for Optimization》MIT出版社

专知

58+阅读 · 2020年7月2日

浅析Faiss在推荐系统中的应用及原理

浅析Faiss在推荐系统中的应用及原理

凡人机器学习

11+阅读 · 2020年5月5日

【泡泡一分钟】GOMSF——基于多传感器融合的图优化无人机鲁棒位姿估计方法

【泡泡一分钟】GOMSF——基于多传感器融合的图优化无人机鲁棒位姿估计方法

泡泡机器人SLAM

25+阅读 · 2019年7月2日

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

【论文笔记和代码梳理】RippleNet：基于知识图谱的用户偏好传播

专知

42+阅读 · 2019年4月9日

基于车路协同的群体智能协同

基于车路协同的群体智能协同

智能交通技术

10+阅读 · 2019年1月23日

基于数据的分布式鲁棒优化算法及其应用【附PPT与视频资料】

基于数据的分布式鲁棒优化算法及其应用【附PPT与视频资料】

人工智能前沿讲习班

27+阅读 · 2018年12月13日

用Rasa NLU构建自己的中文NLU系统

用Rasa NLU构建自己的中文NLU系统

待字闺中

18+阅读 · 2017年9月18日

相关论文

Joint Transmit and Pinching Beamforming for Pinching Antenna Systems (PASS): Optimization-Based or Learning-Based?

Arxiv

0+阅读 · 2月2日

Robust and Secure Blockage-Aware Pinching Antenna-assisted Wireless Communication

Arxiv

0+阅读 · 1月30日

Joint Power Allocation and Antenna Placement for Pinching-Antenna Systems under User Location Uncertainty

Arxiv

0+阅读 · 1月27日

Group Relative Policy Optimization for Robust Blind Interference Alignment with Fluid Antennas

Arxiv

0+阅读 · 1月27日

Finite-Aperture Fluid Antenna Array Design: Analysis and Algorithm

Arxiv

0+阅读 · 1月26日

Study of Robust Power Allocation for User-Centric Cell-Free Massive MIMO Networks

Arxiv

0+阅读 · 1月24日

Ergodic Rate Analysis of Two-State Pinching-Antenna Systems

Arxiv

0+阅读 · 1月19日

Robust Stable Matchings: Dealing with Changes in Preferences

Arxiv

0+阅读 · 1月12日

On Achievable Spectral Efficiency Using Adaptive Transmission Over Terrestrial Coherent FSO Links

Arxiv

0+阅读 · 1月7日

Indoor Fluid Antenna Systems Enabled by Layout-Specific Modeling and Group Relative Policy Optimization

Arxiv

0+阅读 · 1月4日

相关基金

滤波天线及其阵列综合设计研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于广义输出调节的非线性多个体系统的协调控制与优化

国家自然科学基金

1+阅读 · 2015年12月31日

通信网络在不确定业务流量需求下的路由鲁棒性优化研究

国家自然科学基金

1+阅读 · 2015年12月31日

非线性切换系统在线鲁棒近似优化控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

被动声纳中的导向自校正鲁棒自适应波束形成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

干扰多址接入信道中干扰对齐与删除技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

不确定环境下具有稀疏特征的鲁棒投资组合选择问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

低保守性自适应鲁棒优化及其在含大规模风电电网调度中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于势场法的多智能体系统鲁棒自适应刚性编队控制

国家自然科学基金

3+阅读 · 2015年12月31日

非线性不确定系统的齐次控制理论及应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

微信扫码咨询专知VIP会员