Robust Beam Codebooks for mmWave/THz Systems: Toward a Stochastic RL Approach - 专知论文

会员服务 ·

0

码本 · 鲁棒 · 毫米波 · 系统 · 强化学习 ·

Robust Beam Codebooks for mmWave/THz Systems: Toward a Stochastic RL Approach

翻译：面向毫米波/太赫兹系统的鲁棒波束码本：迈向随机强化学习方法

Anouar Nechi,Rainer Buchty,Mladen Berekovic,Saleh Mulhem

Millimeter-wave (mmWave) and terahertz (THz) massive MIMO systems often rely on predefined beamforming codebooks, which are usually suboptimal in Non-Line-of-Sight (NLoS) conditions and for hardware-limited transceivers. Reinforcement Learning (RL) enables adaptive, data-driven codebook design without explicit Channel State Information (CSI), but the robustness of such algorithms in practical conditions is underexplored. This paper introduces a robust multi-agent RL framework that learns beam codebooks directly from environmental feedback, eliminating the need for prior channel knowledge. Our method is well-suited for real-world deployments facing unpredictable propagation and hardware constraints. We conduct a comprehensive analysis of three off-policy algorithms, Deep Deterministic Policy Gradient (DDPG), Twin Delayed DDPG (TD3), and Soft Actor-Critic (SAC), evaluating their resilience to hardware impairments and feedback noise. Simulations show that SAC consistently outperforms deterministic methods, achieving superior beamforming gains and stability in NLoS scenarios, even under severe impairments. These results demonstrate the promise of RL-based codebook design for robust mmWave/THz massive MIMO systems.

翻译：毫米波（mmWave）与太赫兹（THz）大规模MIMO系统通常依赖预定义的波束赋形码本，这些码本在非视距（NLoS）条件下以及对硬件受限的收发机而言往往次优。强化学习（RL）能够在无需显式信道状态信息（CSI）的情况下实现自适应的数据驱动码本设计，然而此类算法在实际条件下的鲁棒性尚未得到充分探索。本文提出一种鲁棒的多智能体强化学习框架，该框架直接从环境反馈中学习波束码本，从而消除了对先验信道知识的需求。所提方法特别适用于面临不可预测传播环境与硬件约束的实际部署场景。我们对三种离策略算法——深度确定性策略梯度（DDPG）、双延迟DDPG（TD3）及柔性演员-评论家（SAC）——进行了全面分析，评估其对硬件损伤和反馈噪声的鲁棒性。仿真结果表明，即使在严重损伤条件下，SAC在NLoS场景中仍能持续优于确定性方法，实现卓越的波束赋形增益与稳定性。这些结果证明了基于强化学习的码本设计在构建鲁棒毫米波/太赫兹大规模MIMO系统中的巨大潜力。

0

相关内容

【NeurIPS2025】迈向鲁棒的零样本强化学习

【NeurIPS2025】迈向鲁棒的零样本强化学习

专知会员服务

14+阅读 · 2025年10月20日

【CMU博士论文】基于课程学习的鲁棒强化学习

【CMU博士论文】基于课程学习的鲁棒强化学习

专知会员服务

20+阅读 · 2025年3月27日

【CMU博士论文】通过课程学习实现鲁棒的强化学习

【CMU博士论文】通过课程学习实现鲁棒的强化学习

专知会员服务

25+阅读 · 2024年12月15日

《利用传感器融合和机器学习增强毫米波雷达功能》145页

《利用传感器融合和机器学习增强毫米波雷达功能》145页

专知会员服务

44+阅读 · 2024年3月21日

【MIT博士论文】在真实世界环境中的强化学习系统的鲁棒性，292页pdf

【MIT博士论文】在真实世界环境中的强化学习系统的鲁棒性，292页pdf

专知会员服务

42+阅读 · 2024年3月3日

【牛津大学博士论文】通过合成环境和离线数据实现高效且鲁棒的强化学习，229页pdf

【牛津大学博士论文】通过合成环境和离线数据实现高效且鲁棒的强化学习，229页pdf

专知会员服务

35+阅读 · 2024年1月21日

《分布式多智能体强化学习的编码》加州大学等

《分布式多智能体强化学习的编码》加州大学等

专知会员服务

56+阅读 · 2022年11月2日

《电力系统机器学习的鲁棒性》美海军研究生院2022最新64页论文

《电力系统机器学习的鲁棒性》美海军研究生院2022最新64页论文

专知会员服务

26+阅读 · 2022年11月2日

《使用深度卷积神经网络学习鲁棒射频指纹》美国空军技术学院2022最新131页博士论文

《使用深度卷积神经网络学习鲁棒射频指纹》美国空军技术学院2022最新131页博士论文

专知会员服务

25+阅读 · 2022年11月1日

【ICML2022】DRIBO:基于多视图信息瓶颈的鲁棒深度强化学习

【ICML2022】DRIBO:基于多视图信息瓶颈的鲁棒深度强化学习

专知会员服务

17+阅读 · 2022年8月13日

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

专知

10+阅读 · 2022年11月17日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

14+阅读 · 2022年10月15日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

30+阅读 · 2022年9月19日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

19+阅读 · 2022年7月11日

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

专知

69+阅读 · 2022年4月9日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知

16+阅读 · 2020年12月9日

DeepMind Nando（原牛津大学教授）强化学习最新进展，含图文、公式和代码，附102页PPT下载

DeepMind Nando（原牛津大学教授）强化学习最新进展，含图文、公式和代码，附102页PPT下载

专知

18+阅读 · 2019年11月15日

《变分自编码器（VAE）导论》93页书册，附PDF下载

《变分自编码器（VAE）导论》93页书册，附PDF下载

专知

61+阅读 · 2019年6月14日

CMU大学76页深度学习课程：变分自编码器（VAE, Variational Autoencoder）

CMU大学76页深度学习课程：变分自编码器（VAE, Variational Autoencoder）

专知

28+阅读 · 2018年8月15日

关于强化学习（附代码，练习和解答）

关于强化学习（附代码，练习和解答）

深度学习

38+阅读 · 2018年1月30日

混合预编码器的内在关联机制与结构优化

国家自然科学基金

0+阅读 · 2017年12月31日

多波束卫星通信中基于压缩感知的预编码设计与干扰消除技术

国家自然科学基金

1+阅读 · 2017年12月31日

宽带波束扫描太赫兹微带和介质反射阵研究

国家自然科学基金

0+阅读 · 2017年12月31日

用于毫米波无线通讯应用的高能效模数转换器

国家自然科学基金

0+阅读 · 2016年12月31日

基于超表面的太赫兹波动态调控器件研究

国家自然科学基金

0+阅读 · 2015年12月31日

带有随机干扰的非齐次马尔科夫跳变系统的鲁棒滤波研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于有机光电材料的太赫兹光调制器的研究

国家自然科学基金

0+阅读 · 2015年12月31日

被动声纳中的导向自校正鲁棒自适应波束形成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

Massive MIMO 系统中接收端低复杂度检测技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

碳纳米管微波毫米波（26.5 GHz–330 GHz）散射参数测量及特征参数提取研究

国家自然科学基金

0+阅读 · 2015年12月31日

Low-rank Preconditioning in Beamspace Domain For Massive MU-MIMO Long-Term Beamforming

Arxiv

0+阅读 · 5月4日

MIMO Systems Aided by Microwave Linear Analog Computers: Capacity-Achieving Architectures with Reduced Circuit Complexity

Arxiv

0+阅读 · 5月1日

Generalized Roth--Lempel Codes: NMDS Characterization, Hermitian Self-Orthogonality, and Quantum Constructions

Arxiv

0+阅读 · 4月25日

Robust Nonlinear Transform Coding: A Framework for Generalizable Joint Source-Channel Coding

Arxiv

0+阅读 · 4月23日

Multi-User mmWave Beam and Rate Adaptation via Combinatorial Satisficing Bandits

Arxiv

0+阅读 · 4月16日

Generalized Roth--Lempel Codes: NMDS Characterization, Hermitian Self-Orthogonality, and Quantum Constructions

Arxiv

0+阅读 · 4月13日

A Robust SINDy Autoencoder for Noisy Dynamical System Identification

Arxiv

0+阅读 · 4月6日

Secret Key Rate Analysis of RIS-Assisted THz MIMO CV-QKD Systems under Localized and Global Eavesdropping

Arxiv

0+阅读 · 3月30日

Beam-Coherence-Aware Two-Stage Digital Combining for mmWave MU-MIMO Systems

Arxiv

0+阅读 · 3月27日

Recent Advances in Near-Field Beam Training and Channel Estimation for XL-MIMO Systems

Arxiv

0+阅读 · 3月19日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

3+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

3+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

3+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

3+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

3+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

3+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

4+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

21+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

【NeurIPS2025】迈向鲁棒的零样本强化学习

【NeurIPS2025】迈向鲁棒的零样本强化学习

专知会员服务

14+阅读 · 2025年10月20日

【CMU博士论文】基于课程学习的鲁棒强化学习

【CMU博士论文】基于课程学习的鲁棒强化学习

专知会员服务

20+阅读 · 2025年3月27日

【CMU博士论文】通过课程学习实现鲁棒的强化学习

【CMU博士论文】通过课程学习实现鲁棒的强化学习

专知会员服务

25+阅读 · 2024年12月15日

《利用传感器融合和机器学习增强毫米波雷达功能》145页

《利用传感器融合和机器学习增强毫米波雷达功能》145页

专知会员服务

44+阅读 · 2024年3月21日

【MIT博士论文】在真实世界环境中的强化学习系统的鲁棒性，292页pdf

【MIT博士论文】在真实世界环境中的强化学习系统的鲁棒性，292页pdf

专知会员服务

42+阅读 · 2024年3月3日

【牛津大学博士论文】通过合成环境和离线数据实现高效且鲁棒的强化学习，229页pdf

【牛津大学博士论文】通过合成环境和离线数据实现高效且鲁棒的强化学习，229页pdf

专知会员服务

35+阅读 · 2024年1月21日

《分布式多智能体强化学习的编码》加州大学等

《分布式多智能体强化学习的编码》加州大学等

专知会员服务

56+阅读 · 2022年11月2日

《电力系统机器学习的鲁棒性》美海军研究生院2022最新64页论文

《电力系统机器学习的鲁棒性》美海军研究生院2022最新64页论文

专知会员服务

26+阅读 · 2022年11月2日

《使用深度卷积神经网络学习鲁棒射频指纹》美国空军技术学院2022最新131页博士论文

《使用深度卷积神经网络学习鲁棒射频指纹》美国空军技术学院2022最新131页博士论文

专知会员服务

25+阅读 · 2022年11月1日

【ICML2022】DRIBO:基于多视图信息瓶颈的鲁棒深度强化学习

【ICML2022】DRIBO:基于多视图信息瓶颈的鲁棒深度强化学习

专知会员服务

17+阅读 · 2022年8月13日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

专知

10+阅读 · 2022年11月17日

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

【牛津大学博士论文】强化学习系统的数据高效部署，165页pdf

专知

14+阅读 · 2022年10月15日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

30+阅读 · 2022年9月19日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

19+阅读 · 2022年7月11日

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

《以 CBM+ 和 PHM 为中心的数字孪生作战系统架构》美国海军研究生院最新论文，150页pdf

专知

69+阅读 · 2022年4月9日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知

16+阅读 · 2020年12月9日

DeepMind Nando（原牛津大学教授）强化学习最新进展，含图文、公式和代码，附102页PPT下载

DeepMind Nando（原牛津大学教授）强化学习最新进展，含图文、公式和代码，附102页PPT下载

专知

18+阅读 · 2019年11月15日

《变分自编码器（VAE）导论》93页书册，附PDF下载

《变分自编码器（VAE）导论》93页书册，附PDF下载

专知

61+阅读 · 2019年6月14日

CMU大学76页深度学习课程：变分自编码器（VAE, Variational Autoencoder）

CMU大学76页深度学习课程：变分自编码器（VAE, Variational Autoencoder）

专知

28+阅读 · 2018年8月15日

关于强化学习（附代码，练习和解答）

关于强化学习（附代码，练习和解答）

深度学习

38+阅读 · 2018年1月30日

相关论文

Low-rank Preconditioning in Beamspace Domain For Massive MU-MIMO Long-Term Beamforming

Arxiv

0+阅读 · 5月4日

MIMO Systems Aided by Microwave Linear Analog Computers: Capacity-Achieving Architectures with Reduced Circuit Complexity

Arxiv

0+阅读 · 5月1日

Generalized Roth--Lempel Codes: NMDS Characterization, Hermitian Self-Orthogonality, and Quantum Constructions

Arxiv

0+阅读 · 4月25日

Robust Nonlinear Transform Coding: A Framework for Generalizable Joint Source-Channel Coding

Arxiv

0+阅读 · 4月23日

Multi-User mmWave Beam and Rate Adaptation via Combinatorial Satisficing Bandits

Arxiv

0+阅读 · 4月16日

Generalized Roth--Lempel Codes: NMDS Characterization, Hermitian Self-Orthogonality, and Quantum Constructions

Arxiv

0+阅读 · 4月13日

A Robust SINDy Autoencoder for Noisy Dynamical System Identification

Arxiv

0+阅读 · 4月6日

Secret Key Rate Analysis of RIS-Assisted THz MIMO CV-QKD Systems under Localized and Global Eavesdropping

Arxiv

0+阅读 · 3月30日

Beam-Coherence-Aware Two-Stage Digital Combining for mmWave MU-MIMO Systems

Arxiv

0+阅读 · 3月27日

Recent Advances in Near-Field Beam Training and Channel Estimation for XL-MIMO Systems

Arxiv

0+阅读 · 3月19日

相关基金

混合预编码器的内在关联机制与结构优化

国家自然科学基金

0+阅读 · 2017年12月31日

多波束卫星通信中基于压缩感知的预编码设计与干扰消除技术

国家自然科学基金

1+阅读 · 2017年12月31日

宽带波束扫描太赫兹微带和介质反射阵研究

国家自然科学基金

0+阅读 · 2017年12月31日

用于毫米波无线通讯应用的高能效模数转换器

国家自然科学基金

0+阅读 · 2016年12月31日

基于超表面的太赫兹波动态调控器件研究

国家自然科学基金

0+阅读 · 2015年12月31日

带有随机干扰的非齐次马尔科夫跳变系统的鲁棒滤波研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于有机光电材料的太赫兹光调制器的研究

国家自然科学基金

0+阅读 · 2015年12月31日

被动声纳中的导向自校正鲁棒自适应波束形成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

Massive MIMO 系统中接收端低复杂度检测技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

碳纳米管微波毫米波（26.5 GHz–330 GHz）散射参数测量及特征参数提取研究

国家自然科学基金

0+阅读 · 2015年12月31日

微信扫码咨询专知VIP会员