The integration of satellite communication networks with next-generation (NG) technologies is a promising approach towards global connectivity. However, the quality of services is highly dependant on the availability of accurate channel state information (CSI). Channel estimation in satellite communications is challenging due to the high propagation delay between terrestrial users and satellites, which results in outdated CSI observations on the satellite side. In this paper, we study the downlink transmission of multiple satellites acting as distributed base stations (BS) to mobile terrestrial users. We propose a multi-agent reinforcement learning (MARL) algorithm which aims for maximising the sum-rate of the users, while coping with the outdated CSI. We design a novel bi-level optimisation, procedure themes as dual stage proximal policy optimisation (DS-PPO), for tackling the problem of large continuous action spaces as well as of independent and non-identically distributed (non-IID) environments in MARL. Specifically, the first stage of DS-PPO maximises the sum-rate for an individual satellite and the second stage maximises the sum-rate when all the satellites cooperate to form a distributed multi-antenna BS. Our numerical results demonstrate the robustness of DS-PPO to CSI imperfections as well as the sum-rate improvement attached by the use of DS-PPO. In addition, we provide the convergence analysis for the DS-PPO along with the computational complexity.


翻译:卫星通信网络与下一代技术的融合是实现全球连接的一种前景广阔的方法。然而,服务质量高度依赖于准确信道状态信息的可用性。卫星通信中的信道估计具有挑战性,这是因为地面用户与卫星之间的高传播延迟,导致卫星端观测到的信道状态信息是过时的。本文研究了多颗卫星作为分布式基站向移动地面用户进行下行传输的场景。我们提出了一种多智能体强化学习算法,旨在最大化用户的总和速率,同时应对过时的信道状态信息。我们设计了一种新颖的双层优化过程,称为双阶段近端策略优化,以解决多智能体强化学习中大型连续动作空间以及独立且非同分布环境的问题。具体而言,DS-PPO的第一阶段最大化单个卫星的和速率,第二阶段则在所有卫星协作形成一个分布式多天线基站时最大化总和速率。我们的数值结果证明了DS-PPO对信道状态信息不完善的鲁棒性,以及使用DS-PPO所带来的和速率提升。此外,我们还提供了DS-PPO的收敛性分析及其计算复杂度。

0
下载
关闭预览

相关内容

面向军用卫星通信的更具韧性方案
专知会员服务
14+阅读 · 1月30日
《抗干扰协同无人机中继网络的多智能体深度强化学习》
专知会员服务
27+阅读 · 2025年12月31日
多智能体强化学习中的稳健且高效的通信
专知会员服务
25+阅读 · 2025年11月17日
《大型通信卫星星座的资源分配优化》316页
专知会员服务
39+阅读 · 2025年2月26日
《用于空战机动的分层多智能体强化学习》
专知会员服务
68+阅读 · 2023年10月5日
万字长文!《卫星通信中的人工智能综述》
专知会员服务
60+阅读 · 2022年8月8日
「基于通信的多智能体强化学习」 进展综述
数据受限条件下的多模态处理技术综述
专知
22+阅读 · 2022年7月16日
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
VIP会员
最新内容
大模型错因诊断分析
专知会员服务
0+阅读 · 今天14:58
视频生成基础模型进展
专知会员服务
0+阅读 · 今天14:53
《军事对抗环境中移动自组网的时敏信道分配》
专知会员服务
2+阅读 · 今天14:24
《关键任务型人工智能的可靠性》
专知会员服务
2+阅读 · 今天14:16
《对流层散射系统在军事通信网络中的应用前景》
人工智能军事技术在中东地区的扩散
专知会员服务
3+阅读 · 今天5:45
《军用5G基本战术网络研究与仿真》
专知会员服务
8+阅读 · 今天5:37
相关基金
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员