Multi-Agent Reinforcement Learning Counteracts Delayed CSI in Multi-Satellite Systems - 专知论文

会员服务 ·

0

信道状态信息 · DirectShow · 多智能体强化学习 · 多智能体 · 系统 ·

Multi-Agent Reinforcement Learning Counteracts Delayed CSI in Multi-Satellite Systems

翻译：多智能体强化学习应对多卫星系统中的延迟信道状态信息

Marios Aristodemou,Yasaman Omid,Sangarapillai Lambotharan,Mahsa Derakhshan,Lajos Hanzo

from arxiv, 12 pages, 6 Figures, Submit to IEEE Transactions of Vehicular Technology. It has been reviewed once

The integration of satellite communication networks with next-generation (NG) technologies is a promising approach towards global connectivity. However, the quality of services is highly dependant on the availability of accurate channel state information (CSI). Channel estimation in satellite communications is challenging due to the high propagation delay between terrestrial users and satellites, which results in outdated CSI observations on the satellite side. In this paper, we study the downlink transmission of multiple satellites acting as distributed base stations (BS) to mobile terrestrial users. We propose a multi-agent reinforcement learning (MARL) algorithm which aims for maximising the sum-rate of the users, while coping with the outdated CSI. We design a novel bi-level optimisation, procedure themes as dual stage proximal policy optimisation (DS-PPO), for tackling the problem of large continuous action spaces as well as of independent and non-identically distributed (non-IID) environments in MARL. Specifically, the first stage of DS-PPO maximises the sum-rate for an individual satellite and the second stage maximises the sum-rate when all the satellites cooperate to form a distributed multi-antenna BS. Our numerical results demonstrate the robustness of DS-PPO to CSI imperfections as well as the sum-rate improvement attached by the use of DS-PPO. In addition, we provide the convergence analysis for the DS-PPO along with the computational complexity.

翻译：卫星通信网络与下一代技术的融合是实现全球连接的一种前景广阔的方法。然而，服务质量高度依赖于准确信道状态信息的可用性。卫星通信中的信道估计具有挑战性，这是因为地面用户与卫星之间的高传播延迟，导致卫星端观测到的信道状态信息是过时的。本文研究了多颗卫星作为分布式基站向移动地面用户进行下行传输的场景。我们提出了一种多智能体强化学习算法，旨在最大化用户的总和速率，同时应对过时的信道状态信息。我们设计了一种新颖的双层优化过程，称为双阶段近端策略优化，以解决多智能体强化学习中大型连续动作空间以及独立且非同分布环境的问题。具体而言，DS-PPO的第一阶段最大化单个卫星的和速率，第二阶段则在所有卫星协作形成一个分布式多天线基站时最大化总和速率。我们的数值结果证明了DS-PPO对信道状态信息不完善的鲁棒性，以及使用DS-PPO所带来的和速率提升。此外，我们还提供了DS-PPO的收敛性分析及其计算复杂度。

0

相关内容

信道状态信息

信道状态信息

多智能体通信：多智能体强化学习到涌现语言和大语言模型的综述

多智能体通信：多智能体强化学习到涌现语言和大语言模型的综述

专知会员服务

17+阅读 · 2月13日

面向军用卫星通信的更具韧性方案

面向军用卫星通信的更具韧性方案

专知会员服务

17+阅读 · 1月30日

《抗干扰协同无人机中继网络的多智能体深度强化学习》

《抗干扰协同无人机中继网络的多智能体深度强化学习》

专知会员服务

28+阅读 · 2025年12月31日

多智能体强化学习中的稳健且高效的通信

多智能体强化学习中的稳健且高效的通信

专知会员服务

26+阅读 · 2025年11月17日

中文版 | 多智能体系统在国防领域的应用：提升战略规划与自主作战能力

中文版 | 多智能体系统在国防领域的应用：提升战略规划与自主作战能力

专知会员服务

29+阅读 · 2025年5月8日

《大型通信卫星星座的资源分配优化》316页

《大型通信卫星星座的资源分配优化》316页

专知会员服务

41+阅读 · 2025年2月26日

《多无人机智能反射面辅助通信：通过深度强化学习进行多节点信道建模和公平和率优化》

《多无人机智能反射面辅助通信：通过深度强化学习进行多节点信道建模和公平和率优化》

专知会员服务

29+阅读 · 2024年2月1日

《用于空战机动的分层多智能体强化学习》

《用于空战机动的分层多智能体强化学习》

专知会员服务

70+阅读 · 2023年10月5日

万字长文！《卫星通信中的人工智能综述》

万字长文！《卫星通信中的人工智能综述》

专知会员服务

61+阅读 · 2022年8月8日

最新论文《战术网络的强化学习环境：基于多智能体的场景生成》德国弗劳恩霍夫研究所

最新论文《战术网络的强化学习环境：基于多智能体的场景生成》德国弗劳恩霍夫研究所

专知会员服务

148+阅读 · 2022年4月5日

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知

39+阅读 · 2023年4月11日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

33+阅读 · 2022年11月12日

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

专知

68+阅读 · 2022年11月2日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

55+阅读 · 2022年10月6日

推荐！【美海军·系统工程顶点报告】《人工智能使能的实时兵棋推演系统在海军战术行动中的应用》美国海军2022最新128页

推荐！【美海军·系统工程顶点报告】《人工智能使能的实时兵棋推演系统在海军战术行动中的应用》美国海军2022最新128页

专知

86+阅读 · 2022年9月24日

数据受限条件下的多模态处理技术综述

数据受限条件下的多模态处理技术综述

专知

22+阅读 · 2022年7月16日

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

专知

53+阅读 · 2019年12月1日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

论智

26+阅读 · 2018年10月30日

多波束卫星通信中基于压缩感知的预编码设计与干扰消除技术

国家自然科学基金

1+阅读 · 2017年12月31日

面向车联网海量高速移动终端的高效信道信息获取机制

国家自然科学基金

0+阅读 · 2017年12月31日

多路径通信网络关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

动态稀疏双扩展信道下的多用户通信研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于时变时滞T-S模糊模型的卫星光通信精跟踪系统模糊PID控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向多用户行为的无线识别关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于动态频谱共享的星地协同认知无线通信技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

弹性QoS的快速多目标优化软件定义卫星网络流控制方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

Modal-Based Multi-Scatterer Channel Model for Localized Radiomap Extrapolation

Arxiv

0+阅读 · 5月4日

EarthSight: A Distributed Framework for Low-Latency Satellite Intelligence

Arxiv

0+阅读 · 4月18日

Adaptive Power Allocation and User Scheduling for LEO Satellites using Channel Predictions

Arxiv

0+阅读 · 4月17日

Deep Reinforcement Learning-Based Cooperative Rate Splitting for Satellite-to-Underground Communication Networks

Arxiv

0+阅读 · 3月26日

CSI-tuples-based 3D Channel Fingerprints Construction Assisted by MultiModal Learning

Arxiv

0+阅读 · 3月26日

A Multi-Port Concurrent Communication Model for handling Compute Intensive Tasks on Distributed Satellite System Constellations

Arxiv

0+阅读 · 3月25日

A Constrained RL Approach for Cost-Efficient Delivery of Latency-Sensitive Applications

Arxiv

0+阅读 · 3月4日

Energy Efficient Traffic Scheduling For Optical LEO Satellite Downlinks

Arxiv

0+阅读 · 3月2日

Secure Communications, Sensing, and Computing Towards Next-Generation Networks

Arxiv

0+阅读 · 2月23日

Hierarchical Multi-Agent Reinforcement Learning for Air Combat Maneuvering

Arxiv

49+阅读 · 2023年9月20日

VIP会员

文章信息

相关主题

信道状态信息

多智能体强化学习

最新内容

ICML 2026 教程 | 数值优化理论还重要吗？

ICML 2026 教程 | 数值优化理论还重要吗？

专知会员服务

4+阅读 · 7月26日

ICM 2026 | 陶哲轩：人工智能时代的数学

ICM 2026 | 陶哲轩：人工智能时代的数学

专知会员服务

6+阅读 · 7月26日

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

专知会员服务

7+阅读 · 7月26日

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

专知会员服务

9+阅读 · 7月26日

《先进防空系统选型战略框架：基于巴基斯坦的实证启示》

《先进防空系统选型战略框架：基于巴基斯坦的实证启示》

专知会员服务

8+阅读 · 7月26日

《反无人机交战场景下的战斗归零研究》

《反无人机交战场景下的战斗归零研究》

专知会员服务

7+阅读 · 7月26日

霍尔木兹与不对称作战时代：水雷、无人系统与海军力量的重新定义

霍尔木兹与不对称作战时代：水雷、无人系统与海军力量的重新定义

专知会员服务

4+阅读 · 7月26日

博士论文 | 用代码结构感知方法推进代码大模型

博士论文 | 用代码结构感知方法推进代码大模型

专知会员服务

5+阅读 · 7月25日

综述 | 遥感多模态大模型：领域专用还是通用模型？

综述 | 遥感多模态大模型：领域专用还是通用模型？

专知会员服务

5+阅读 · 7月25日

《面向指挥控制训练与实时北约兼容数据分发的战术模拟器》

《面向指挥控制训练与实时北约兼容数据分发的战术模拟器》

专知会员服务

5+阅读 · 7月25日

《决策模型比较研究》

《决策模型比较研究》

专知会员服务

12+阅读 · 7月25日

全球军事与武器工业中的人工智能：应用、方法与影响（万字长文）

全球军事与武器工业中的人工智能：应用、方法与影响（万字长文）

专知会员服务

9+阅读 · 7月25日

《美军水下战与海床战概述及本地实施》

《美军水下战与海床战概述及本地实施》

专知会员服务

6+阅读 · 7月25日

面向未来冲突推进陆军情报体制改革

面向未来冲突推进陆军情报体制改革

专知会员服务

5+阅读 · 7月25日

人工智能赋能无人机：俄乌冲突案例及其深远影响（万字长文）

人工智能赋能无人机：俄乌冲突案例及其深远影响（万字长文）

专知会员服务

7+阅读 · 7月25日

相关VIP内容

多智能体通信：多智能体强化学习到涌现语言和大语言模型的综述

多智能体通信：多智能体强化学习到涌现语言和大语言模型的综述

专知会员服务

17+阅读 · 2月13日

面向军用卫星通信的更具韧性方案

面向军用卫星通信的更具韧性方案

专知会员服务

17+阅读 · 1月30日

《抗干扰协同无人机中继网络的多智能体深度强化学习》

《抗干扰协同无人机中继网络的多智能体深度强化学习》

专知会员服务

28+阅读 · 2025年12月31日

多智能体强化学习中的稳健且高效的通信

多智能体强化学习中的稳健且高效的通信

专知会员服务

26+阅读 · 2025年11月17日

中文版 | 多智能体系统在国防领域的应用：提升战略规划与自主作战能力

中文版 | 多智能体系统在国防领域的应用：提升战略规划与自主作战能力

专知会员服务

29+阅读 · 2025年5月8日

《大型通信卫星星座的资源分配优化》316页

《大型通信卫星星座的资源分配优化》316页

专知会员服务

41+阅读 · 2025年2月26日

《多无人机智能反射面辅助通信：通过深度强化学习进行多节点信道建模和公平和率优化》

《多无人机智能反射面辅助通信：通过深度强化学习进行多节点信道建模和公平和率优化》

专知会员服务

29+阅读 · 2024年2月1日

《用于空战机动的分层多智能体强化学习》

《用于空战机动的分层多智能体强化学习》

专知会员服务

70+阅读 · 2023年10月5日

万字长文！《卫星通信中的人工智能综述》

万字长文！《卫星通信中的人工智能综述》

专知会员服务

61+阅读 · 2022年8月8日

最新论文《战术网络的强化学习环境：基于多智能体的场景生成》德国弗劳恩霍夫研究所

最新论文《战术网络的强化学习环境：基于多智能体的场景生成》德国弗劳恩霍夫研究所

专知会员服务

148+阅读 · 2022年4月5日

热门VIP内容

开通专知VIP会员享更多权益服务

ICM 2026 | 陶哲轩：人工智能时代的数学

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

ICML 2026 教程 | 数值优化理论还重要吗？

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

相关资讯

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

《网络化传感器集成架构：未来多传感器多平台运行的赋能器》

专知

39+阅读 · 2023年4月11日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

「基于通信的多智能体强化学习」进展综述

「基于通信的多智能体强化学习」进展综述

专知

33+阅读 · 2022年11月12日

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

专知

68+阅读 · 2022年11月2日

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

《综述：多智能体系统（MAS）中的任务分配技术》美国空军项目支持

专知

55+阅读 · 2022年10月6日

推荐！【美海军·系统工程顶点报告】《人工智能使能的实时兵棋推演系统在海军战术行动中的应用》美国海军2022最新128页

推荐！【美海军·系统工程顶点报告】《人工智能使能的实时兵棋推演系统在海军战术行动中的应用》美国海军2022最新128页

专知

86+阅读 · 2022年9月24日

数据受限条件下的多模态处理技术综述

数据受限条件下的多模态处理技术综述

专知

22+阅读 · 2022年7月16日

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

专知

53+阅读 · 2019年12月1日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

论智

26+阅读 · 2018年10月30日

相关论文

Modal-Based Multi-Scatterer Channel Model for Localized Radiomap Extrapolation

Arxiv

0+阅读 · 5月4日

EarthSight: A Distributed Framework for Low-Latency Satellite Intelligence

Arxiv

0+阅读 · 4月18日

Adaptive Power Allocation and User Scheduling for LEO Satellites using Channel Predictions

Arxiv

0+阅读 · 4月17日

Deep Reinforcement Learning-Based Cooperative Rate Splitting for Satellite-to-Underground Communication Networks

Arxiv

0+阅读 · 3月26日

CSI-tuples-based 3D Channel Fingerprints Construction Assisted by MultiModal Learning

Arxiv

0+阅读 · 3月26日

A Multi-Port Concurrent Communication Model for handling Compute Intensive Tasks on Distributed Satellite System Constellations

Arxiv

0+阅读 · 3月25日

A Constrained RL Approach for Cost-Efficient Delivery of Latency-Sensitive Applications

Arxiv

0+阅读 · 3月4日

Energy Efficient Traffic Scheduling For Optical LEO Satellite Downlinks

Arxiv

0+阅读 · 3月2日

Secure Communications, Sensing, and Computing Towards Next-Generation Networks

Arxiv

0+阅读 · 2月23日

Hierarchical Multi-Agent Reinforcement Learning for Air Combat Maneuvering

Arxiv

49+阅读 · 2023年9月20日

相关基金

多波束卫星通信中基于压缩感知的预编码设计与干扰消除技术

国家自然科学基金

1+阅读 · 2017年12月31日

面向车联网海量高速移动终端的高效信道信息获取机制

国家自然科学基金

0+阅读 · 2017年12月31日

多路径通信网络关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

动态稀疏双扩展信道下的多用户通信研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于时变时滞T-S模糊模型的卫星光通信精跟踪系统模糊PID控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向多用户行为的无线识别关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于动态频谱共享的星地协同认知无线通信技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

弹性QoS的快速多目标优化软件定义卫星网络流控制方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

带有通信量化和延时的多智能体系统一致性研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员