Game-Theoretic Multi-Agent Reinforcement Learning for Swarm Trajectory Planning in Low-Altitude Wireless Networks - 专知论文

会员服务 ·

0

博弈 · 多小区 · 轨迹规划 · 耦合 · 效用 ·

Game-Theoretic Multi-Agent Reinforcement Learning for Swarm Trajectory Planning in Low-Altitude Wireless Networks

翻译：面向低空无线网络中集群轨迹规划的博弈论多智能体强化学习

Nguyen Duc Minh Quang,Ruoxi Chong,Zhiqiang Wei,Chang Liu,Derrick Wing Kwan Ng

from arxiv, Submitted to IEEE/CIC ICCC 2026 in Wuhan

The Low-Altitude Economy (LAE) is rapidly expanding, giving rise to low-altitude wireless networks (LAWNs), where large-scale cellular-connected unmanned aerial vehicle (UAV) deployments support heterogeneous mission-critical applications over multi-cell ground base station (GBS) infrastructures. To ensure mission success, each UAV must jointly optimize communication throughput and mission completion efficiency. In fifth-generation (5G) new radio (NR) systems, the equal resource block (RB) allocation policy induces strong strategic coupling among UAV trajectories: when a UAV enters a GBS cell, it reduces the RB share available to all co-served UAVs, thereby altering their achievable rates and trajectory incentives through shared wireless resources. Existing studies either ignore this coupling or focus on single-cell infrastructure, leaving the multi-cell, congestion-aware UAV trajectory planning problem insufficiently addressed. To fill this gap, we formulate the problem as a cooperative stochastic congestion game with a communication-and-mission-aware utility function, and propose a centralized-training decentralized-execution multi-agent proximal policy optimization (CTDE-MAPPO) algorithm to maximize social welfare under multi-cell RB congestion. Simulation results show that the proposed method outperforms QMIX, independent Q-learning, and random baselines in terms of aggregate utility and mission success rate, while achieving stable convergence within practical training budgets.

翻译：低空经济（LAE）正在快速发展，催生了低空无线网络（LAWN）。在该网络中，大规模蜂窝连接的无人飞行器（UAV）在多小区地面基站（GBS）基础设施上支持异构任务关键型应用。为确保任务成功，每架UAV必须联合优化通信吞吐量与任务完成效率。在第五代（5G）新空口（NR）系统中，等资源块（RB）分配策略在UAV轨迹间引入了强策略耦合：当UAV进入某GBS小区时，会降低同小区所有UAV共享RB的份额，从而通过共享无线资源改变其可达速率与轨迹激励。现有研究要么忽略这种耦合，要么仅聚焦于单小区基础设施，导致多小区环境下拥堵感知的UAV轨迹规划问题尚未得到充分解决。为填补这一空白，我们将该问题建模为具有通信与任务感知效用函数的合作式随机拥堵博弈，并提出一种集中训练-分散执行的多智能体近端策略优化（CTDE-MAPPO）算法，以在多小区RB拥堵条件下最大化社会福利。仿真结果表明，所提方法在总效用和任务成功率上优于QMIX、独立Q学习及随机基线方法，同时能在实际训练预算内实现稳定收敛。

0

相关内容

通信行业：智能低空通感网络白皮书

通信行业：智能低空通感网络白皮书

专知会员服务

15+阅读 · 2025年7月7日

《无人机辅助的天空地一体化网络：学习算法技术综述》

《无人机辅助的天空地一体化网络：学习算法技术综述》

专知会员服务

51+阅读 · 2025年3月11日

《可重构智能表面和无人机辅助通信：深度强化学习方法》169页博士论文

《可重构智能表面和无人机辅助通信：深度强化学习方法》169页博士论文

专知会员服务

29+阅读 · 2025年1月12日

《基于深度强化学习的安全约束分布式多无人机协同》最新130页博士论文

《基于深度强化学习的安全约束分布式多无人机协同》最新130页博士论文

专知会员服务

69+阅读 · 2024年11月19日

《多无人机智能反射面辅助通信：通过深度强化学习进行多节点信道建模和公平和率优化》

《多无人机智能反射面辅助通信：通过深度强化学习进行多节点信道建模和公平和率优化》

专知会员服务

29+阅读 · 2024年2月1日

《基于机器学习的无人机频谱指纹识别：防御性网络战》哈佛2023最新168页论文

《基于机器学习的无人机频谱指纹识别：防御性网络战》哈佛2023最新168页论文

专知会员服务

54+阅读 · 2023年11月3日

基于多智能体博弈强化学习的无人机智能攻击策略生成模型

基于多智能体博弈强化学习的无人机智能攻击策略生成模型

专知会员服务

108+阅读 · 2023年10月16日

《基于博弈论的多无人机最优协同路径规划》悉尼科技大学等2022最新论文

《基于博弈论的多无人机最优协同路径规划》悉尼科技大学等2022最新论文

专知会员服务

109+阅读 · 2022年10月28日

以色列耶路撒冷理工学院最新论文《机器学习方法在无人机群管理中的应用综述》，对ML、UAVs、Swarms三方交叉技术现状综述，56页pdf

以色列耶路撒冷理工学院最新论文《机器学习方法在无人机群管理中的应用综述》，对ML、UAVs、Swarms三方交叉技术现状综述，56页pdf

专知会员服务

50+阅读 · 2022年4月8日

索邦大学最新博士论文《无人机辅助无线网络的机器学习方法》，167页pdf

索邦大学最新博士论文《无人机辅助无线网络的机器学习方法》，167页pdf

专知会员服务

52+阅读 · 2022年4月8日

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

专知

69+阅读 · 2022年12月3日

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

专知

30+阅读 · 2022年11月23日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

专知

68+阅读 · 2022年11月2日

《重新设计反无人机系统架构》2022最新160页论文，美国海军研究生院

《重新设计反无人机系统架构》2022最新160页论文，美国海军研究生院

专知

62+阅读 · 2022年10月26日

推荐！《用机器学习发掘反综合防空系统（IADS）的蜂群自主行为》【博士论文】2022最新325页论文

推荐！《用机器学习发掘反综合防空系统（IADS）的蜂群自主行为》【博士论文】2022最新325页论文

专知

28+阅读 · 2022年10月22日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

66+阅读 · 2022年8月25日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知

60+阅读 · 2022年4月30日

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

论智

26+阅读 · 2018年10月30日

无人机小型蜂窝网络系统设计与优化控制关键技术研究

国家自然科学基金

33+阅读 · 2017年12月31日

基于智慧的下一代网络资源优化机制研究

国家自然科学基金

2+阅读 · 2015年12月31日

无线携能中继网络中多种资源联合优化问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向多用户行为的无线识别关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

分布式认知协同无线网络物理层安全理论与传输方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向无线电力传输的宽带通信网络布局优化和充电控制关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于导频提取技术的下一代无线网络性能优化研究

国家自然科学基金

2+阅读 · 2015年12月31日

云架构接入网中面向多业务的计算与无线资源分配研究

国家自然科学基金

2+阅读 · 2014年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

Enhanced Evolutionary Multi-Objective Deep Reinforcement Learning for Reliable and Efficient Wireless Rechargeable Sensor Networks

Arxiv

0+阅读 · 6月16日

Asynchronous Decentralized Federated Learning over Lossy Wireless Links via Reception- and Age-Aware Aggregation

Arxiv

0+阅读 · 6月16日

Vision-Language-Action Models Meet World Models: Embodied Agentic AI for Low-Altitude Wireless Networks

Arxiv

0+阅读 · 6月10日

Efficient Onboard Vision-Language Inference in UAV-Enabled Low-Altitude Economy Networks via LLM-Enhanced Optimization

Arxiv

0+阅读 · 6月7日

Digital Twin-Assisted Adaptive Multi-Agent DRL for Intelligent Spectrum and Resource Management in Open-RAN UAV-Enabled 6G Networks

Arxiv

0+阅读 · 5月31日

Low-Altitude Wireless Networks: The Next Horizon of Wireless Infrastructure

Arxiv

0+阅读 · 5月23日

UAV Trajectory and Bandwidth Allocation for Efficient Data Collection in Low-Altitude Intelligent IoT: A Hierarchical DRL Approach

Arxiv

0+阅读 · 5月21日

Collaborative Air-Ground Sensing, Communication, Computing, Storage, and Intelligence for Low-Altitude Economy

Arxiv

0+阅读 · 5月18日

Learning-Based Spectrum Cartography in Low Earth Orbit Satellite Networks: An Overview

Arxiv

0+阅读 · 5月11日

Hierarchical Multi-Agent Reinforcement Learning for Air Combat Maneuvering

Arxiv

49+阅读 · 2023年9月20日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

0+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

1+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

5+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

6+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

9+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

6+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

9+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

7+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

13+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

6+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

8+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

9+阅读 · 6月17日

相关VIP内容

通信行业：智能低空通感网络白皮书

通信行业：智能低空通感网络白皮书

专知会员服务

15+阅读 · 2025年7月7日

《无人机辅助的天空地一体化网络：学习算法技术综述》

《无人机辅助的天空地一体化网络：学习算法技术综述》

专知会员服务

51+阅读 · 2025年3月11日

《可重构智能表面和无人机辅助通信：深度强化学习方法》169页博士论文

《可重构智能表面和无人机辅助通信：深度强化学习方法》169页博士论文

专知会员服务

29+阅读 · 2025年1月12日

《基于深度强化学习的安全约束分布式多无人机协同》最新130页博士论文

《基于深度强化学习的安全约束分布式多无人机协同》最新130页博士论文

专知会员服务

69+阅读 · 2024年11月19日

《多无人机智能反射面辅助通信：通过深度强化学习进行多节点信道建模和公平和率优化》

《多无人机智能反射面辅助通信：通过深度强化学习进行多节点信道建模和公平和率优化》

专知会员服务

29+阅读 · 2024年2月1日

《基于机器学习的无人机频谱指纹识别：防御性网络战》哈佛2023最新168页论文

《基于机器学习的无人机频谱指纹识别：防御性网络战》哈佛2023最新168页论文

专知会员服务

54+阅读 · 2023年11月3日

基于多智能体博弈强化学习的无人机智能攻击策略生成模型

基于多智能体博弈强化学习的无人机智能攻击策略生成模型

专知会员服务

108+阅读 · 2023年10月16日

《基于博弈论的多无人机最优协同路径规划》悉尼科技大学等2022最新论文

《基于博弈论的多无人机最优协同路径规划》悉尼科技大学等2022最新论文

专知会员服务

109+阅读 · 2022年10月28日

以色列耶路撒冷理工学院最新论文《机器学习方法在无人机群管理中的应用综述》，对ML、UAVs、Swarms三方交叉技术现状综述，56页pdf

以色列耶路撒冷理工学院最新论文《机器学习方法在无人机群管理中的应用综述》，对ML、UAVs、Swarms三方交叉技术现状综述，56页pdf

专知会员服务

50+阅读 · 2022年4月8日

索邦大学最新博士论文《无人机辅助无线网络的机器学习方法》，167页pdf

索邦大学最新博士论文《无人机辅助无线网络的机器学习方法》，167页pdf

专知会员服务

52+阅读 · 2022年4月8日

热门VIP内容

开通专知VIP会员享更多权益服务

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

相关资讯

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

【蜂群无人机控制关键技术】《基于深度学习进行无线电信号和协议分类以自动发现波形漏洞》2022最新102页报告，美国空军研究实验室

专知

69+阅读 · 2022年12月3日

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

专知

30+阅读 · 2022年11月23日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

专知

68+阅读 · 2022年11月2日

《重新设计反无人机系统架构》2022最新160页论文，美国海军研究生院

《重新设计反无人机系统架构》2022最新160页论文，美国海军研究生院

专知

62+阅读 · 2022年10月26日

推荐！《用机器学习发掘反综合防空系统（IADS）的蜂群自主行为》【博士论文】2022最新325页论文

推荐！《用机器学习发掘反综合防空系统（IADS）的蜂群自主行为》【博士论文】2022最新325页论文

专知

28+阅读 · 2022年10月22日

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

《基于多智能体深度强化学习的空战模拟智能体协作》瑞典林雪平大学

专知

66+阅读 · 2022年8月25日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

「博弈论视角下多智能体强化学习」研究综述

「博弈论视角下多智能体强化学习」研究综述

专知

60+阅读 · 2022年4月30日

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

每日论文 | 图形深度神经网络并行框架NGra；用人类注意力进行序列分类；针对多智能体协作的图卷积强化学习

论智

26+阅读 · 2018年10月30日

相关论文

Enhanced Evolutionary Multi-Objective Deep Reinforcement Learning for Reliable and Efficient Wireless Rechargeable Sensor Networks

Arxiv

0+阅读 · 6月16日

Asynchronous Decentralized Federated Learning over Lossy Wireless Links via Reception- and Age-Aware Aggregation

Arxiv

0+阅读 · 6月16日

Vision-Language-Action Models Meet World Models: Embodied Agentic AI for Low-Altitude Wireless Networks

Arxiv

0+阅读 · 6月10日

Efficient Onboard Vision-Language Inference in UAV-Enabled Low-Altitude Economy Networks via LLM-Enhanced Optimization

Arxiv

0+阅读 · 6月7日

Digital Twin-Assisted Adaptive Multi-Agent DRL for Intelligent Spectrum and Resource Management in Open-RAN UAV-Enabled 6G Networks

Arxiv

0+阅读 · 5月31日

Low-Altitude Wireless Networks: The Next Horizon of Wireless Infrastructure

Arxiv

0+阅读 · 5月23日

UAV Trajectory and Bandwidth Allocation for Efficient Data Collection in Low-Altitude Intelligent IoT: A Hierarchical DRL Approach

Arxiv

0+阅读 · 5月21日

Collaborative Air-Ground Sensing, Communication, Computing, Storage, and Intelligence for Low-Altitude Economy

Arxiv

0+阅读 · 5月18日

Learning-Based Spectrum Cartography in Low Earth Orbit Satellite Networks: An Overview

Arxiv

0+阅读 · 5月11日

Hierarchical Multi-Agent Reinforcement Learning for Air Combat Maneuvering

Arxiv

49+阅读 · 2023年9月20日

相关基金

无人机小型蜂窝网络系统设计与优化控制关键技术研究

国家自然科学基金

33+阅读 · 2017年12月31日

基于智慧的下一代网络资源优化机制研究

国家自然科学基金

2+阅读 · 2015年12月31日

无线携能中继网络中多种资源联合优化问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向多用户行为的无线识别关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

分布式认知协同无线网络物理层安全理论与传输方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向无线电力传输的宽带通信网络布局优化和充电控制关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于导频提取技术的下一代无线网络性能优化研究

国家自然科学基金

2+阅读 · 2015年12月31日

云架构接入网中面向多业务的计算与无线资源分配研究

国家自然科学基金

2+阅读 · 2014年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员