Multi-hop uncrewed aerial vehicle (UAV) networks are promising to extend the terrestrial network coverage. Existing multi-hop UAV networks employ a single routing path by selecting the next-hop forwarding node in a hop-by-hop manner, which leads to local congestion and increases traffic delays. In this paper, a novel traffic-adaptive multipath routing method is proposed for multi-hop UAV networks, which enables each UAV to dynamically split and forward traffic flows across multiple next-hop neighbors, thus meeting latency requirements of diverse traffic flows in dynamic mobile environments. An on-time packet delivery ratio maximization problem is formulated to determine the traffic splitting ratios at each hop. This sequential decision-making problem is modeled as a decentralized partially observable Markov decision process (Dec-POMDP). To solve this Dec-POMDP, a novel multi-agent deep reinforcement leaning (MADRL) algorithm, termed Independent Proximal Policy Optimization with Dirichlet Modeling (IPPO-DM), is developed. Specifically, the IPPO serves as the core optimization framework, where the Dirichlet distribution is leveraged to parameterize a continuous stochastic policy network on the probability simplex, inherently ensuring feasible traffic splitting ratios. Simulation results demonstrate that IPPO-DM outperforms benchmark schemes in terms of both delivery latency guarantee and packet loss performance.


翻译:多跳无人机网络有望扩展地面网络覆盖范围。现有的多跳无人机网络采用单一路由路径,通过逐跳选择下一跳转发节点,这会导致局部拥塞并增加流量延迟。本文针对多跳无人机网络提出一种新型流量自适应多路径路由方法,使每架无人机能够动态地将流量流拆分并转发至多个下一跳邻居节点,从而满足动态移动环境中多样化流量流的延迟要求。本文构建了一个准时数据包投递率最大化问题,以确定每一跳的流量分配比例。该序贯决策问题被建模为去中心化部分可观测马尔可夫决策过程。为求解此Dec-POMDP问题,我们提出了一种新型多智能体深度强化学习算法,称为基于狄利克雷建模的独立近端策略优化算法。具体而言,IPPO作为核心优化框架,其中利用狄利克雷分布对概率单纯形上的连续随机策略网络进行参数化,从而在本质上确保可行的流量分配比例。仿真结果表明,在传输延迟保障与丢包性能方面,IPPO-DM均优于基准方案。

0
下载
关闭预览

相关内容

《抗干扰协同无人机中继网络的多智能体深度强化学习》
专知会员服务
25+阅读 · 2025年12月31日
《多无人机作战分层强化学习框架》
专知会员服务
32+阅读 · 2025年2月21日
《多跳战术网络中 5G 及其他侧链路通信的作用》
专知会员服务
28+阅读 · 2024年6月6日
无人机空地网络研究综述
专知会员服务
49+阅读 · 2024年5月19日
《多无人机协作升降系统的建模、飞行控制和估计》146页
多无人机协同任务规划研究
专知会员服务
125+阅读 · 2024年1月24日
《创建自主多UAV通信中继网络》74页论文
专知会员服务
44+阅读 · 2023年12月5日
新年快乐!无人机测控通信自组网技术综述
无人机
31+阅读 · 2019年2月5日
无人机蜂群作战技术与多智能体系统理论
无人机
41+阅读 · 2019年1月27日
论文浅尝 | 常识用于回答生成式多跳问题
开放知识图谱
16+阅读 · 2018年11月24日
无人机飞行控制方法概述
无人机
12+阅读 · 2017年10月7日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
32+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
VIP会员
相关VIP内容
《抗干扰协同无人机中继网络的多智能体深度强化学习》
专知会员服务
25+阅读 · 2025年12月31日
《多无人机作战分层强化学习框架》
专知会员服务
32+阅读 · 2025年2月21日
《多跳战术网络中 5G 及其他侧链路通信的作用》
专知会员服务
28+阅读 · 2024年6月6日
无人机空地网络研究综述
专知会员服务
49+阅读 · 2024年5月19日
《多无人机协作升降系统的建模、飞行控制和估计》146页
多无人机协同任务规划研究
专知会员服务
125+阅读 · 2024年1月24日
《创建自主多UAV通信中继网络》74页论文
专知会员服务
44+阅读 · 2023年12月5日
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
32+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员