Under the 6G wireless network evolution, the low-altitude Internet of Things (IoT), supported by unmanned aerial vehicles (UAVs) with Integrated Sensing and Communication (ISAC) capabilities, provides ground sensing networks with advanced real-time monitoring and data collection. To maximize data collection volume from distributed IoT nodes, AI-powered data collection technology plays a critical role in enabling intelligent decision-making. Among them, deep reinforcement learning (DRL) has gained particular attention. However, the existing DRL-based work on UAV-assisted IoT nodes data collection rarely address problems such as unknown interference and dynamic data volume. Moreover, these DRL models have high arithmetic requirements and slow convergence speed, making it difficult to carry on UAVs with limited load and arithmetic power. To address these challenges, a hierarchical deep reinforcement learning (HDRL), which can converge quickly and with smaller models, is designed to optimize UAV trajectories and bandwidth allocation to maximize data collection volume. Firstly, the proposed scenario incorporates interference from jammers, dynamic data volume of IoT nodes, and multiple types of obstacles. The entire task is hierarchically structured: the upper-level makes flight trajectory decisions at a coarse temporal granularity, while the lower-level makes bandwidth allocation decisions at a finer temporal granularity. Secondly, a trajectory and bandwidth allocation optimization algorithm based on hierarchical deep deterministic policy gradients (TBH-DDPG) is proposed to solve the problem. Finally, simulation results demonstrate that the proposed algorithm improves convergence speed by 44.44%, and reduces computational cost by 58.05%, compared to non-hierarchical algorithm.


翻译:在6G无线网络演进背景下,由具备通感一体化能力的无人机支撑的低空物联网,为地面传感网络提供了先进的实时监测与数据收集能力。为最大化从分布式物联网节点收集的数据量,基于人工智能的数据收集技术成为实现智能决策的关键。其中,深度强化学习受到特别关注。然而,现有基于深度强化学习的无人机辅助物联网节点数据收集研究鲜有涉及未知干扰与动态数据量等问题。此外,这些深度强化学习模型计算需求高、收敛速度慢,难以部署在负载与算力受限的无人机上。为此,本文设计了一种可快速收敛且模型更小的分层深度强化学习,通过优化无人机轨迹与带宽分配以最大化数据收集量。首先,所提场景考虑了干扰源的干扰、物联网节点动态数据量以及多种障碍物。整个任务采用分层架构:上层以粗时间粒度进行飞行轨迹决策,下层以细时间粒度进行带宽分配决策。其次,提出基于分层深度确定性策略梯度的轨迹与带宽分配优化算法以解决该问题。仿真结果表明,与非分层算法相比,该算法收敛速度提升44.44%,计算成本降低58.05%。

0
下载
关闭预览

相关内容

通信行业:智能低空通感网络白皮书
专知会员服务
15+阅读 · 2025年7月7日
《基于学习的下一代智能网络优化方法》180页
专知会员服务
26+阅读 · 2025年4月4日
分层强化学习在无人机领域应用综述
专知会员服务
54+阅读 · 2024年3月19日
「强化学习在无人车领域」的应用与展望
专知会员服务
58+阅读 · 2022年12月8日
物联网时代分布式深度学习新方向
专知会员服务
55+阅读 · 2020年8月30日
PlaNet 简介:用于强化学习的深度规划网络
谷歌开发者
13+阅读 · 2019年3月16日
联邦学习或将助力IoT走出“数据孤岛”?
中国计算机学会
20+阅读 · 2019年3月16日
【知识图谱】知识图谱怎么与深度学习结合?
产业智能官
160+阅读 · 2018年12月18日
智能无人机集群技术概述
无人机
46+阅读 · 2018年2月28日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
干货|基于图卷积网络的图深度学习
DataCanvas大数据云平台
10+阅读 · 2017年6月8日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
29+阅读 · 2011年12月31日
VIP会员
相关主题
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
1+阅读 · 今天15:00
21世纪的无人机战争
专知会员服务
2+阅读 · 今天14:05
《量子技术的军事任务技术适配与利用》
专知会员服务
2+阅读 · 今天13:51
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
29+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员