Long propagation delays in underwater acoustic networks (UWANs) cause spatio-temporal uncertainty, constraining channel utilization in medium access control (MAC) protocols. Node mobility within autonomous underwater vehicle scenarios exacerbates these challenges by introducing dynamic propagation delays and varying spatial topologies. We present MobiU-MAC, a deep reinforcement learning (DRL)-based MAC protocol for mobile node access in UWANs that maximizes throughput via autonomous learning. MobiU-MAC incorporates CHILL-STER, a novel DRL algorithm optimized for UWANs that is both ranging-free and delay-robust. CHILL-STER employs a credit horizon-limited $λ$-return (CHILL-Return) mechanism to achieve stable learning under asynchronous delayed rewards, while the companion spatio-temporal experience replay (STER) mechanism addresses topological changes arising from node mobility. This work also demonstrates theoretically that DRL attains optimal policy learning equivalent to a standard Markov decision process under long propagation delays without requiring ranging. Performance evaluations indicate that MobiU-MAC outperforms existing DRL-based MAC protocols for UWANs by leveraging the maximum system delay boundary without ranging overhead, supporting the effectiveness of the proposed theory and algorithm in complex underwater dynamic environments.


翻译:水下声学网络(UWANs)中的长传播延迟会导致时空不确定性,从而制约介质访问控制(MAC)协议的信道利用率。在自主水下航行器场景中,节点移动性会引入动态传播延迟和变化的空间拓扑,进一步加剧这些挑战。本文提出MobiU-MAC——一种基于深度强化学习(DRL)的水下移动节点接入MAC协议,通过自主学习实现吞吐量最大化。MobiU-MAC创新性地引入了CHILL-STER,一种专为UWANs优化的无距离测度且延迟鲁棒的DRL算法。CHILL-STER采用信用时限限制的λ-回报(CHILL-Return)机制,可在异步延迟奖励下实现稳定学习,同时辅以时空经验回放(STER)机制应对节点移动引起的拓扑变化。本文还从理论上证明,在无需距离测度的条件下,DRL可在长传播延迟环境中实现与标准马尔可夫决策过程等价的最优策略学习。性能评估表明,MobiU-MAC通过利用系统最大延迟边界且无需测距开销,在复杂水下动态环境中优于现有基于DRL的UWANs MAC协议,有效验证了所提理论与算法的有效性。

0
下载
关闭预览

相关内容

《抗干扰协同无人机中继网络的多智能体深度强化学习》
专知会员服务
28+阅读 · 2025年12月31日
多智能体强化学习中的稳健且高效的通信
专知会员服务
25+阅读 · 2025年11月17日
《非视距水下光学无线通信》156页
专知会员服务
29+阅读 · 2025年1月9日
【ICML2022】DRIBO:基于多视图信息瓶颈的鲁棒深度强化学习
当深度强化学习遇见图神经网络
专知
227+阅读 · 2019年10月21日
【边缘智能】边缘计算驱动的深度学习加速技术
产业智能官
20+阅读 · 2019年2月8日
【迁移学习】简述迁移学习在深度学习中的应用
产业智能官
15+阅读 · 2018年1月9日
迁移学习在深度学习中的应用
专知
24+阅读 · 2017年12月24日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
4+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员