We study the problem of long-term (multiple days) mapping of a river plume using multiple autonomous underwater vehicles (AUVs), focusing on the Douro river representative use-case. We propose an energy - and communication - efficient multi-agent reinforcement learning approach in which a central coordinator intermittently communicates with the AUVs, collecting measurements and issuing commands. Our approach integrates spatiotemporal Gaussian process regression (GPR) with a multi-head Q-network controller that regulates direction and speed for each AUV. Simulations using the Delft3D ocean model demonstrate that our method consistently outperforms both single- and multi-agent benchmarks, with scaling the number of agents both improving mean squared error (MSE) and operational endurance. In some instances, our algorithm demonstrates that doubling the number of AUVs can more than double endurance while maintaining or improving accuracy, underscoring the benefits of multi-agent coordination. Our learned policies generalize across unseen seasonal regimes over different months and years, demonstrating promise for future developments of data-driven long-term monitoring of dynamic plume environments.


翻译:本研究探讨了利用多台自主水下航行器(AUV)对河流羽流进行长期(多日)测绘的问题,重点关注杜罗河这一典型应用场景。我们提出了一种能源高效且通信高效的多智能体强化学习方法,其中中央协调器间歇性地与AUV进行通信,收集测量数据并下达指令。该方法将时空高斯过程回归(GPR)与一个多头部Q网络控制器相结合,该控制器可调节每台AUV的方向和速度。使用Delft3D海洋模型进行的仿真表明,我们的方法在均方误差(MSE)和运行续航能力方面均持续优于单智能体与多智能体基准方法,且增加智能体数量能同时改善这两项指标。在某些情况下,我们的算法表明,在保持或提升精度的同时,将AUV数量翻倍可使续航能力提升一倍以上,这凸显了多智能体协同的优势。我们学习到的策略能够泛化至不同月份和年份中未见过的季节性水文状况,这为未来数据驱动的动态羽流环境长期监测研究展示了良好前景。

0
下载
关闭预览

相关内容

智能体,顾名思义,就是具有智能的实体,英文名是Agent。
多智能体强化学习中的稳健且高效的通信
专知会员服务
25+阅读 · 2025年11月17日
面向关系建模的合作多智能体深度强化学习综述
专知会员服务
39+阅读 · 2025年4月18日
多智能体强化学习控制与决策研究综述
专知会员服务
46+阅读 · 2024年11月23日
基于学习机制的多智能体强化学习综述
专知会员服务
61+阅读 · 2024年4月16日
专知会员服务
170+阅读 · 2021年8月3日
「基于通信的多智能体强化学习」 进展综述
【综述】多智能体强化学习算法理论研究
深度强化学习实验室
15+阅读 · 2020年9月9日
多智能体强化学习(MARL)近年研究概览
PaperWeekly
38+阅读 · 2020年3月15日
DeepMind:用PopArt进行多任务深度强化学习
论智
29+阅读 · 2018年9月14日
国家自然科学基金
42+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2014年12月31日
国家自然科学基金
48+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
VIP会员
相关基金
国家自然科学基金
42+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2014年12月31日
国家自然科学基金
48+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员