CORAL: COntextual Reasoning And Local Planning in A Hierarchical VLM Framework for Underwater Monitoring - 专知论文

会员服务 ·

0

水下 · 系统 · 水下监测 · 碰撞 · 语言模型 ·

CORAL: COntextual Reasoning And Local Planning in A Hierarchical VLM Framework for Underwater Monitoring

翻译：CORAL：用于水下监测的分层视觉语言模型框架中的上下文推理与局部规划

Zhenqi Wu,Yuanjie Lu,Xuesu Xiao,Xiaomin Lin

from arxiv, Submitted to IROS 2026

Oyster reefs are critical ecosystem species that sustain biodiversity, filter water, and protect coastlines, yet they continue to decline globally. Restoring these ecosystems requires regular underwater monitoring to assess reef health, a task that remains costly, hazardous, and limited when performed by human divers. Autonomous underwater vehicles (AUVs) offer a promising alternative, but existing AUVs rely on geometry-based navigation that cannot interpret scene semantics. Recent vision-language models (VLMs) enable semantic reasoning for intelligent exploration, but existing VLM-driven systems adopt an end-to-end paradigm, introducing three key limitations. First, these systems require the VLM to generate every navigation decision, forcing frequent waits for inference. Second, VLMs cannot model robot dynamics, causing collisions in cluttered environments. Third, limited self-correction allows small deviations to accumulate into large path errors. To address these limitations, we propose CORAL, a framework that decouples high-level semantic reasoning from low-level reactive control. The VLM provides high-level exploration guidance by selecting waypoints, while a dynamics-based planner handles low-level collision-free execution. A geometric verification module validates waypoints and triggers replanning when needed. Compared with the previous state-of-the-art, CORAL improves coverage by 14.28% percentage points, or 17.85% relatively, reduces collisions by 100%, and requires 57% fewer VLM calls.

翻译：牡蛎礁是维持生物多样性、净化水质和保护海岸线的关键生态系统物种，然而全球范围内其数量仍在持续减少。恢复这些生态系统需要定期进行水下监测以评估礁体健康状况，而由人类潜水员执行该任务成本高昂、危险且受限。自主水下航行器（AUV）提供了有前景的替代方案，但现有AUV依赖基于几何的导航方法，无法理解场景语义。近期发展的视觉语言模型（VLM）虽能实现智能探索所需的语义推理，但现有VLM驱动系统采用端到端范式，存在三个关键局限：首先，这些系统要求VLM生成所有导航决策，导致频繁等待推理过程；其次，VLM无法建模机器人动力学，在复杂环境中易引发碰撞；第三，有限的自我校正能力使微小偏差累积成显著路径误差。为解决这些局限，我们提出CORAL框架，将高层语义推理与低层反应控制解耦。VLM通过选择航点提供高层探索指导，而基于动力学的规划器负责执行无碰撞的低层运动。几何验证模块对航点进行校验，并在需要时触发重新规划。与先前最优方法相比，CORAL将监测覆盖率绝对提升14.28个百分点（相对提升17.85%），碰撞率降低100%，且VLM调用次数减少57%。

1

相关内容

《利用沉浸式环境提升关键水下基础设施安保中的态势与空间感知能力》

《利用沉浸式环境提升关键水下基础设施安保中的态势与空间感知能力》

专知会员服务

16+阅读 · 4月9日

《以自主水下航行器（AUV）为主机平台的移动磁测距系统评价》最新31页报告

《以自主水下航行器（AUV）为主机平台的移动磁测距系统评价》最新31页报告

专知会员服务

14+阅读 · 2025年6月9日

水下无人通信载荷技术综述与应用前景

水下无人通信载荷技术综述与应用前景

专知会员服务

20+阅读 · 2025年3月30日

自主水下航行器路径规划技术综述及展望

自主水下航行器路径规划技术综述及展望

专知会员服务

57+阅读 · 2023年7月6日

《新兴颠覆性技术：远程海底监视技术》115页报告，澳国防部

《新兴颠覆性技术：远程海底监视技术》115页报告，澳国防部

专知会员服务

50+阅读 · 2023年3月16日

《用于海上监视和自主导航的下一代智能态势感知系统》北约科技组织2022.10最新报告【初译版】

《用于海上监视和自主导航的下一代智能态势感知系统》北约科技组织2022.10最新报告【初译版】

专知会员服务

94+阅读 · 2023年2月19日

《自主水下航行器编队综述：性能、编队控制和通信能力》大连海事大学27页综述论文

《自主水下航行器编队综述：性能、编队控制和通信能力》大连海事大学27页综述论文

专知会员服务

41+阅读 · 2022年12月25日

《远程自主水下航行器性能研究：增强AUV续航能力》2022最新博士论文，瑞典皇家理工学院

《远程自主水下航行器性能研究：增强AUV续航能力》2022最新博士论文，瑞典皇家理工学院

专知会员服务

37+阅读 · 2022年12月25日

【深海自主导航定位】《自主水下航行器多模型交互估计的信息论方法》2022最新154页论文，美国海军研究生院

【深海自主导航定位】《自主水下航行器多模型交互估计的信息论方法》2022最新154页论文，美国海军研究生院

专知会员服务

64+阅读 · 2022年10月27日

《利用知识图谱实现海洋态势感知：一项研究》诺曼底大学、空客防务与航天公司

《利用知识图谱实现海洋态势感知：一项研究》诺曼底大学、空客防务与航天公司

专知会员服务

63+阅读 · 2022年6月22日

《海军兵棋推演战斗管理辅助工具中的博弈论和规范分析》2022最新84页论文，美海军

《海军兵棋推演战斗管理辅助工具中的博弈论和规范分析》2022最新84页论文，美海军

专知

67+阅读 · 2022年12月1日

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

专知

74+阅读 · 2022年11月19日

【无人机+海事】无人机辅助海上通信:部署考虑、应用和未来挑战

【无人机+海事】无人机辅助海上通信:部署考虑、应用和未来挑战

专知

23+阅读 · 2022年9月23日

推荐！美国海军部《无人作战框架》40页报告，如何布局无人系统以在未来美国分布式海上作战中发挥关键作用

推荐！美国海军部《无人作战框架》40页报告，如何布局无人系统以在未来美国分布式海上作战中发挥关键作用

专知

84+阅读 · 2022年9月7日

前沿：水下机器人及其导航系统

前沿：水下机器人及其导航系统

科学出版社

11+阅读 · 2019年6月22日

PlaNet 简介：用于强化学习的深度规划网络

PlaNet 简介：用于强化学习的深度规划网络

谷歌开发者

13+阅读 · 2019年3月16日

海洋论坛丨水声目标识别技术现状与发展

海洋论坛丨水声目标识别技术现状与发展

无人机

26+阅读 · 2018年12月17日

海洋技术丨超短基线定位技术及在海洋工程中的应用

海洋技术丨超短基线定位技术及在海洋工程中的应用

无人机

28+阅读 · 2018年9月14日

国外无人水下航行器装备与技术现状及展望

国外无人水下航行器装备与技术现状及展望

无人机

14+阅读 · 2018年1月11日

水下无人系统发展现状及关键技术

水下无人系统发展现状及关键技术

无人机

21+阅读 · 2018年1月5日

基于边界辨识的水下航行器低频线谱主动调控

国家自然科学基金

2+阅读 · 2015年12月31日

流域景观格局对河流大型底栖动物的影响研究

国家自然科学基金

0+阅读 · 2015年12月31日

动态不确定性条件下基于混杂约束满足问题的水下移动传感器网络节点自定位方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于微生物图像识别的水质监测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

仿复眼视觉系统光谱-偏振敏感机制的水下目标检测方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于线结构光的水下自主作业系统目标识别与定位方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

浅水湖泊沉水植物、附着藻类和螺类之间的相互关系及其对热浪的响应

国家自然科学基金

0+阅读 · 2015年12月31日

基于底栖生物指数的近岸海域生态环境质量评价方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

水下机器人可重构控制系统可靠性分析研究

国家自然科学基金

4+阅读 · 2015年12月31日

粉砂淤泥质海岸带潮沟系统演化过程及其对人类活动响应的遥感监测研究——以江苏中部沿海为例

国家自然科学基金

0+阅读 · 2014年12月31日

Instantaneous Planning, Control and Safety for Navigation in Unknown Underwater Spaces

Arxiv

0+阅读 · 4月28日

DeepTaxon: An Interpretable Retrieval-Augmented Multimodal Framework for Unified Species Identification and Discovery

Arxiv

0+阅读 · 4月27日

FUTURAL: A Metasearch Platform for Empowering Rural Areas with Smart Solutions

Arxiv

0+阅读 · 4月26日

Task-specific Subnetwork Discovery in Reinforcement Learning for Autonomous Underwater Navigation

Arxiv

0+阅读 · 4月23日

RemoteShield: Enable Robust Multimodal Large Language Models for Earth Observation

Arxiv

0+阅读 · 4月19日

Online Navigation Planning for Long-term Autonomous Operation of Underwater Gliders

Arxiv

0+阅读 · 4月15日

DINO-Explorer: Active Underwater Discovery via Ego-Motion Compensated Semantic Predictive Coding

Arxiv

0+阅读 · 4月14日

Underwater Embodied Intelligence for Autonomous Robots: A Constraint-Coupled Perspective on Planning, Control, and Deployment

Arxiv

1+阅读 · 3月8日

MetaBlue: A Metasurface-Assisted Acoustic Underwater Localization System

Arxiv

0+阅读 · 2月22日

MUOT_3M: A 3 Million Frame Multimodal Underwater Benchmark and the MUTrack Tracking Method

Arxiv

0+阅读 · 2月20日

VIP会员

文章信息

相关主题

最新内容

[ICML26] 破局长视频理解！快手推出统一框架实现视频定位与深度理解，多项基准测试性能全面提升

[ICML26] 破局长视频理解！快手推出统一框架实现视频定位与深度理解，多项基准测试性能全面提升

专知会员服务

1+阅读 · 5月24日

Claw AI Lab：从自动写论文到交互式AI研究实验室

Claw AI Lab：从自动写论文到交互式AI研究实验室

专知会员服务

1+阅读 · 5月24日

美军“沙赫德-136”自杀式无人机仿制型号将获得集群能力

美军“沙赫德-136”自杀式无人机仿制型号将获得集群能力

专知会员服务

9+阅读 · 5月24日

【ICML 2026】MotiMotion：用视觉推理增强运动可控视频生成

【ICML 2026】MotiMotion：用视觉推理增强运动可控视频生成

专知会员服务

4+阅读 · 5月23日

AI能预测科学突破吗？CUSP基准揭示前沿模型能力边界

AI能预测科学突破吗？CUSP基准揭示前沿模型能力边界

专知会员服务

6+阅读 · 5月23日

美以伊冲突中的无人机反防空作战

美以伊冲突中的无人机反防空作战

专知会员服务

7+阅读 · 5月23日

【ICML 2026】面向视野外操作的VLA空间记忆框架SOMA

【ICML 2026】面向视野外操作的VLA空间记忆框架SOMA

专知会员服务

5+阅读 · 5月22日

【综述】大语言模型驱动的多模态情感识别综述：挑战、分类与未来方向

【综述】大语言模型驱动的多模态情感识别综述：挑战、分类与未来方向

专知会员服务

6+阅读 · 5月22日

安杜里尔与Meta研发军用智能眼镜的内幕

安杜里尔与Meta研发军用智能眼镜的内幕

专知会员服务

7+阅读 · 5月22日

《GPS拒止环境中的网络化赋能目标锁定》总结报告

《GPS拒止环境中的网络化赋能目标锁定》总结报告

专知会员服务

8+阅读 · 5月22日

超越步调威胁：整合人工智能以加速指挥决策

超越步调威胁：整合人工智能以加速指挥决策

专知会员服务

12+阅读 · 5月22日

连接供应链与杀伤链：Palantir 保障与对抗性后勤解决方案

连接供应链与杀伤链：Palantir 保障与对抗性后勤解决方案

专知会员服务

9+阅读 · 5月22日

Nature三连发AI自主科学发现论文

Nature三连发AI自主科学发现论文

专知会员服务

9+阅读 · 5月21日

【综述】大型音频语言模型综述：泛化、可信与未来展望

【综述】大型音频语言模型综述：泛化、可信与未来展望

专知会员服务

9+阅读 · 5月21日

安杜里尔与人工智能驱动防务的崛起

安杜里尔与人工智能驱动防务的崛起

专知会员服务

15+阅读 · 5月21日

相关VIP内容

《利用沉浸式环境提升关键水下基础设施安保中的态势与空间感知能力》

《利用沉浸式环境提升关键水下基础设施安保中的态势与空间感知能力》

专知会员服务

16+阅读 · 4月9日

《以自主水下航行器（AUV）为主机平台的移动磁测距系统评价》最新31页报告

《以自主水下航行器（AUV）为主机平台的移动磁测距系统评价》最新31页报告

专知会员服务

14+阅读 · 2025年6月9日

水下无人通信载荷技术综述与应用前景

水下无人通信载荷技术综述与应用前景

专知会员服务

20+阅读 · 2025年3月30日

自主水下航行器路径规划技术综述及展望

自主水下航行器路径规划技术综述及展望

专知会员服务

57+阅读 · 2023年7月6日

《新兴颠覆性技术：远程海底监视技术》115页报告，澳国防部

《新兴颠覆性技术：远程海底监视技术》115页报告，澳国防部

专知会员服务

50+阅读 · 2023年3月16日

《用于海上监视和自主导航的下一代智能态势感知系统》北约科技组织2022.10最新报告【初译版】

《用于海上监视和自主导航的下一代智能态势感知系统》北约科技组织2022.10最新报告【初译版】

专知会员服务

94+阅读 · 2023年2月19日

《自主水下航行器编队综述：性能、编队控制和通信能力》大连海事大学27页综述论文

《自主水下航行器编队综述：性能、编队控制和通信能力》大连海事大学27页综述论文

专知会员服务

41+阅读 · 2022年12月25日

《远程自主水下航行器性能研究：增强AUV续航能力》2022最新博士论文，瑞典皇家理工学院

《远程自主水下航行器性能研究：增强AUV续航能力》2022最新博士论文，瑞典皇家理工学院

专知会员服务

37+阅读 · 2022年12月25日

【深海自主导航定位】《自主水下航行器多模型交互估计的信息论方法》2022最新154页论文，美国海军研究生院

【深海自主导航定位】《自主水下航行器多模型交互估计的信息论方法》2022最新154页论文，美国海军研究生院

专知会员服务

64+阅读 · 2022年10月27日

《利用知识图谱实现海洋态势感知：一项研究》诺曼底大学、空客防务与航天公司

《利用知识图谱实现海洋态势感知：一项研究》诺曼底大学、空客防务与航天公司

专知会员服务

63+阅读 · 2022年6月22日

热门VIP内容

开通专知VIP会员享更多权益服务

Claw AI Lab：从自动写论文到交互式AI研究实验室

【ICML 2026】MotiMotion：用视觉推理增强运动可控视频生成

[ICML26] 破局长视频理解！快手推出统一框架实现视频定位与深度理解，多项基准测试性能全面提升

美军“沙赫德-136”自杀式无人机仿制型号将获得集群能力

相关资讯

《海军兵棋推演战斗管理辅助工具中的博弈论和规范分析》2022最新84页论文，美海军

《海军兵棋推演战斗管理辅助工具中的博弈论和规范分析》2022最新84页论文，美海军

专知

67+阅读 · 2022年12月1日

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

专知

74+阅读 · 2022年11月19日

【无人机+海事】无人机辅助海上通信:部署考虑、应用和未来挑战

【无人机+海事】无人机辅助海上通信:部署考虑、应用和未来挑战

专知

23+阅读 · 2022年9月23日

推荐！美国海军部《无人作战框架》40页报告，如何布局无人系统以在未来美国分布式海上作战中发挥关键作用

推荐！美国海军部《无人作战框架》40页报告，如何布局无人系统以在未来美国分布式海上作战中发挥关键作用

专知

84+阅读 · 2022年9月7日

前沿：水下机器人及其导航系统

前沿：水下机器人及其导航系统

科学出版社

11+阅读 · 2019年6月22日

PlaNet 简介：用于强化学习的深度规划网络

PlaNet 简介：用于强化学习的深度规划网络

谷歌开发者

13+阅读 · 2019年3月16日

海洋论坛丨水声目标识别技术现状与发展

海洋论坛丨水声目标识别技术现状与发展

无人机

26+阅读 · 2018年12月17日

海洋技术丨超短基线定位技术及在海洋工程中的应用

海洋技术丨超短基线定位技术及在海洋工程中的应用

无人机

28+阅读 · 2018年9月14日

国外无人水下航行器装备与技术现状及展望

国外无人水下航行器装备与技术现状及展望

无人机

14+阅读 · 2018年1月11日

水下无人系统发展现状及关键技术

水下无人系统发展现状及关键技术

无人机

21+阅读 · 2018年1月5日

相关论文

Instantaneous Planning, Control and Safety for Navigation in Unknown Underwater Spaces

Arxiv

0+阅读 · 4月28日

DeepTaxon: An Interpretable Retrieval-Augmented Multimodal Framework for Unified Species Identification and Discovery

Arxiv

0+阅读 · 4月27日

FUTURAL: A Metasearch Platform for Empowering Rural Areas with Smart Solutions

Arxiv

0+阅读 · 4月26日

Task-specific Subnetwork Discovery in Reinforcement Learning for Autonomous Underwater Navigation

Arxiv

0+阅读 · 4月23日

RemoteShield: Enable Robust Multimodal Large Language Models for Earth Observation

Arxiv

0+阅读 · 4月19日

Online Navigation Planning for Long-term Autonomous Operation of Underwater Gliders

Arxiv

0+阅读 · 4月15日

DINO-Explorer: Active Underwater Discovery via Ego-Motion Compensated Semantic Predictive Coding

Arxiv

0+阅读 · 4月14日

Underwater Embodied Intelligence for Autonomous Robots: A Constraint-Coupled Perspective on Planning, Control, and Deployment

Arxiv

1+阅读 · 3月8日

MetaBlue: A Metasurface-Assisted Acoustic Underwater Localization System

Arxiv

0+阅读 · 2月22日

MUOT_3M: A 3 Million Frame Multimodal Underwater Benchmark and the MUTrack Tracking Method

Arxiv

0+阅读 · 2月20日

相关基金

基于边界辨识的水下航行器低频线谱主动调控

国家自然科学基金

2+阅读 · 2015年12月31日

流域景观格局对河流大型底栖动物的影响研究

国家自然科学基金

0+阅读 · 2015年12月31日

动态不确定性条件下基于混杂约束满足问题的水下移动传感器网络节点自定位方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于微生物图像识别的水质监测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

仿复眼视觉系统光谱-偏振敏感机制的水下目标检测方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于线结构光的水下自主作业系统目标识别与定位方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

浅水湖泊沉水植物、附着藻类和螺类之间的相互关系及其对热浪的响应

国家自然科学基金

0+阅读 · 2015年12月31日

基于底栖生物指数的近岸海域生态环境质量评价方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

水下机器人可重构控制系统可靠性分析研究

国家自然科学基金

4+阅读 · 2015年12月31日

粉砂淤泥质海岸带潮沟系统演化过程及其对人类活动响应的遥感监测研究——以江苏中部沿海为例

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员