Assessing Vision-Language Models for Perception in Autonomous Underwater Robotic Software - 专知论文

会员服务 ·

0

软件 · 水下 · 自主水下机器人 · 水下机器人 · 软件工程 ·

Assessing Vision-Language Models for Perception in Autonomous Underwater Robotic Software

翻译：评估视觉语言模型在自主水下机器人软件感知中的应用

Muhammad Yousaf,Aitor Arrieta,Shaukat Ali,Paolo Arcaini,Shuai Wang

from arxiv, 10 pages, 5 figures, submitted to ICST 2026

Autonomous Underwater Robots (AURs) operate in challenging underwater environments, including low visibility and harsh water conditions. Such conditions present challenges for software engineers developing perception modules for the AUR software. To successfully carry out these tasks, deep learning has been incorporated into the AUR software to support its operations. However, the unique challenges of underwater environments pose difficulties for deep learning models, which often rely on labeled data that is scarce and noisy. This may undermine the trustworthiness of AUR software that relies on perception modules. Vision-Language Models (VLMs) offer promising solutions for AUR software as they generalize to unseen objects and remain robust in noisy conditions by inferring information from contextual cues. Despite this potential, their performance and uncertainty in underwater environments remain understudied from a software engineering perspective. Motivated by the needs of an industrial partner in assurance and risk management for maritime systems to assess the potential use of VLMs in this context, we present an empirical evaluation of VLM-based perception modules within the AUR software. We assess their ability to detect underwater trash by computing performance, uncertainty, and their relationship, to enable software engineers to select appropriate VLMs for their AUR software.

翻译：自主水下机器人（AURs）在具有挑战性的水下环境中运行，包括低能见度和恶劣的水体条件。这些条件为开发AUR软件感知模块的软件工程师带来了挑战。为成功执行这些任务，深度学习已被集成到AUR软件中以支持其操作。然而，水下环境的独特挑战给深度学习模型带来了困难，这些模型通常依赖于稀缺且带噪声的标注数据。这可能会损害依赖感知模块的AUR软件的可信度。视觉语言模型（VLMs）为AUR软件提供了有前景的解决方案，因为它们能够泛化到未见过的物体，并通过从上下文线索推断信息在噪声条件下保持鲁棒性。尽管具有这种潜力，从软件工程的角度来看，它们在水下环境中的性能和不确定性仍未得到充分研究。基于一家海事系统保证与风险管理领域工业合作伙伴评估VLMs在此背景下潜在应用的需求，我们对AUR软件中基于VLM的感知模块进行了实证评估。我们通过计算性能、不确定性及其相互关系来评估它们检测水下垃圾的能力，以使软件工程师能够为其AUR软件选择合适的VLMs。

0

相关内容

软件（中国大陆及香港用语，台湾作软体，英文：Software）是一系列按照特定顺序组织的计算机数据和指令的集合。一般来讲软件被划分为编程语言、系统软件、应用软件和介于这两者之间的中间件。软件就是程序加文档的集合体。

MIT人机协同水下作业关键技术研究——集成适配至美国海军现役AUV

MIT人机协同水下作业关键技术研究——集成适配至美国海军现役AUV

专知会员服务

15+阅读 · 4月28日

【CMU博士论文】水下三维视觉感知与生成

【CMU博士论文】水下三维视觉感知与生成

专知会员服务

19+阅读 · 2025年8月20日

《基于深度学习的水下作战自动目标识别技术开发》最新报告

《基于深度学习的水下作战自动目标识别技术开发》最新报告

专知会员服务

19+阅读 · 2025年6月7日

《为水下战争开发基于深度学习的目标自动识别系统》最新报告

《为水下战争开发基于深度学习的目标自动识别系统》最新报告

专知会员服务

47+阅读 · 2024年12月7日

《改进水下恶劣条件下人机协作的机器视觉》252页

《改进水下恶劣条件下人机协作的机器视觉》252页

专知会员服务

30+阅读 · 2024年3月13日

自主水下航行器路径规划技术综述及展望

自主水下航行器路径规划技术综述及展望

专知会员服务

58+阅读 · 2023年7月6日

《自主水下航行器编队综述：性能、编队控制和通信能力》大连海事大学27页综述论文

《自主水下航行器编队综述：性能、编队控制和通信能力》大连海事大学27页综述论文

专知会员服务

42+阅读 · 2022年12月25日

《远程自主水下航行器性能研究：增强AUV续航能力》2022最新博士论文，瑞典皇家理工学院

《远程自主水下航行器性能研究：增强AUV续航能力》2022最新博士论文，瑞典皇家理工学院

专知会员服务

38+阅读 · 2022年12月25日

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

专知会员服务

35+阅读 · 2022年12月12日

【深海自主导航定位】《自主水下航行器多模型交互估计的信息论方法》2022最新154页论文，美国海军研究生院

【深海自主导航定位】《自主水下航行器多模型交互估计的信息论方法》2022最新154页论文，美国海军研究生院

专知会员服务

65+阅读 · 2022年10月27日

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

专知

74+阅读 · 2022年11月19日

【干货书】基于深度学习的机器人感知与认知，638页pdf

【干货书】基于深度学习的机器人感知与认知，638页pdf

专知

19+阅读 · 2022年7月30日

【AI与军事】机器学习的军事应用，一种文献计量视角

【AI与军事】机器学习的军事应用，一种文献计量视角

专知

55+阅读 · 2022年4月25日

概述自动机器学习（AutoML）

概述自动机器学习（AutoML）

人工智能学家

19+阅读 · 2019年8月11日

计算机视觉方向简介 | 基于自然语言的跨模态行人re-id的SOTA方法（上）

计算机视觉方向简介 | 基于自然语言的跨模态行人re-id的SOTA方法（上）

计算机视觉life

12+阅读 · 2019年6月29日

前沿：水下机器人及其导航系统

前沿：水下机器人及其导航系统

科学出版社

11+阅读 · 2019年6月22日

AutoML研究综述：让AI学习设计AI

AutoML研究综述：让AI学习设计AI

机器之心

15+阅读 · 2019年5月7日

【泡泡图灵智库】自动驾驶中的基于立体视觉的3D语义物体和相机运动追踪（ECCV）

【泡泡图灵智库】自动驾驶中的基于立体视觉的3D语义物体和相机运动追踪（ECCV）

泡泡机器人SLAM

10+阅读 · 2019年4月18日

深度学习在自动驾驶感知领域的应用

深度学习在自动驾驶感知领域的应用

AI100

11+阅读 · 2019年3月6日

水下无人系统发展现状及关键技术

水下无人系统发展现状及关键技术

无人机

21+阅读 · 2018年1月5日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

52+阅读 · 2015年12月31日

动态不确定性条件下基于混杂约束满足问题的水下移动传感器网络节点自定位方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

仿复眼视觉系统光谱-偏振敏感机制的水下目标检测方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向智能机器人柔性装配系统自主控制的主动视觉感知技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于线结构光的水下自主作业系统目标识别与定位方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

自主式水下机器人推进器的故障诊断与容错控制方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

水下机器人可重构控制系统可靠性分析研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于确定学习方法的无人水面艇智能控制研究

国家自然科学基金

17+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

Evaluating VLMs' Spatial Reasoning Over Robot Motion: A Step Towards Robot Planning with Motion Preferences

Arxiv

0+阅读 · 3月13日

Underwater Embodied Intelligence for Autonomous Robots: A Constraint-Coupled Perspective on Planning, Control, and Deployment

Arxiv

1+阅读 · 3月8日

Uncertainty-Aware Adaptive Dynamics For Underwater Vehicle-Manipulator Robots

Arxiv

0+阅读 · 3月6日

UAMTERS: Uncertainty-Aware Mutation Analysis for DL-enabled Robotic Software

Arxiv

0+阅读 · 2月23日

Assessing Vision-Language Models for Perception in Autonomous Underwater Robotic Software

Arxiv

0+阅读 · 2月13日

Self-Refining Vision Language Model for Robotic Failure Detection and Reasoning

Arxiv

0+阅读 · 2月12日

Biomimetic Mantaray robot toward the underwater autonomous -- Experimental verification of swimming and diving by flapping motion -

Arxiv

0+阅读 · 2月11日

Edge-Optimized Vision-Language Models for Underground Infrastructure Assessment

Arxiv

0+阅读 · 2月3日

Reinforcement Learning for Active Perception in Autonomous Navigation

Arxiv

0+阅读 · 2月1日

Fast Policy Learning for 6-DOF Position Control of Underwater Vehicles

Arxiv

0+阅读 · 1月31日

VIP会员

文章信息

相关主题

自主水下机器人

水下机器人

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

2+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

2+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

4+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

3+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

3+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

MIT人机协同水下作业关键技术研究——集成适配至美国海军现役AUV

MIT人机协同水下作业关键技术研究——集成适配至美国海军现役AUV

专知会员服务

15+阅读 · 4月28日

【CMU博士论文】水下三维视觉感知与生成

【CMU博士论文】水下三维视觉感知与生成

专知会员服务

19+阅读 · 2025年8月20日

《基于深度学习的水下作战自动目标识别技术开发》最新报告

《基于深度学习的水下作战自动目标识别技术开发》最新报告

专知会员服务

19+阅读 · 2025年6月7日

《为水下战争开发基于深度学习的目标自动识别系统》最新报告

《为水下战争开发基于深度学习的目标自动识别系统》最新报告

专知会员服务

47+阅读 · 2024年12月7日

《改进水下恶劣条件下人机协作的机器视觉》252页

《改进水下恶劣条件下人机协作的机器视觉》252页

专知会员服务

30+阅读 · 2024年3月13日

自主水下航行器路径规划技术综述及展望

自主水下航行器路径规划技术综述及展望

专知会员服务

58+阅读 · 2023年7月6日

《自主水下航行器编队综述：性能、编队控制和通信能力》大连海事大学27页综述论文

《自主水下航行器编队综述：性能、编队控制和通信能力》大连海事大学27页综述论文

专知会员服务

42+阅读 · 2022年12月25日

《远程自主水下航行器性能研究：增强AUV续航能力》2022最新博士论文，瑞典皇家理工学院

《远程自主水下航行器性能研究：增强AUV续航能力》2022最新博士论文，瑞典皇家理工学院

专知会员服务

38+阅读 · 2022年12月25日

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

专知会员服务

35+阅读 · 2022年12月12日

【深海自主导航定位】《自主水下航行器多模型交互估计的信息论方法》2022最新154页论文，美国海军研究生院

【深海自主导航定位】《自主水下航行器多模型交互估计的信息论方法》2022最新154页论文，美国海军研究生院

专知会员服务

65+阅读 · 2022年10月27日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

专知

74+阅读 · 2022年11月19日

【干货书】基于深度学习的机器人感知与认知，638页pdf

【干货书】基于深度学习的机器人感知与认知，638页pdf

专知

19+阅读 · 2022年7月30日

【AI与军事】机器学习的军事应用，一种文献计量视角

【AI与军事】机器学习的军事应用，一种文献计量视角

专知

55+阅读 · 2022年4月25日

概述自动机器学习（AutoML）

概述自动机器学习（AutoML）

人工智能学家

19+阅读 · 2019年8月11日

计算机视觉方向简介 | 基于自然语言的跨模态行人re-id的SOTA方法（上）

计算机视觉方向简介 | 基于自然语言的跨模态行人re-id的SOTA方法（上）

计算机视觉life

12+阅读 · 2019年6月29日

前沿：水下机器人及其导航系统

前沿：水下机器人及其导航系统

科学出版社

11+阅读 · 2019年6月22日

AutoML研究综述：让AI学习设计AI

AutoML研究综述：让AI学习设计AI

机器之心

15+阅读 · 2019年5月7日

【泡泡图灵智库】自动驾驶中的基于立体视觉的3D语义物体和相机运动追踪（ECCV）

【泡泡图灵智库】自动驾驶中的基于立体视觉的3D语义物体和相机运动追踪（ECCV）

泡泡机器人SLAM

10+阅读 · 2019年4月18日

深度学习在自动驾驶感知领域的应用

深度学习在自动驾驶感知领域的应用

AI100

11+阅读 · 2019年3月6日

水下无人系统发展现状及关键技术

水下无人系统发展现状及关键技术

无人机

21+阅读 · 2018年1月5日

相关论文

Evaluating VLMs' Spatial Reasoning Over Robot Motion: A Step Towards Robot Planning with Motion Preferences

Arxiv

0+阅读 · 3月13日

Underwater Embodied Intelligence for Autonomous Robots: A Constraint-Coupled Perspective on Planning, Control, and Deployment

Arxiv

1+阅读 · 3月8日

Uncertainty-Aware Adaptive Dynamics For Underwater Vehicle-Manipulator Robots

Arxiv

0+阅读 · 3月6日

UAMTERS: Uncertainty-Aware Mutation Analysis for DL-enabled Robotic Software

Arxiv

0+阅读 · 2月23日

Assessing Vision-Language Models for Perception in Autonomous Underwater Robotic Software

Arxiv

0+阅读 · 2月13日

Self-Refining Vision Language Model for Robotic Failure Detection and Reasoning

Arxiv

0+阅读 · 2月12日

Biomimetic Mantaray robot toward the underwater autonomous -- Experimental verification of swimming and diving by flapping motion -

Arxiv

0+阅读 · 2月11日

Edge-Optimized Vision-Language Models for Underground Infrastructure Assessment

Arxiv

0+阅读 · 2月3日

Reinforcement Learning for Active Perception in Autonomous Navigation

Arxiv

0+阅读 · 2月1日

Fast Policy Learning for 6-DOF Position Control of Underwater Vehicles

Arxiv

0+阅读 · 1月31日

相关基金

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

52+阅读 · 2015年12月31日

动态不确定性条件下基于混杂约束满足问题的水下移动传感器网络节点自定位方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

仿复眼视觉系统光谱-偏振敏感机制的水下目标检测方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向智能机器人柔性装配系统自主控制的主动视觉感知技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于线结构光的水下自主作业系统目标识别与定位方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

自主式水下机器人推进器的故障诊断与容错控制方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

水下机器人可重构控制系统可靠性分析研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于确定学习方法的无人水面艇智能控制研究

国家自然科学基金

17+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员