评估自主水下机器人软件感知能力的视觉-语言模型 (Assessing Vision-Language Models for Perception in Autonomous Underwater Robotic Software) - 专知论文

会员服务 ·

0

水下 · 软件 · 自主水下机器人 · 水下机器人 · 机器人 ·

Assessing Vision-Language Models for Perception in Autonomous Underwater Robotic Software

翻译：评估自主水下机器人软件感知能力的视觉-语言模型

Muhammad Yousaf,Aitor Arrieta,Shaukat Ali,Paolo Arcaini,Shuai Wang

from arxiv, 16 pages, 5 figures

Autonomous Underwater Robots (AURs) operate in challenging underwater environments, including low visibility and harsh water conditions. Such conditions present challenges for software engineers developing perception modules for the AUR software. To successfully carry out these tasks, deep learning has been incorporated into the AUR software to support its operations. However, the unique challenges of underwater environments pose difficulties for deep learning models, which often rely on labeled data that is scarce and noisy. This may undermine the trustworthiness of AUR software that relies on perception modules. Vision-Language Models (VLMs) offer promising solutions for AUR software as they generalize to unseen objects and remain robust in noisy conditions by inferring information from contextual cues. Despite this potential, their performance and uncertainty in underwater environments remain understudied from a software engineering perspective. Motivated by the needs of an industrial partner in assurance and risk management for maritime systems to assess the potential use of VLMs in this context, we present an empirical evaluation of VLM-based perception modules within the AUR software. We assess their ability to detect underwater trash by computing performance, uncertainty, and their relationship, to enable software engineers to select appropriate VLMs for their AUR software.

翻译：自主水下机器人在具有挑战性的水下环境中运行，包括低能见度和恶劣的水体条件。这些条件为开发自主水下机器人软件感知模块的软件工程师带来了挑战。为成功执行这些任务，深度学习已被整合到自主水下机器人软件中以支持其操作。然而，水下环境的独特挑战给深度学习模型带来了困难，这些模型通常依赖于稀缺且带有噪声的标注数据。这可能会损害依赖感知模块的自主水下机器人软件的可信度。视觉-语言模型为自主水下机器人软件提供了有前景的解决方案，因为它们能够泛化到未见过的物体，并通过从上下文线索中推断信息在噪声条件下保持鲁棒性。尽管具有这种潜力，但从软件工程的角度来看，它们在水下环境中的性能和不确定性仍未得到充分研究。基于工业合作伙伴在海事系统保证和风险管理方面评估视觉-语言模型在此背景下潜在应用的需求，我们对自主水下机器人软件中基于视觉-语言模型的感知模块进行了实证评估。我们通过计算性能、不确定性及其相互关系来评估它们检测水下垃圾的能力，以使软件工程师能够为其自主水下机器人软件选择合适的视觉-语言模型。

0

相关内容

【CMU博士论文】水下三维视觉感知与生成

【CMU博士论文】水下三维视觉感知与生成

专知会员服务

19+阅读 · 2025年8月20日

《基于深度学习的水下作战自动目标识别技术开发》最新报告

《基于深度学习的水下作战自动目标识别技术开发》最新报告

专知会员服务

18+阅读 · 2025年6月7日

《为水下战争开发基于深度学习的目标自动识别系统》最新报告

《为水下战争开发基于深度学习的目标自动识别系统》最新报告

专知会员服务

46+阅读 · 2024年12月7日

《改进水下恶劣条件下人机协作的机器视觉》252页

《改进水下恶劣条件下人机协作的机器视觉》252页

专知会员服务

29+阅读 · 2024年3月13日

水下航行器视觉控制技术综述

水下航行器视觉控制技术综述

专知会员服务

49+阅读 · 2024年1月9日

《远程自主水下航行器性能研究：增强AUV续航能力》2022最新博士论文，瑞典皇家理工学院

《远程自主水下航行器性能研究：增强AUV续航能力》2022最新博士论文，瑞典皇家理工学院

专知会员服务

37+阅读 · 2022年12月25日

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

专知会员服务

34+阅读 · 2022年12月12日

用于自主船舶态势感知的传感器和人工智能技术综述

用于自主船舶态势感知的传感器和人工智能技术综述

专知会员服务

67+阅读 · 2022年10月22日

《实现具有一致性和全局最优的鲁棒多智能体自主水下检测方法》密歇根大学150页博士论文

《实现具有一致性和全局最优的鲁棒多智能体自主水下检测方法》密歇根大学150页博士论文

专知会员服务

34+阅读 · 2022年9月29日

【AI+军事】附论文+PPT 《建立在复杂海上作业中训练自动驾驶汽车的建模与仿真能力》

【AI+军事】附论文+PPT 《建立在复杂海上作业中训练自动驾驶汽车的建模与仿真能力》

专知会员服务

68+阅读 · 2022年4月16日

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

专知

71+阅读 · 2022年11月19日

【干货书】基于深度学习的机器人感知与认知，638页pdf

【干货书】基于深度学习的机器人感知与认知，638页pdf

专知

19+阅读 · 2022年7月30日

【AI与军事】机器学习的军事应用，一种文献计量视角

【AI与军事】机器学习的军事应用，一种文献计量视角

专知

54+阅读 · 2022年4月25日

概述自动机器学习（AutoML）

概述自动机器学习（AutoML）

人工智能学家

19+阅读 · 2019年8月11日

前沿：水下机器人及其导航系统

前沿：水下机器人及其导航系统

科学出版社

11+阅读 · 2019年6月22日

无人驾驶仿真软件

无人驾驶仿真软件

智能交通技术

22+阅读 · 2019年5月9日

【综述】自动机器学习AutoML最新65页综述，带你了解最新进展

【综述】自动机器学习AutoML最新65页综述，带你了解最新进展

中国人工智能学会

48+阅读 · 2019年5月3日

【泡泡图灵智库】自动驾驶中的基于立体视觉的3D语义物体和相机运动追踪（ECCV）

【泡泡图灵智库】自动驾驶中的基于立体视觉的3D语义物体和相机运动追踪（ECCV）

泡泡机器人SLAM

10+阅读 · 2019年4月18日

【论文推荐】最新5篇聊天机器人（Chatbot）相关论文—深度强化学习、社交聊天机器人小冰、对话聊天助手、序列-序列、动态词汇

【论文推荐】最新5篇聊天机器人（Chatbot）相关论文—深度强化学习、社交聊天机器人小冰、对话聊天助手、序列-序列、动态词汇

专知

23+阅读 · 2018年1月30日

水下无人系统发展现状及关键技术

水下无人系统发展现状及关键技术

无人机

21+阅读 · 2018年1月5日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

50+阅读 · 2015年12月31日

动态不确定性条件下基于混杂约束满足问题的水下移动传感器网络节点自定位方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

仿复眼视觉系统光谱-偏振敏感机制的水下目标检测方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向智能机器人柔性装配系统自主控制的主动视觉感知技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于线结构光的水下自主作业系统目标识别与定位方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

自主式水下机器人推进器的故障诊断与容错控制方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

水下机器人可重构控制系统可靠性分析研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于确定学习方法的无人水面艇智能控制研究

国家自然科学基金

17+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

Self-Refining Vision Language Model for Robotic Failure Detection and Reasoning

Arxiv

0+阅读 · 2月12日

Biomimetic Mantaray robot toward the underwater autonomous -- Experimental verification of swimming and diving by flapping motion -

Arxiv

0+阅读 · 2月11日

Assessing Vision-Language Models for Perception in Autonomous Underwater Robotic Software

Arxiv

0+阅读 · 2月11日

DREAM: Domain-aware Reasoning for Efficient Autonomous Underwater Monitoring

Arxiv

0+阅读 · 2月9日

A Machine Learning Enabled MDO for Bio-Inspired Autonomous Underwater Gliders

Arxiv

0+阅读 · 2月9日

Edge-Optimized Vision-Language Models for Underground Infrastructure Assessment

Arxiv

0+阅读 · 2月3日

Before Autonomy Takes Control: Software Testing in Robotics

Arxiv

0+阅读 · 2月2日

AutoDriDM: An Explainable Benchmark for Decision-Making of Vision-Language Models in Autonomous Driving

Arxiv

0+阅读 · 1月21日

A Comprehensive Review of Bio-Inspired Approaches to Coordination, Communication, and System Architecture in Underwater Swarm Robotics

Arxiv

0+阅读 · 1月18日

RobotDesignGPT: Automated Robot Design Synthesis using Vision Language Models

Arxiv

0+阅读 · 1月16日

VIP会员

文章信息

相关主题

自主水下机器人

水下机器人

相关VIP内容

【CMU博士论文】水下三维视觉感知与生成

【CMU博士论文】水下三维视觉感知与生成

专知会员服务

19+阅读 · 2025年8月20日

《基于深度学习的水下作战自动目标识别技术开发》最新报告

《基于深度学习的水下作战自动目标识别技术开发》最新报告

专知会员服务

18+阅读 · 2025年6月7日

《为水下战争开发基于深度学习的目标自动识别系统》最新报告

《为水下战争开发基于深度学习的目标自动识别系统》最新报告

专知会员服务

46+阅读 · 2024年12月7日

《改进水下恶劣条件下人机协作的机器视觉》252页

《改进水下恶劣条件下人机协作的机器视觉》252页

专知会员服务

29+阅读 · 2024年3月13日

水下航行器视觉控制技术综述

水下航行器视觉控制技术综述

专知会员服务

49+阅读 · 2024年1月9日

《远程自主水下航行器性能研究：增强AUV续航能力》2022最新博士论文，瑞典皇家理工学院

《远程自主水下航行器性能研究：增强AUV续航能力》2022最新博士论文，瑞典皇家理工学院

专知会员服务

37+阅读 · 2022年12月25日

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

专知会员服务

34+阅读 · 2022年12月12日

用于自主船舶态势感知的传感器和人工智能技术综述

用于自主船舶态势感知的传感器和人工智能技术综述

专知会员服务

67+阅读 · 2022年10月22日

《实现具有一致性和全局最优的鲁棒多智能体自主水下检测方法》密歇根大学150页博士论文

《实现具有一致性和全局最优的鲁棒多智能体自主水下检测方法》密歇根大学150页博士论文

专知会员服务

34+阅读 · 2022年9月29日

【AI+军事】附论文+PPT 《建立在复杂海上作业中训练自动驾驶汽车的建模与仿真能力》

【AI+军事】附论文+PPT 《建立在复杂海上作业中训练自动驾驶汽车的建模与仿真能力》

专知会员服务

68+阅读 · 2022年4月16日

热门VIP内容

开通专知VIP会员享更多权益服务

《可信人工智能赋能系统的支柱》

《从经典神经网络到不确定性下的拓扑神经网络：军事应用》2026最新40页报告

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

《人工智能：对战略与力量的影响》slides

相关资讯

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

专知

71+阅读 · 2022年11月19日

【干货书】基于深度学习的机器人感知与认知，638页pdf

【干货书】基于深度学习的机器人感知与认知，638页pdf

专知

19+阅读 · 2022年7月30日

【AI与军事】机器学习的军事应用，一种文献计量视角

【AI与军事】机器学习的军事应用，一种文献计量视角

专知

54+阅读 · 2022年4月25日

概述自动机器学习（AutoML）

概述自动机器学习（AutoML）

人工智能学家

19+阅读 · 2019年8月11日

前沿：水下机器人及其导航系统

前沿：水下机器人及其导航系统

科学出版社

11+阅读 · 2019年6月22日

无人驾驶仿真软件

无人驾驶仿真软件

智能交通技术

22+阅读 · 2019年5月9日

【综述】自动机器学习AutoML最新65页综述，带你了解最新进展

【综述】自动机器学习AutoML最新65页综述，带你了解最新进展

中国人工智能学会

48+阅读 · 2019年5月3日

【泡泡图灵智库】自动驾驶中的基于立体视觉的3D语义物体和相机运动追踪（ECCV）

【泡泡图灵智库】自动驾驶中的基于立体视觉的3D语义物体和相机运动追踪（ECCV）

泡泡机器人SLAM

10+阅读 · 2019年4月18日

【论文推荐】最新5篇聊天机器人（Chatbot）相关论文—深度强化学习、社交聊天机器人小冰、对话聊天助手、序列-序列、动态词汇

【论文推荐】最新5篇聊天机器人（Chatbot）相关论文—深度强化学习、社交聊天机器人小冰、对话聊天助手、序列-序列、动态词汇

专知

23+阅读 · 2018年1月30日

水下无人系统发展现状及关键技术

水下无人系统发展现状及关键技术

无人机

21+阅读 · 2018年1月5日

相关论文

Self-Refining Vision Language Model for Robotic Failure Detection and Reasoning

Arxiv

0+阅读 · 2月12日

Biomimetic Mantaray robot toward the underwater autonomous -- Experimental verification of swimming and diving by flapping motion -

Arxiv

0+阅读 · 2月11日

Assessing Vision-Language Models for Perception in Autonomous Underwater Robotic Software

Arxiv

0+阅读 · 2月11日

DREAM: Domain-aware Reasoning for Efficient Autonomous Underwater Monitoring

Arxiv

0+阅读 · 2月9日

A Machine Learning Enabled MDO for Bio-Inspired Autonomous Underwater Gliders

Arxiv

0+阅读 · 2月9日

Edge-Optimized Vision-Language Models for Underground Infrastructure Assessment

Arxiv

0+阅读 · 2月3日

Before Autonomy Takes Control: Software Testing in Robotics

Arxiv

0+阅读 · 2月2日

AutoDriDM: An Explainable Benchmark for Decision-Making of Vision-Language Models in Autonomous Driving

Arxiv

0+阅读 · 1月21日

A Comprehensive Review of Bio-Inspired Approaches to Coordination, Communication, and System Architecture in Underwater Swarm Robotics

Arxiv

0+阅读 · 1月18日

RobotDesignGPT: Automated Robot Design Synthesis using Vision Language Models

Arxiv

0+阅读 · 1月16日

相关基金

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

50+阅读 · 2015年12月31日

动态不确定性条件下基于混杂约束满足问题的水下移动传感器网络节点自定位方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

仿复眼视觉系统光谱-偏振敏感机制的水下目标检测方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向智能机器人柔性装配系统自主控制的主动视觉感知技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于线结构光的水下自主作业系统目标识别与定位方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

自主式水下机器人推进器的故障诊断与容错控制方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

水下机器人可重构控制系统可靠性分析研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于确定学习方法的无人水面艇智能控制研究

国家自然科学基金

17+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员