Semantically-Aware Diver Activity Recognition Framework for Effective Underwater Multi-Human-Robot Collaboration - 专知论文

会员服务 ·

0

回合 · 数据集 · 操作 · Learning · INTERACT ·

Semantically-Aware Diver Activity Recognition Framework for Effective Underwater Multi-Human-Robot Collaboration

翻译：面向有效多人类-机器人水下协作的语义感知潜水员活动识别框架

Sadman Sakib Enan,Junaed Sattar

Effective multi-human-robot collaboration is essential for expanding human-led operations in the challenging and high-risk underwater environment. For autonomous underwater vehicles (AUVs) to become true teammates, they must be able to comprehend their surroundings and recognize a diver's activities to offer assistance and ensure safety. Towards this goal, we introduce DAR-Net, a novel transformer-based framework that analyzes complex underwater scenes to classify diver activities. Our contribution lies in a semantically guided learning formulation that couples transformer-based temporal reasoning with pixel-level scene supervision. This multi-loss training strategy explicitly aligns global activity recognition with local human-robot interaction semantics, which is particularly critical in low-visibility underwater conditions. To address the significant challenge of data scarcity in this domain, we present the first-ever Underwater Diver Activity (UDA) dataset, a foundational resource containing over 2,600 annotated images with pixel-level masks. Through rigorous experimental evaluations in a controlled environment, we demonstrate that DAR-Net achieves promising accuracy in recognizing six distinct diver activities, outperforming state-of-the-art models. While this dataset provides a crucial baseline, our work serves as a pioneering step, laying the groundwork for future research and facilitating the development of more intelligent, collaborative underwater robotic systems.

翻译：有效的多人类-机器人协作对于在具有挑战性和高风险的深海环境中扩展人类主导操作至关重要。要使自主水下机器人（AUV）成为真正的队友，它们必须能够理解周围环境并识别潜水员的活动，以提供协助并确保安全。为实现这一目标，我们提出了DAR-Net，一种新颖的基于Transformer的框架，用于分析复杂水下场景并分类潜水员活动。我们的贡献在于一种语义引导的学习方法，它将基于Transformer的时间推理与像素级场景监督相结合。这种多损失训练策略明确地将全局活动识别与局部人机交互语义对齐，这在低能见度水下条件下尤为关键。为应对该领域数据稀缺的重大挑战，我们首次提出了水下潜水员活动（UDA）数据集，这是一个包含超过2600张带有像素级掩码的标注图像的基础资源。通过在受控环境中进行严格的实验评估，我们证明了DAR-Net在识别六种不同潜水员活动方面达到了令人满意的准确性，并超越了最先进的模型。尽管该数据集提供了关键基线，我们的工作作为一个开创性步骤，为未来研究奠定了基础，并促进了更智能、协作性水下机器人系统的开发。

0

相关内容

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

9+阅读 · 8月1日

MIT人机协同水下作业关键技术研究——集成适配至美国海军现役AUV

MIT人机协同水下作业关键技术研究——集成适配至美国海军现役AUV

专知会员服务

15+阅读 · 4月28日

《多机器人系统协作效能提升：基于模型与数据驱动的具身智能方法》339页

《多机器人系统协作效能提升：基于模型与数据驱动的具身智能方法》339页

专知会员服务

62+阅读 · 2025年4月6日

采用扩散模型实现隐蔽通信的自主潜航器智能猎杀策略

采用扩散模型实现隐蔽通信的自主潜航器智能猎杀策略

专知会员服务

24+阅读 · 2025年3月27日

《改进水下恶劣条件下人机协作的机器视觉》252页

《改进水下恶劣条件下人机协作的机器视觉》252页

专知会员服务

30+阅读 · 2024年3月13日

《自主水下航行器编队综述：性能、编队控制和通信能力》大连海事大学27页综述论文

《自主水下航行器编队综述：性能、编队控制和通信能力》大连海事大学27页综述论文

专知会员服务

42+阅读 · 2022年12月25日

《远程自主水下航行器性能研究：增强AUV续航能力》2022最新博士论文，瑞典皇家理工学院

《远程自主水下航行器性能研究：增强AUV续航能力》2022最新博士论文，瑞典皇家理工学院

专知会员服务

38+阅读 · 2022年12月25日

《混合精度强化学习在无人潜航器控制仿真中的应用》2022最新29页报告

《混合精度强化学习在无人潜航器控制仿真中的应用》2022最新29页报告

专知会员服务

43+阅读 · 2022年11月23日

《实现具有一致性和全局最优的鲁棒多智能体自主水下检测方法》密歇根大学150页博士论文

《实现具有一致性和全局最优的鲁棒多智能体自主水下检测方法》密歇根大学150页博士论文

专知会员服务

35+阅读 · 2022年9月29日

【军用机器人+博弈论】paper速读：美国陆军研究实验室提出“基于博弈论的多机器人协作行动模型”

【军用机器人+博弈论】paper速读：美国陆军研究实验室提出“基于博弈论的多机器人协作行动模型”

专知会员服务

68+阅读 · 2022年3月21日

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

27+阅读 · 2022年11月24日

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

专知

30+阅读 · 2022年11月23日

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

专知

68+阅读 · 2022年11月2日

推荐！【美国国防分析顶点报告】《机器人和自主系统：有人/无人组队(RAS-MUM-T)》107页报告

推荐！【美国国防分析顶点报告】《机器人和自主系统：有人/无人组队(RAS-MUM-T)》107页报告

专知

39+阅读 · 2022年9月12日

推荐！《基于人工智能（AI）的空中和导弹防御（AMD）：以结果为导向的辅助决策》美国海军研究生院系统工程顶点报告145页

推荐！《基于人工智能（AI）的空中和导弹防御（AMD）：以结果为导向的辅助决策》美国海军研究生院系统工程顶点报告145页

专知

119+阅读 · 2022年9月1日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

人工智能时代智能化海战模式

人工智能时代智能化海战模式

科技导报

21+阅读 · 2019年7月5日

前沿：水下机器人及其导航系统

前沿：水下机器人及其导航系统

科学出版社

11+阅读 · 2019年6月22日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

水下无人系统发展现状及关键技术

水下无人系统发展现状及关键技术

无人机

21+阅读 · 2018年1月5日

三维空间基于角度测量的多机器人系统协同定位与编队控制

国家自然科学基金

11+阅读 · 2015年12月31日

基于线结构光的水下自主作业系统目标识别与定位方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

自主式水下机器人推进器的故障诊断与容错控制方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

水下机器人可重构控制系统可靠性分析研究

国家自然科学基金

4+阅读 · 2015年12月31日

复杂环境下异构自主海洋航行器网络的协同优化控制

国家自然科学基金

5+阅读 · 2015年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

面向人与Agent混合的多团队协作仿真训练方法研究

国家自然科学基金

19+阅读 · 2012年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

Algorithmic Prompt Generation for Diverse Human-like Teaming and Communication with Large Language Models

Arxiv

0+阅读 · 6月15日

Cross-Domain Multi-Person Human Activity Recognition via Near-Field Wi-Fi Sensing

Arxiv

0+阅读 · 6月10日

NestRL: A Nested Training Regime for Mutual Adaptation in Human-AI Teaming

Arxiv

0+阅读 · 6月1日

Towards Shared Embodied Intelligence in Humanoid Robots through Optimization Development and Testing of the Human Aware ergoCub Robot

Arxiv

0+阅读 · 5月26日

Sea Trial Validation of the ROS-DESERT Middleware with Autonomous Underwater Vehicles

Arxiv

0+阅读 · 5月22日

Modulation Feature Enhancement with a Multi-Stage Attention Network for Underwater Acoustic Target Recognition

Arxiv

0+阅读 · 5月20日

HECTOR: Human-centric Hierarchical Coordination and Supervision of Robotic Fleets under Continual Temporal Tasks

Arxiv

0+阅读 · 5月14日

EROAS: 3D Efficient Reactive Obstacle Avoidance System for Autonomous Underwater Vehicles using 2.5D Forward-Looking Sonar

Arxiv

0+阅读 · 5月11日

Melding LLM and temporal logic for reliable human-swarm collaboration in complex scenarios

Arxiv

0+阅读 · 5月8日

A Workflow-Oriented Framework for Asynchronous Human-AI Collaboration in Hybrid and Compute-Intensive HPC Environments

Arxiv

0+阅读 · 5月5日

VIP会员

文章信息

相关主题

最新内容

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

专知会员服务

2+阅读 · 今天7:13

俄乌无人机战争的六大启示

俄乌无人机战争的六大启示

专知会员服务

4+阅读 · 今天7:07

《无人机空中监控：通信实验洞察》

《无人机空中监控：通信实验洞察》

专知会员服务

3+阅读 · 今天7:05

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

专知会员服务

3+阅读 · 今天6:59

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

12+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

5+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

10+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

12+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

6+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

10+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

8+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

9+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

8+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

6+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

13+阅读 · 7月31日

相关VIP内容

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

9+阅读 · 8月1日

MIT人机协同水下作业关键技术研究——集成适配至美国海军现役AUV

MIT人机协同水下作业关键技术研究——集成适配至美国海军现役AUV

专知会员服务

15+阅读 · 4月28日

《多机器人系统协作效能提升：基于模型与数据驱动的具身智能方法》339页

《多机器人系统协作效能提升：基于模型与数据驱动的具身智能方法》339页

专知会员服务

62+阅读 · 2025年4月6日

采用扩散模型实现隐蔽通信的自主潜航器智能猎杀策略

采用扩散模型实现隐蔽通信的自主潜航器智能猎杀策略

专知会员服务

24+阅读 · 2025年3月27日

《改进水下恶劣条件下人机协作的机器视觉》252页

《改进水下恶劣条件下人机协作的机器视觉》252页

专知会员服务

30+阅读 · 2024年3月13日

《自主水下航行器编队综述：性能、编队控制和通信能力》大连海事大学27页综述论文

《自主水下航行器编队综述：性能、编队控制和通信能力》大连海事大学27页综述论文

专知会员服务

42+阅读 · 2022年12月25日

《远程自主水下航行器性能研究：增强AUV续航能力》2022最新博士论文，瑞典皇家理工学院

《远程自主水下航行器性能研究：增强AUV续航能力》2022最新博士论文，瑞典皇家理工学院

专知会员服务

38+阅读 · 2022年12月25日

《混合精度强化学习在无人潜航器控制仿真中的应用》2022最新29页报告

《混合精度强化学习在无人潜航器控制仿真中的应用》2022最新29页报告

专知会员服务

43+阅读 · 2022年11月23日

《实现具有一致性和全局最优的鲁棒多智能体自主水下检测方法》密歇根大学150页博士论文

《实现具有一致性和全局最优的鲁棒多智能体自主水下检测方法》密歇根大学150页博士论文

专知会员服务

35+阅读 · 2022年9月29日

【军用机器人+博弈论】paper速读：美国陆军研究实验室提出“基于博弈论的多机器人协作行动模型”

【军用机器人+博弈论】paper速读：美国陆军研究实验室提出“基于博弈论的多机器人协作行动模型”

专知会员服务

68+阅读 · 2022年3月21日

热门VIP内容

开通专知VIP会员享更多权益服务

俄乌无人机战争的六大启示

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《无人机空中监控：通信实验洞察》

相关资讯

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

27+阅读 · 2022年11月24日

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

【集群机器人】《考虑敌手的多智能体系统协同任务分配与运动规划》2022最新226页博士论文，密歇根大学

专知

30+阅读 · 2022年11月23日

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

《可解释人工智能在多域作战中的智能增强》美国陆军、IBM、卡迪夫大学等论文

专知

68+阅读 · 2022年11月2日

推荐！【美国国防分析顶点报告】《机器人和自主系统：有人/无人组队(RAS-MUM-T)》107页报告

推荐！【美国国防分析顶点报告】《机器人和自主系统：有人/无人组队(RAS-MUM-T)》107页报告

专知

39+阅读 · 2022年9月12日

推荐！《基于人工智能（AI）的空中和导弹防御（AMD）：以结果为导向的辅助决策》美国海军研究生院系统工程顶点报告145页

推荐！《基于人工智能（AI）的空中和导弹防御（AMD）：以结果为导向的辅助决策》美国海军研究生院系统工程顶点报告145页

专知

119+阅读 · 2022年9月1日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

人工智能时代智能化海战模式

人工智能时代智能化海战模式

科技导报

21+阅读 · 2019年7月5日

前沿：水下机器人及其导航系统

前沿：水下机器人及其导航系统

科学出版社

11+阅读 · 2019年6月22日

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

【协作机器人】人机协作机器人的核心是多传感器技术与智能控制算法、工业机器人协作应用挑战

产业智能官

13+阅读 · 2019年1月17日

水下无人系统发展现状及关键技术

水下无人系统发展现状及关键技术

无人机

21+阅读 · 2018年1月5日

相关论文

Algorithmic Prompt Generation for Diverse Human-like Teaming and Communication with Large Language Models

Arxiv

0+阅读 · 6月15日

Cross-Domain Multi-Person Human Activity Recognition via Near-Field Wi-Fi Sensing

Arxiv

0+阅读 · 6月10日

NestRL: A Nested Training Regime for Mutual Adaptation in Human-AI Teaming

Arxiv

0+阅读 · 6月1日

Towards Shared Embodied Intelligence in Humanoid Robots through Optimization Development and Testing of the Human Aware ergoCub Robot

Arxiv

0+阅读 · 5月26日

Sea Trial Validation of the ROS-DESERT Middleware with Autonomous Underwater Vehicles

Arxiv

0+阅读 · 5月22日

Modulation Feature Enhancement with a Multi-Stage Attention Network for Underwater Acoustic Target Recognition

Arxiv

0+阅读 · 5月20日

HECTOR: Human-centric Hierarchical Coordination and Supervision of Robotic Fleets under Continual Temporal Tasks

Arxiv

0+阅读 · 5月14日

EROAS: 3D Efficient Reactive Obstacle Avoidance System for Autonomous Underwater Vehicles using 2.5D Forward-Looking Sonar

Arxiv

0+阅读 · 5月11日

Melding LLM and temporal logic for reliable human-swarm collaboration in complex scenarios

Arxiv

0+阅读 · 5月8日

A Workflow-Oriented Framework for Asynchronous Human-AI Collaboration in Hybrid and Compute-Intensive HPC Environments

Arxiv

0+阅读 · 5月5日

相关基金

三维空间基于角度测量的多机器人系统协同定位与编队控制

国家自然科学基金

11+阅读 · 2015年12月31日

基于线结构光的水下自主作业系统目标识别与定位方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

自主式水下机器人推进器的故障诊断与容错控制方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

水下机器人可重构控制系统可靠性分析研究

国家自然科学基金

4+阅读 · 2015年12月31日

复杂环境下异构自主海洋航行器网络的协同优化控制

国家自然科学基金

5+阅读 · 2015年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

面向人与Agent混合的多团队协作仿真训练方法研究

国家自然科学基金

19+阅读 · 2012年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

基于群体智能的多Agent协作模型与适应性研究

国家自然科学基金

18+阅读 · 2009年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员