实例引导的无监督域自适应用于机器人语义分割 (Instance-Guided Unsupervised Domain Adaptation for Robotic Semantic Segmentation) - 专知论文

会员服务 ·

0

监督 · 一致 · 无监督 · 自适应 · 分割 ·

Instance-Guided Unsupervised Domain Adaptation for Robotic Semantic Segmentation

翻译：实例引导的无监督域自适应用于机器人语义分割

Michele Antonazzi,Lorenzo Signorelli,Matteo Luperto,Nicola Basilico

from arxiv, Accepted for publication at ICRA 2026

Semantic segmentation networks, which are essential for robotic perception, often suffer from performance degradation when the visual distribution of the deployment environment differs from that of the source dataset on which they were trained. Unsupervised Domain Adaptation (UDA) addresses this challenge by adapting the network to the robot's target environment without external supervision, leveraging the large amounts of data a robot might naturally collect during long-term operation. In such settings, UDA methods can exploit multi-view consistency across the environment's map to fine-tune the model in an unsupervised fashion and mitigate domain shift. However, these approaches remain sensitive to cross-view instance-level inconsistencies. In this work, we propose a method that starts from a volumetric 3D map to generate multi-view consistent pseudo-labels. We then refine these labels using the zero-shot instance segmentation capabilities of a foundation model, enforcing instance-level coherence. The refined annotations serve as supervision for self-supervised fine-tuning, enabling the robot to adapt its perception system at deployment time. Experiments on real-world data demonstrate that our approach consistently improves performance over state-of-the-art UDA baselines based on multi-view consistency, without requiring any ground-truth labels in the target domain.

翻译：语义分割网络对于机器人感知至关重要，但当部署环境的视觉分布与其训练所用的源数据集存在差异时，其性能往往会下降。无监督域自适应通过利用机器人在长期运行中自然收集的大量数据，在无需外部监督的情况下将网络适应到机器人的目标环境，从而应对这一挑战。在此类场景中，UDA方法可利用环境地图中的多视角一致性，以无监督方式微调模型并缓解域偏移。然而，这些方法对跨视角实例级不一致性仍较为敏感。本研究提出一种方法：首先从体素三维地图生成多视角一致的伪标签，随后利用基础模型的零样本实例分割能力对这些标签进行细化，以强化实例级一致性。精炼后的标注作为自监督微调的监督信号，使机器人能够在部署时自适应其感知系统。在真实世界数据上的实验表明，我们的方法在基于多视角一致性的最先进UDA基线基础上持续提升了性能，且无需目标域的任何真实标注。

0

相关内容

【ETHZ博士论文】面向场景理解的实用领域适应研究，153页pdf

【ETHZ博士论文】面向场景理解的实用领域适应研究，153页pdf

专知会员服务

38+阅读 · 2024年4月12日

基于深度学习的实时语义分割综述

基于深度学习的实时语义分割综述

专知会员服务

32+阅读 · 2023年11月27日

领域自适应在实际中如何用? UNC最新《无源无监督领域自适应SFUDA》综述论文，详述白盒SFUDA和黑盒SFUDA技术进展

领域自适应在实际中如何用? UNC最新《无源无监督领域自适应SFUDA》综述论文，详述白盒SFUDA和黑盒SFUDA技术进展

专知会员服务

23+阅读 · 2023年1月6日

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

专知会员服务

34+阅读 · 2022年12月12日

【AAAI2023】面向领域自适应语义分割的几何感知网络

【AAAI2023】面向领域自适应语义分割的几何感知网络

专知会员服务

21+阅读 · 2022年12月7日

【CVPR 2022-UCSD&英伟达】GroupViT:从文本监督中产生语义分割，Semantic Segmentation Emerges from Text Supervision

【CVPR 2022-UCSD&英伟达】GroupViT:从文本监督中产生语义分割，Semantic Segmentation Emerges from Text Supervision

专知会员服务

12+阅读 · 2022年3月9日

领域自适应研究综述

领域自适应研究综述

专知会员服务

55+阅读 · 2021年5月5日

【AAAI2021】基于内容迁移的无监督领域自适应语义分割

【AAAI2021】基于内容迁移的无监督领域自适应语义分割

专知会员服务

18+阅读 · 2020年12月25日

[NeurIPS 2020 oral] 基于因果干预的弱监督语义分割

专知会员服务

47+阅读 · 2020年10月5日

【CVPR2020-Oral】无监督域内自适应语义分割，Unsupervised Intra-domain Adaptation

【CVPR2020-Oral】无监督域内自适应语义分割，Unsupervised Intra-domain Adaptation

专知会员服务

71+阅读 · 2020年4月20日

【AI与军事】机器学习的军事应用，一种文献计量视角

【AI与军事】机器学习的军事应用，一种文献计量视角

专知

54+阅读 · 2022年4月25日

【资源】领域自适应相关论文、代码分享

【资源】领域自适应相关论文、代码分享

专知

32+阅读 · 2019年10月12日

CVPR 2019 Oral 论文解读 | 无监督域适应语义分割

CVPR 2019 Oral 论文解读 | 无监督域适应语义分割

AI科技评论

49+阅读 · 2019年5月29日

领域自适应学习论文大列表

领域自适应学习论文大列表

专知

71+阅读 · 2019年3月2日

【机器学习】机器学习工业领域应用

【机器学习】机器学习工业领域应用

产业智能官

11+阅读 · 2018年10月23日

入门 | 一文了解什么是语义分割及常用的语义分割方法有哪些

入门 | 一文了解什么是语义分割及常用的语义分割方法有哪些

机器之心

10+阅读 · 2018年6月4日

迁移学习之Domain Adaptation

迁移学习之Domain Adaptation

全球人工智能

18+阅读 · 2018年4月11日

【机器视觉】计算机视觉必读：图像分类、定位、检测，语义分割和实例分割方法梳理

【机器视觉】计算机视觉必读：图像分类、定位、检测，语义分割和实例分割方法梳理

产业智能官

29+阅读 · 2018年2月3日

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

新智元

35+阅读 · 2018年1月24日

见微知著：语义分割中的弱监督学习

见微知著：语义分割中的弱监督学习

深度学习大讲堂

11+阅读 · 2017年12月6日

三维空间基于角度测量的多机器人系统协同定位与编队控制

国家自然科学基金

11+阅读 · 2015年12月31日

基于三维激光测距的移动机器人室外环境语义地图构建

国家自然科学基金

2+阅读 · 2015年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

50+阅读 · 2015年12月31日

面向智能机器人柔性装配系统自主控制的主动视觉感知技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

机器灵巧手基于触滑觉信息协同的自适应力控制方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

未知环境中移动机器人探索式路径规划方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

数据驱动的人体图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

A Pragmatist Robot: Learning to Plan Tasks by Experiencing the Real World

Arxiv

0+阅读 · 2月14日

Temporally-Sampled Efficiently Adaptive State Lattices for Autonomous Ground Robot Navigation in Partially Observed Environments

Arxiv

0+阅读 · 2月13日

UniManip: General-Purpose Zero-Shot Robotic Manipulation with Agentic Operational Graph

Arxiv

0+阅读 · 2月13日

DynaGuide: A Generalizable Dynamic Guidance Framework for Unsupervised Semantic Segmentation

Arxiv

0+阅读 · 2月13日

Instruct2Act: From Human Instruction to Actions Sequencing and Execution via Robot Action Network for Robotic Manipulation

Arxiv

0+阅读 · 2月10日

User-Feedback-Driven Adaptation for Vision-and-Language Navigation

Arxiv

0+阅读 · 2月4日

SEMNAV: Enhancing Visual Semantic Navigation in Robotics through Semantic Segmentation

Arxiv

0+阅读 · 2月3日

Multi-View Projection for Unsupervised Domain Adaptation in 3D Semantic Segmentation

Arxiv

0+阅读 · 1月22日

CHORAL: Traversal-Aware Planning for Safe and Efficient Heterogeneous Multi-Robot Routing

Arxiv

0+阅读 · 1月15日

Source-Free Domain Adaptation for Geospatial Point Cloud Semantic Segmentation

Arxiv

0+阅读 · 1月13日

VIP会员

文章信息

相关主题

相关VIP内容

【ETHZ博士论文】面向场景理解的实用领域适应研究，153页pdf

【ETHZ博士论文】面向场景理解的实用领域适应研究，153页pdf

专知会员服务

38+阅读 · 2024年4月12日

基于深度学习的实时语义分割综述

基于深度学习的实时语义分割综述

专知会员服务

32+阅读 · 2023年11月27日

领域自适应在实际中如何用? UNC最新《无源无监督领域自适应SFUDA》综述论文，详述白盒SFUDA和黑盒SFUDA技术进展

领域自适应在实际中如何用? UNC最新《无源无监督领域自适应SFUDA》综述论文，详述白盒SFUDA和黑盒SFUDA技术进展

专知会员服务

23+阅读 · 2023年1月6日

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

《探索基于深度学习的机器人感知技术，用于在户外地形中导航》美空军研究实验室2022最新20页报告

专知会员服务

34+阅读 · 2022年12月12日

【AAAI2023】面向领域自适应语义分割的几何感知网络

【AAAI2023】面向领域自适应语义分割的几何感知网络

专知会员服务

21+阅读 · 2022年12月7日

【CVPR 2022-UCSD&英伟达】GroupViT:从文本监督中产生语义分割，Semantic Segmentation Emerges from Text Supervision

【CVPR 2022-UCSD&英伟达】GroupViT:从文本监督中产生语义分割，Semantic Segmentation Emerges from Text Supervision

专知会员服务

12+阅读 · 2022年3月9日

领域自适应研究综述

领域自适应研究综述

专知会员服务

55+阅读 · 2021年5月5日

【AAAI2021】基于内容迁移的无监督领域自适应语义分割

【AAAI2021】基于内容迁移的无监督领域自适应语义分割

专知会员服务

18+阅读 · 2020年12月25日

[NeurIPS 2020 oral] 基于因果干预的弱监督语义分割

专知会员服务

47+阅读 · 2020年10月5日

【CVPR2020-Oral】无监督域内自适应语义分割，Unsupervised Intra-domain Adaptation

【CVPR2020-Oral】无监督域内自适应语义分割，Unsupervised Intra-domain Adaptation

专知会员服务

71+阅读 · 2020年4月20日

热门VIP内容

开通专知VIP会员享更多权益服务

《可信人工智能赋能系统的支柱》

《从经典神经网络到不确定性下的拓扑神经网络：军事应用》2026最新40页报告

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

《人工智能：对战略与力量的影响》slides

相关资讯

【AI与军事】机器学习的军事应用，一种文献计量视角

【AI与军事】机器学习的军事应用，一种文献计量视角

专知

54+阅读 · 2022年4月25日

【资源】领域自适应相关论文、代码分享

【资源】领域自适应相关论文、代码分享

专知

32+阅读 · 2019年10月12日

CVPR 2019 Oral 论文解读 | 无监督域适应语义分割

CVPR 2019 Oral 论文解读 | 无监督域适应语义分割

AI科技评论

49+阅读 · 2019年5月29日

领域自适应学习论文大列表

领域自适应学习论文大列表

专知

71+阅读 · 2019年3月2日

【机器学习】机器学习工业领域应用

【机器学习】机器学习工业领域应用

产业智能官

11+阅读 · 2018年10月23日

入门 | 一文了解什么是语义分割及常用的语义分割方法有哪些

入门 | 一文了解什么是语义分割及常用的语义分割方法有哪些

机器之心

10+阅读 · 2018年6月4日

迁移学习之Domain Adaptation

迁移学习之Domain Adaptation

全球人工智能

18+阅读 · 2018年4月11日

【机器视觉】计算机视觉必读：图像分类、定位、检测，语义分割和实例分割方法梳理

【机器视觉】计算机视觉必读：图像分类、定位、检测，语义分割和实例分割方法梳理

产业智能官

29+阅读 · 2018年2月3日

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

新智元

35+阅读 · 2018年1月24日

见微知著：语义分割中的弱监督学习

见微知著：语义分割中的弱监督学习

深度学习大讲堂

11+阅读 · 2017年12月6日

相关论文

A Pragmatist Robot: Learning to Plan Tasks by Experiencing the Real World

Arxiv

0+阅读 · 2月14日

Temporally-Sampled Efficiently Adaptive State Lattices for Autonomous Ground Robot Navigation in Partially Observed Environments

Arxiv

0+阅读 · 2月13日

UniManip: General-Purpose Zero-Shot Robotic Manipulation with Agentic Operational Graph

Arxiv

0+阅读 · 2月13日

DynaGuide: A Generalizable Dynamic Guidance Framework for Unsupervised Semantic Segmentation

Arxiv

0+阅读 · 2月13日

Instruct2Act: From Human Instruction to Actions Sequencing and Execution via Robot Action Network for Robotic Manipulation

Arxiv

0+阅读 · 2月10日

User-Feedback-Driven Adaptation for Vision-and-Language Navigation

Arxiv

0+阅读 · 2月4日

SEMNAV: Enhancing Visual Semantic Navigation in Robotics through Semantic Segmentation

Arxiv

0+阅读 · 2月3日

Multi-View Projection for Unsupervised Domain Adaptation in 3D Semantic Segmentation

Arxiv

0+阅读 · 1月22日

CHORAL: Traversal-Aware Planning for Safe and Efficient Heterogeneous Multi-Robot Routing

Arxiv

0+阅读 · 1月15日

Source-Free Domain Adaptation for Geospatial Point Cloud Semantic Segmentation

Arxiv

0+阅读 · 1月13日

相关基金

三维空间基于角度测量的多机器人系统协同定位与编队控制

国家自然科学基金

11+阅读 · 2015年12月31日

基于三维激光测距的移动机器人室外环境语义地图构建

国家自然科学基金

2+阅读 · 2015年12月31日

不确定环境下的自主移动机器人目标搜索问题研究

国家自然科学基金

50+阅读 · 2015年12月31日

面向智能机器人柔性装配系统自主控制的主动视觉感知技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

机器灵巧手基于触滑觉信息协同的自适应力控制方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

未知环境中移动机器人探索式路径规划方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

数据驱动的人体图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

国家自然科学基金

12+阅读 · 2013年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员