SNAP：面向任意点云中任意物体分割的统一模型 (SNAP: Towards Segmenting Anything in Any Point Cloud) - 专知论文

会员服务 ·

0

分割 · 点云 · 统一模型 · 交互 · 文本提示 ·

SNAP: Towards Segmenting Anything in Any Point Cloud

翻译：SNAP：面向任意点云中任意物体分割的统一模型

Aniket Gupta,Hanhui Wang,Charles Saunders,Aruni RoyChowdhury,Hanumant Singh,Huaizu Jiang

from arxiv, Project Page, https://neu-vi.github.io/SNAP/

Interactive 3D point cloud segmentation enables efficient annotation of complex 3D scenes through user-guided prompts. However, current approaches are typically restricted in scope to a single domain (indoor or outdoor), and to a single form of user interaction (either spatial clicks or textual prompts). Moreover, training on multiple datasets often leads to negative transfer, resulting in domain-specific tools that lack generalizability. To address these limitations, we present SNAP (Segment aNything in Any Point cloud), a unified model for interactive 3D segmentation that supports both point-based and text-based prompts across diverse domains. Our approach achieves cross-domain generalizability by training on 7 datasets spanning indoor, outdoor, and aerial environments, while employing domain-adaptive normalization to prevent negative transfer. For text-prompted segmentation, we automatically generate mask proposals without human intervention and match them against CLIP embeddings of textual queries, enabling both panoptic and open-vocabulary segmentation. Extensive experiments demonstrate that SNAP consistently delivers high-quality segmentation results. We achieve state-of-the-art performance on 8 out of 9 zero-shot benchmarks for spatial-prompted segmentation and demonstrate competitive results on all 5 text-prompted benchmarks. These results show that a unified model can match or exceed specialized domain-specific approaches, providing a practical tool for scalable 3D annotation. Project page is at, https://neu-vi.github.io/SNAP/

翻译：交互式三维点云分割通过用户引导的提示实现复杂三维场景的高效标注。然而，现有方法通常局限于单一领域（室内或室外）和单一交互形式（空间点击或文本提示）。此外，在多个数据集上训练常导致负迁移，形成缺乏泛化能力的领域专用工具。为突破这些限制，我们提出SNAP（Segment aNything in Any Point cloud）——一个支持跨领域点基与文本基提示的统一交互式三维分割模型。我们通过在涵盖室内、室外及航空环境的7个数据集上进行训练，并采用领域自适应归一化来防止负迁移，从而实现了跨领域泛化能力。针对文本提示分割，我们自动生成无需人工干预的掩码提案，并将其与文本查询的CLIP嵌入特征进行匹配，实现了全景分割与开放词汇分割。大量实验表明，SNAP能持续提供高质量分割结果：在9个空间提示分割的零样本基准测试中，我们在8个任务上达到最优性能；在所有5个文本提示分割基准测试中均取得具有竞争力的结果。这些结果表明，统一模型能够匹配甚至超越专用领域方法，为可扩展的三维标注提供了实用工具。项目页面详见 https://neu-vi.github.io/SNAP/

0

相关内容

稀疏点云感知的表示学习

稀疏点云感知的表示学习

专知会员服务

9+阅读 · 2月9日

【牛津大学博士论文】学习理解大规模3D点云，191页pdf

【牛津大学博士论文】学习理解大规模3D点云，191页pdf

专知会员服务

38+阅读 · 2023年6月22日

Transformer如何做视觉分割？南洋理工最新《基于Transformer的视觉分割》综述，详述120多个深度分割模型

Transformer如何做视觉分割？南洋理工最新《基于Transformer的视觉分割》综述，详述120多个深度分割模型

专知会员服务

56+阅读 · 2023年4月27日

上海交大最新《标签高效深度分割》研究进展综述，全面阐述无监督、粗监督、不完全监督和噪声监督的深度分割方法

上海交大最新《标签高效深度分割》研究进展综述，全面阐述无监督、粗监督、不完全监督和噪声监督的深度分割方法

专知会员服务

42+阅读 · 2022年7月7日

CVPR 2022 | 点云分割的对比边界学习

CVPR 2022 | 点云分割的对比边界学习

专知会员服务

16+阅读 · 2022年4月30日

基于深度学习的点云语义分割研究综述

专知会员服务

75+阅读 · 2021年1月16日

【CVPR2020-香港中文大学】PointGroup:用于3D实例分割的双设置点分组，PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation

【CVPR2020-香港中文大学】PointGroup:用于3D实例分割的双设置点分组，PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation

专知会员服务

12+阅读 · 2020年4月6日

【厦门大学】综述：深度学习3D点云分割，Review: deep learning on 3D point clouds

【厦门大学】综述：深度学习3D点云分割，Review: deep learning on 3D point clouds

专知会员服务

71+阅读 · 2020年1月22日

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

专知会员服务

109+阅读 · 2019年12月31日

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

专知会员服务

28+阅读 · 2019年12月19日

【TPAMI2022】「深度学习图像分割」最新综述论文，带你全面了解100个10大类深度图像分割算法

【TPAMI2022】「深度学习图像分割」最新综述论文，带你全面了解100个10大类深度图像分割算法

专知

10+阅读 · 2022年4月11日

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

专知

21+阅读 · 2019年12月31日

【泡泡点云时空】基于分割方法的物体六维姿态估计

【泡泡点云时空】基于分割方法的物体六维姿态估计

泡泡机器人SLAM

18+阅读 · 2019年9月15日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

图像分割最新资料汇总（语义分割、实例分割、视频分割、医疗图像分割、自动驾驶…）

图像分割最新资料汇总（语义分割、实例分割、视频分割、医疗图像分割、自动驾驶…）

人工智能前沿讲习班

144+阅读 · 2019年3月15日

超像素、语义分割、实例分割、全景分割傻傻分不清？

超像素、语义分割、实例分割、全景分割傻傻分不清？

计算机视觉life

19+阅读 · 2018年11月27日

【泡泡点云时空】RSNet：用于3D点云分割的递归切片网络（CVPR2018-14)

【泡泡点云时空】RSNet：用于3D点云分割的递归切片网络（CVPR2018-14)

泡泡机器人SLAM

12+阅读 · 2018年9月18日

基于几何特征的激光雷达地面点云分割

基于几何特征的激光雷达地面点云分割

泡泡机器人SLAM

15+阅读 · 2018年4月1日

【论文推荐】最新5篇图像分割（Image Segmentation）相关论文—多重假设、超像素分割、自监督、图、生成对抗网络

【论文推荐】最新5篇图像分割（Image Segmentation）相关论文—多重假设、超像素分割、自监督、图、生成对抗网络

专知

27+阅读 · 2018年2月7日

【论文推荐】最新5篇图像分割相关论文—条件随机场和深度特征学习、移动端网络、长期视觉定位、主动学习、主动轮廓模型、生成对抗性网络

【论文推荐】最新5篇图像分割相关论文—条件随机场和深度特征学习、移动端网络、长期视觉定位、主动学习、主动轮廓模型、生成对抗性网络

专知

13+阅读 · 2018年1月23日

顾及扫描上下文的预测与判决相结合的点云在线分类方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于对象模型与多点空间统计的高分辨率遥感影像分类策略

国家自然科学基金

4+阅读 · 2015年12月31日

基于形状信息和结果反馈的多图谱图像分割方法

国家自然科学基金

0+阅读 · 2015年12月31日

复杂环境下面向激光扫描点云的三维目标定位方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

航空叶片多光学传感器多尺度测量点云高效拼合方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向光谱-空间特征集合的高光谱遥感影像度量学习与分类研究

国家自然科学基金

0+阅读 · 2015年12月31日

自由视点三维视频中纹理-深度图像联合建模及应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于草图的几何处理和应用

国家自然科学基金

2+阅读 · 2015年12月31日

移动云计算中数据流应用的动态计算切分技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

Fillerbuster: Unified Generative Scene Completion Model for Casual Captures

Arxiv

0+阅读 · 3月16日

Pointy - A Lightweight Transformer for Point Cloud Foundation Models

Arxiv

0+阅读 · 3月11日

Snapmoji: Instant Generation of Animatable Dual-Stylized Avatars

Arxiv

0+阅读 · 3月6日

SCOPE: Scene-Contextualized Incremental Few-Shot 3D Segmentation

Arxiv

0+阅读 · 3月6日

Point Linguist Model: Segment Any Object via Bridged Large 3D-Language Model

Arxiv

0+阅读 · 2月19日

Viewpoint Recommendation for Point Cloud Labeling through Interaction Cost Modeling

Arxiv

0+阅读 · 2月11日

Through the Perspective of LiDAR: A Feature-Enriched and Uncertainty-Aware Annotation Pipeline for Terrestrial Point Cloud Segmentation

Arxiv

0+阅读 · 2月9日

G2P: Gaussian-to-Point Attribute Alignment for Boundary-Aware 3D Semantic Segmentation

Arxiv

0+阅读 · 2月8日

SPARK: Scalable Real-Time Point Cloud Aggregation with Multi-View Self-Calibration

Arxiv

0+阅读 · 2月6日

SNAP: A Self-Consistent Agreement Principle with Application to Robust Computation

Arxiv

0+阅读 · 2月2日

VIP会员

文章信息

相关主题

最新内容

人工智能与机器人自主系统等新兴技术革命将如何影响地面作战的指挥控制？

人工智能与机器人自主系统等新兴技术革命将如何影响地面作战的指挥控制？

专知会员服务

0+阅读 · 4月12日

弹性指挥控制：北约、伊朗与俄罗斯指挥控制架构的比较分析

弹性指挥控制：北约、伊朗与俄罗斯指挥控制架构的比较分析

专知会员服务

1+阅读 · 4月12日

最新“指挥控制”领域出版物合集（简介）

最新“指挥控制”领域出版物合集（简介）

专知会员服务

1+阅读 · 4月12日

面向军事作战需求开发的人工智能（RAIMOND）

面向军事作战需求开发的人工智能（RAIMOND）

专知会员服务

3+阅读 · 4月12日

检测算法战：一个识别军事行动中人工智能特征的框架

检测算法战：一个识别军事行动中人工智能特征的框架

专知会员服务

1+阅读 · 4月12日

软件定义多域战术网络：基础与未来方向（综述）

软件定义多域战术网络：基础与未来方向（综述）

专知会员服务

4+阅读 · 4月12日

水下战战术决策中的气象与海洋预报（50页报告）

水下战战术决策中的气象与海洋预报（50页报告）

专知会员服务

1+阅读 · 4月12日

远程空中优势：新一代超视距导弹的兴起

远程空中优势：新一代超视距导弹的兴起

专知会员服务

1+阅读 · 4月12日

大语言模型溯因推理的统一分类学与综述

大语言模型溯因推理的统一分类学与综述

专知会员服务

0+阅读 · 4月12日

CVPR 2026 Findings | 算力砍半、性能不降！全开源 A₁模型：让机器人大模型真正走向落地

CVPR 2026 Findings | 算力砍半、性能不降！全开源 A₁模型：让机器人大模型真正走向落地

专知会员服务

0+阅读 · 4月12日

大语言模型与国防战略：升级风险与国家安全挑战（综述）

大语言模型与国防战略：升级风险与国家安全挑战（综述）

专知会员服务

7+阅读 · 4月12日

《基于机器学习预测模型识别新型超视距战术及DARPA AIR智能体误差分析》

《基于机器学习预测模型识别新型超视距战术及DARPA AIR智能体误差分析》

专知会员服务

10+阅读 · 4月11日

以机器速度作战：人工智能与美陆军反火力作战——第二部分

以机器速度作战：人工智能与美陆军反火力作战——第二部分

专知会员服务

8+阅读 · 4月11日

以机器速度作战：人工智能与美陆军反火力作战——第一部分

以机器速度作战：人工智能与美陆军反火力作战——第一部分

专知会员服务

7+阅读 · 4月11日

大视觉语言模型的高效推理：瓶颈剖析、关键技术与未来展望

大视觉语言模型的高效推理：瓶颈剖析、关键技术与未来展望

专知会员服务

6+阅读 · 4月11日

相关VIP内容

稀疏点云感知的表示学习

稀疏点云感知的表示学习

专知会员服务

9+阅读 · 2月9日

【牛津大学博士论文】学习理解大规模3D点云，191页pdf

【牛津大学博士论文】学习理解大规模3D点云，191页pdf

专知会员服务

38+阅读 · 2023年6月22日

Transformer如何做视觉分割？南洋理工最新《基于Transformer的视觉分割》综述，详述120多个深度分割模型

Transformer如何做视觉分割？南洋理工最新《基于Transformer的视觉分割》综述，详述120多个深度分割模型

专知会员服务

56+阅读 · 2023年4月27日

上海交大最新《标签高效深度分割》研究进展综述，全面阐述无监督、粗监督、不完全监督和噪声监督的深度分割方法

上海交大最新《标签高效深度分割》研究进展综述，全面阐述无监督、粗监督、不完全监督和噪声监督的深度分割方法

专知会员服务

42+阅读 · 2022年7月7日

CVPR 2022 | 点云分割的对比边界学习

CVPR 2022 | 点云分割的对比边界学习

专知会员服务

16+阅读 · 2022年4月30日

基于深度学习的点云语义分割研究综述

专知会员服务

75+阅读 · 2021年1月16日

【CVPR2020-香港中文大学】PointGroup:用于3D实例分割的双设置点分组，PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation

【CVPR2020-香港中文大学】PointGroup:用于3D实例分割的双设置点分组，PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation

专知会员服务

12+阅读 · 2020年4月6日

【厦门大学】综述：深度学习3D点云分割，Review: deep learning on 3D point clouds

【厦门大学】综述：深度学习3D点云分割，Review: deep learning on 3D point clouds

专知会员服务

71+阅读 · 2020年1月22日

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

专知会员服务

109+阅读 · 2019年12月31日

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

【何恺明团队新论文】PointRend:将图像分割视作渲染问题，性能显著提升！

专知会员服务

28+阅读 · 2019年12月19日

热门VIP内容

开通专知VIP会员享更多权益服务

弹性指挥控制：北约、伊朗与俄罗斯指挥控制架构的比较分析

面向军事作战需求开发的人工智能（RAIMOND）

人工智能与机器人自主系统等新兴技术革命将如何影响地面作战的指挥控制？

最新“指挥控制”领域出版物合集（简介）

相关资讯

【TPAMI2022】「深度学习图像分割」最新综述论文，带你全面了解100个10大类深度图像分割算法

【TPAMI2022】「深度学习图像分割」最新综述论文，带你全面了解100个10大类深度图像分割算法

专知

10+阅读 · 2022年4月11日

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

专知

21+阅读 · 2019年12月31日

【泡泡点云时空】基于分割方法的物体六维姿态估计

【泡泡点云时空】基于分割方法的物体六维姿态估计

泡泡机器人SLAM

18+阅读 · 2019年9月15日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

图像分割最新资料汇总（语义分割、实例分割、视频分割、医疗图像分割、自动驾驶…）

图像分割最新资料汇总（语义分割、实例分割、视频分割、医疗图像分割、自动驾驶…）

人工智能前沿讲习班

144+阅读 · 2019年3月15日

超像素、语义分割、实例分割、全景分割傻傻分不清？

超像素、语义分割、实例分割、全景分割傻傻分不清？

计算机视觉life

19+阅读 · 2018年11月27日

【泡泡点云时空】RSNet：用于3D点云分割的递归切片网络（CVPR2018-14)

【泡泡点云时空】RSNet：用于3D点云分割的递归切片网络（CVPR2018-14)

泡泡机器人SLAM

12+阅读 · 2018年9月18日

基于几何特征的激光雷达地面点云分割

基于几何特征的激光雷达地面点云分割

泡泡机器人SLAM

15+阅读 · 2018年4月1日

【论文推荐】最新5篇图像分割（Image Segmentation）相关论文—多重假设、超像素分割、自监督、图、生成对抗网络

【论文推荐】最新5篇图像分割（Image Segmentation）相关论文—多重假设、超像素分割、自监督、图、生成对抗网络

专知

27+阅读 · 2018年2月7日

【论文推荐】最新5篇图像分割相关论文—条件随机场和深度特征学习、移动端网络、长期视觉定位、主动学习、主动轮廓模型、生成对抗性网络

【论文推荐】最新5篇图像分割相关论文—条件随机场和深度特征学习、移动端网络、长期视觉定位、主动学习、主动轮廓模型、生成对抗性网络

专知

13+阅读 · 2018年1月23日

相关论文

Fillerbuster: Unified Generative Scene Completion Model for Casual Captures

Arxiv

0+阅读 · 3月16日

Pointy - A Lightweight Transformer for Point Cloud Foundation Models

Arxiv

0+阅读 · 3月11日

Snapmoji: Instant Generation of Animatable Dual-Stylized Avatars

Arxiv

0+阅读 · 3月6日

SCOPE: Scene-Contextualized Incremental Few-Shot 3D Segmentation

Arxiv

0+阅读 · 3月6日

Point Linguist Model: Segment Any Object via Bridged Large 3D-Language Model

Arxiv

0+阅读 · 2月19日

Viewpoint Recommendation for Point Cloud Labeling through Interaction Cost Modeling

Arxiv

0+阅读 · 2月11日

Through the Perspective of LiDAR: A Feature-Enriched and Uncertainty-Aware Annotation Pipeline for Terrestrial Point Cloud Segmentation

Arxiv

0+阅读 · 2月9日

G2P: Gaussian-to-Point Attribute Alignment for Boundary-Aware 3D Semantic Segmentation

Arxiv

0+阅读 · 2月8日

SPARK: Scalable Real-Time Point Cloud Aggregation with Multi-View Self-Calibration

Arxiv

0+阅读 · 2月6日

SNAP: A Self-Consistent Agreement Principle with Application to Robust Computation

Arxiv

0+阅读 · 2月2日

相关基金

顾及扫描上下文的预测与判决相结合的点云在线分类方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于对象模型与多点空间统计的高分辨率遥感影像分类策略

国家自然科学基金

4+阅读 · 2015年12月31日

基于形状信息和结果反馈的多图谱图像分割方法

国家自然科学基金

0+阅读 · 2015年12月31日

复杂环境下面向激光扫描点云的三维目标定位方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

移动云计算复杂网络环境下任务粒度的应用划分和调度方法

国家自然科学基金

0+阅读 · 2015年12月31日

航空叶片多光学传感器多尺度测量点云高效拼合方法

国家自然科学基金

0+阅读 · 2015年12月31日

面向光谱-空间特征集合的高光谱遥感影像度量学习与分类研究

国家自然科学基金

0+阅读 · 2015年12月31日

自由视点三维视频中纹理-深度图像联合建模及应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于草图的几何处理和应用

国家自然科学基金

2+阅读 · 2015年12月31日

移动云计算中数据流应用的动态计算切分技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

微信扫码咨询专知VIP会员