SuperGSeg：基于结构化超高斯分布的开集词汇三维分割 (SuperGSeg: Open-Vocabulary 3D Segmentation with Structured Super-Gaussians) - 专知论文

会员服务 ·

0

分割 · 高斯分布 · 语言特征 · 结构 · 结构化 ·

SuperGSeg: Open-Vocabulary 3D Segmentation with Structured Super-Gaussians

翻译：SuperGSeg：基于结构化超高斯分布的开集词汇三维分割

Siyun Liang,Sen Wang,Kunyi Li,Michael Niemeyer,Stefano Gasperini,Hendrik P. A. Lensch,Nassir Navab,Federico Tombari

from arxiv, 13 pages, 8 figures. Project page: supergseg.github.io

3D Gaussian Splatting has recently gained traction for its efficient training and real-time rendering. While its vanilla representation is mainly designed for view synthesis, recent works extended it to scene understanding with language features. However, storing additional high-dimensional features per Gaussian for semantic information is memory-intensive, which limits their ability to segment and interpret challenging scenes. To this end, we introduce SuperGSeg, a novel approach that fosters cohesive, context-aware hierarchical scene representation by disentangling segmentation and language field distillation. SuperGSeg first employs neural 3D Gaussians to learn geometry, instance and hierarchical segmentation features from multi-view images with the aid of off-the-shelf 2D masks. These features are then leveraged to create a sparse set of \acrlong{superg}s. \acrlong{superg}s facilitate the lifting and distillation of 2D language features into 3D space. They enable hierarchical scene understanding with high-dimensional language feature rendering at moderate GPU memory costs. Extensive experiments demonstrate that SuperGSeg achieves remarkable performance on both open-vocabulary object selection and semantic segmentation tasks.

翻译：三维高斯泼溅技术近期因其高效的训练与实时渲染能力而受到广泛关注。其原始表示主要面向视图合成任务，而近期研究已将其扩展至结合语言特征的场景理解领域。然而，为每个高斯点存储额外的高维特征以承载语义信息会消耗大量内存，这限制了现有方法在复杂场景分割与解析方面的能力。为此，我们提出SuperGSeg——一种通过解耦分割任务与语言场蒸馏来构建具有内聚性和上下文感知能力的层次化场景表示的新方法。SuperGSeg首先利用神经三维高斯分布，借助现成的二维掩码从多视角图像中学习几何、实例及层次化分割特征。随后，这些特征被用于构建一组稀疏的\acrlong{superg}s。\acrlong{superg}s实现了二维语言特征向三维空间的提升与蒸馏过程，使得系统能够在可控的GPU内存开销下，通过渲染高维语言特征实现层次化场景理解。大量实验表明，SuperGSeg在开集词汇目标选取与语义分割任务上均取得了卓越的性能。

0

相关内容

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

专知会员服务

10+阅读 · 2月8日

【NeurIPS2025】Seg4Diff：揭示文本到图像扩散 Transformer 中的开放词汇分割

【NeurIPS2025】Seg4Diff：揭示文本到图像扩散 Transformer 中的开放词汇分割

专知会员服务

10+阅读 · 2025年9月23日

三维高斯泼溅应用综述：分割、编辑与生成

三维高斯泼溅应用综述：分割、编辑与生成

专知会员服务

15+阅读 · 2025年8月14日

用于三维场景理解的语言嵌入：框架与真实世界应用研究

用于三维场景理解的语言嵌入：框架与真实世界应用研究

专知会员服务

19+阅读 · 2025年8月10日

【ICML2025】解决3D语言高斯溅射中的视角依赖语义

【ICML2025】解决3D语言高斯溅射中的视角依赖语义

专知会员服务

8+阅读 · 2025年6月2日

【AAAI2025】FatesGS：基于深度特征一致性的高斯溅射法进行快速精确的稀疏视角表面重建

【AAAI2025】FatesGS：基于深度特征一致性的高斯溅射法进行快速精确的稀疏视角表面重建

专知会员服务

10+阅读 · 2025年1月9日

什么是3D高斯喷溅(Gaussian Splatting，GS)技术？复旦等最新《3D高斯作为新视觉时代》综述，详述3DGS技术

什么是3D高斯喷溅(Gaussian Splatting，GS)技术？复旦等最新《3D高斯作为新视觉时代》综述，详述3DGS技术

专知会员服务

43+阅读 · 2024年2月18日

丹麦奥胡斯大学等最新《高效高分辨率深度学习》综述，全面阐述高效高分辨率深度学习方法

丹麦奥胡斯大学等最新《高效高分辨率深度学习》综述，全面阐述高效高分辨率深度学习方法

专知会员服务

21+阅读 · 2022年12月13日

上海交大最新《标签高效深度分割》研究进展综述，全面阐述无监督、粗监督、不完全监督和噪声监督的深度分割方法

上海交大最新《标签高效深度分割》研究进展综述，全面阐述无监督、粗监督、不完全监督和噪声监督的深度分割方法

专知会员服务

42+阅读 · 2022年7月7日

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

专知会员服务

37+阅读 · 2020年2月27日

【TPAMI2022】「深度学习图像分割」最新综述论文，带你全面了解100个10大类深度图像分割算法

【TPAMI2022】「深度学习图像分割」最新综述论文，带你全面了解100个10大类深度图像分割算法

专知

10+阅读 · 2022年4月11日

NLP+CV《桥接视觉与语言的研究综述》，带你全面了解视觉+语言最新应用和方法

NLP+CV《桥接视觉与语言的研究综述》，带你全面了解视觉+语言最新应用和方法

中国人工智能学会

27+阅读 · 2019年7月24日

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

中国人工智能学会

20+阅读 · 2019年7月17日

超详细干货 | 三维语义分割概述及总结

超详细干货 | 三维语义分割概述及总结

计算机视觉life

33+阅读 · 2019年3月19日

基于深度学习的图像超分辨率最新进展与趋势【附PDF】

基于深度学习的图像超分辨率最新进展与趋势【附PDF】

人工智能前沿讲习班

15+阅读 · 2019年2月27日

最新23页《深度学习图像超分辨率应用综述》论文，带你全面了解深度学习超分方法（附下载）

最新23页《深度学习图像超分辨率应用综述》论文，带你全面了解深度学习超分方法（附下载）

专知

43+阅读 · 2019年2月20日

公开课|腾讯优图高级研究员张润泽：基于图像的大规模三维重建

公开课|腾讯优图高级研究员张润泽：基于图像的大规模三维重建

计算机视觉life

19+阅读 · 2018年12月27日

超像素、语义分割、实例分割、全景分割傻傻分不清？

超像素、语义分割、实例分割、全景分割傻傻分不清？

计算机视觉life

19+阅读 · 2018年11月27日

一文概览基于深度学习的超分辨率重建架构

一文概览基于深度学习的超分辨率重建架构

论智

23+阅读 · 2018年3月24日

【论文推荐】最新5篇图像分割（Image Segmentation）相关论文—多重假设、超像素分割、自监督、图、生成对抗网络

【论文推荐】最新5篇图像分割（Image Segmentation）相关论文—多重假设、超像素分割、自监督、图、生成对抗网络

专知

27+阅读 · 2018年2月7日

大规模多视角高维图像特征提取

国家自然科学基金

3+阅读 · 2017年12月31日

基于全局阈值分割和局部聚类的自然图像超像素分割技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于超图的三维模型检索方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于跨媒体可视分析的三维对象关联检索方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

超高维数据中若干检验问题的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

基于超像素稀疏表示的图像超分辨率方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

高光谱图像多维稀疏字典构造及应用研究

国家自然科学基金

2+阅读 · 2014年12月31日

距离选通编码超分辨率三维成像方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

高维复杂结构数据降维

国家自然科学基金

10+阅读 · 2014年12月31日

3DGEER: 3D Gaussian Rendering Made Exact and Efficient for Generic Cameras

Arxiv

0+阅读 · 2月18日

A LoD of Gaussians: Unified Training and Rendering for Ultra-Large Scale Reconstruction with External Memory

Arxiv

0+阅读 · 2月17日

Variation-aware Flexible 3D Gaussian Editing

Arxiv

0+阅读 · 2月13日

TG-Field: Geometry-Aware Radiative Gaussian Fields for Tomographic Reconstruction

Arxiv

0+阅读 · 2月12日

GeoPurify: A Data-Efficient Geometric Distillation Framework for Open-Vocabulary 3D Segmentation

Arxiv

0+阅读 · 2月11日

Efficient Scene Modeling via Structure-Aware and Region-Prioritized 3D Gaussians

Arxiv

0+阅读 · 2月5日

Nix and Fix: Targeting 1000x Compression of 3D Gaussian Splatting with Diffusion Models

Arxiv

0+阅读 · 2月4日

GRTX: Efficient Ray Tracing for 3D Gaussian-Based Rendering

Arxiv

0+阅读 · 1月28日

GVGS: Gaussian Visibility-Aware Multi-View Geometry for Accurate Surface Reconstruction

Arxiv

0+阅读 · 1月28日

SceneSplat++: A Large Dataset and Comprehensive Benchmark for Language Gaussian Splatting

Arxiv

0+阅读 · 1月25日

VIP会员

文章信息

相关主题

相关VIP内容

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

专知会员服务

10+阅读 · 2月8日

【NeurIPS2025】Seg4Diff：揭示文本到图像扩散 Transformer 中的开放词汇分割

【NeurIPS2025】Seg4Diff：揭示文本到图像扩散 Transformer 中的开放词汇分割

专知会员服务

10+阅读 · 2025年9月23日

三维高斯泼溅应用综述：分割、编辑与生成

三维高斯泼溅应用综述：分割、编辑与生成

专知会员服务

15+阅读 · 2025年8月14日

用于三维场景理解的语言嵌入：框架与真实世界应用研究

用于三维场景理解的语言嵌入：框架与真实世界应用研究

专知会员服务

19+阅读 · 2025年8月10日

【ICML2025】解决3D语言高斯溅射中的视角依赖语义

【ICML2025】解决3D语言高斯溅射中的视角依赖语义

专知会员服务

8+阅读 · 2025年6月2日

【AAAI2025】FatesGS：基于深度特征一致性的高斯溅射法进行快速精确的稀疏视角表面重建

【AAAI2025】FatesGS：基于深度特征一致性的高斯溅射法进行快速精确的稀疏视角表面重建

专知会员服务

10+阅读 · 2025年1月9日

什么是3D高斯喷溅(Gaussian Splatting，GS)技术？复旦等最新《3D高斯作为新视觉时代》综述，详述3DGS技术

什么是3D高斯喷溅(Gaussian Splatting，GS)技术？复旦等最新《3D高斯作为新视觉时代》综述，详述3DGS技术

专知会员服务

43+阅读 · 2024年2月18日

丹麦奥胡斯大学等最新《高效高分辨率深度学习》综述，全面阐述高效高分辨率深度学习方法

丹麦奥胡斯大学等最新《高效高分辨率深度学习》综述，全面阐述高效高分辨率深度学习方法

专知会员服务

21+阅读 · 2022年12月13日

上海交大最新《标签高效深度分割》研究进展综述，全面阐述无监督、粗监督、不完全监督和噪声监督的深度分割方法

上海交大最新《标签高效深度分割》研究进展综述，全面阐述无监督、粗监督、不完全监督和噪声监督的深度分割方法

专知会员服务

42+阅读 · 2022年7月7日

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

【DeepMind】PolyGen: 一种三维网格的自回归生成模型，PolyGen: An Autoregressive Generative Model of 3D Meshes

专知会员服务

37+阅读 · 2020年2月27日

热门VIP内容

开通专知VIP会员享更多权益服务

《可信人工智能赋能系统的支柱》

《从经典神经网络到不确定性下的拓扑神经网络：军事应用》2026最新40页报告

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

《人工智能：对战略与力量的影响》slides

相关资讯

【TPAMI2022】「深度学习图像分割」最新综述论文，带你全面了解100个10大类深度图像分割算法

【TPAMI2022】「深度学习图像分割」最新综述论文，带你全面了解100个10大类深度图像分割算法

专知

10+阅读 · 2022年4月11日

NLP+CV《桥接视觉与语言的研究综述》，带你全面了解视觉+语言最新应用和方法

NLP+CV《桥接视觉与语言的研究综述》，带你全面了解视觉+语言最新应用和方法

中国人工智能学会

27+阅读 · 2019年7月24日

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

中国人工智能学会

20+阅读 · 2019年7月17日

超详细干货 | 三维语义分割概述及总结

超详细干货 | 三维语义分割概述及总结

计算机视觉life

33+阅读 · 2019年3月19日

基于深度学习的图像超分辨率最新进展与趋势【附PDF】

基于深度学习的图像超分辨率最新进展与趋势【附PDF】

人工智能前沿讲习班

15+阅读 · 2019年2月27日

最新23页《深度学习图像超分辨率应用综述》论文，带你全面了解深度学习超分方法（附下载）

最新23页《深度学习图像超分辨率应用综述》论文，带你全面了解深度学习超分方法（附下载）

专知

43+阅读 · 2019年2月20日

公开课|腾讯优图高级研究员张润泽：基于图像的大规模三维重建

公开课|腾讯优图高级研究员张润泽：基于图像的大规模三维重建

计算机视觉life

19+阅读 · 2018年12月27日

超像素、语义分割、实例分割、全景分割傻傻分不清？

超像素、语义分割、实例分割、全景分割傻傻分不清？

计算机视觉life

19+阅读 · 2018年11月27日

一文概览基于深度学习的超分辨率重建架构

一文概览基于深度学习的超分辨率重建架构

论智

23+阅读 · 2018年3月24日

【论文推荐】最新5篇图像分割（Image Segmentation）相关论文—多重假设、超像素分割、自监督、图、生成对抗网络

【论文推荐】最新5篇图像分割（Image Segmentation）相关论文—多重假设、超像素分割、自监督、图、生成对抗网络

专知

27+阅读 · 2018年2月7日

相关论文

3DGEER: 3D Gaussian Rendering Made Exact and Efficient for Generic Cameras

Arxiv

0+阅读 · 2月18日

A LoD of Gaussians: Unified Training and Rendering for Ultra-Large Scale Reconstruction with External Memory

Arxiv

0+阅读 · 2月17日

Variation-aware Flexible 3D Gaussian Editing

Arxiv

0+阅读 · 2月13日

TG-Field: Geometry-Aware Radiative Gaussian Fields for Tomographic Reconstruction

Arxiv

0+阅读 · 2月12日

GeoPurify: A Data-Efficient Geometric Distillation Framework for Open-Vocabulary 3D Segmentation

Arxiv

0+阅读 · 2月11日

Efficient Scene Modeling via Structure-Aware and Region-Prioritized 3D Gaussians

Arxiv

0+阅读 · 2月5日

Nix and Fix: Targeting 1000x Compression of 3D Gaussian Splatting with Diffusion Models

Arxiv

0+阅读 · 2月4日

GRTX: Efficient Ray Tracing for 3D Gaussian-Based Rendering

Arxiv

0+阅读 · 1月28日

GVGS: Gaussian Visibility-Aware Multi-View Geometry for Accurate Surface Reconstruction

Arxiv

0+阅读 · 1月28日

SceneSplat++: A Large Dataset and Comprehensive Benchmark for Language Gaussian Splatting

Arxiv

0+阅读 · 1月25日

相关基金

大规模多视角高维图像特征提取

国家自然科学基金

3+阅读 · 2017年12月31日

基于全局阈值分割和局部聚类的自然图像超像素分割技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于超图的三维模型检索方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于跨媒体可视分析的三维对象关联检索方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

超高维数据中若干检验问题的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

基于超像素稀疏表示的图像超分辨率方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

高光谱图像多维稀疏字典构造及应用研究

国家自然科学基金

2+阅读 · 2014年12月31日

距离选通编码超分辨率三维成像方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

高维复杂结构数据降维

国家自然科学基金

10+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员