HI-SLAM2：面向快速单目场景重建的几何感知高斯SLAM (HI-SLAM2: Geometry-Aware Gaussian SLAM for Fast Monocular Scene Reconstruction) - 专知论文

会员服务 ·

0

SLAM · 重建 · 几何感知 · 场景重建 · 3D ·

HI-SLAM2: Geometry-Aware Gaussian SLAM for Fast Monocular Scene Reconstruction

翻译：HI-SLAM2：面向快速单目场景重建的几何感知高斯SLAM

Wei Zhang,Qing Cheng,David Skuddis,Niclas Zeller,Daniel Cremers,Norbert Haala

We present HI-SLAM2, a geometry-aware Gaussian SLAM system that achieves fast and accurate monocular scene reconstruction using only RGB input. Existing Neural SLAM or 3DGS-based SLAM methods often trade off between rendering quality and geometry accuracy, our research demonstrates that both can be achieved simultaneously with RGB input alone. The key idea of our approach is to enhance the ability for geometry estimation by combining easy-to-obtain monocular priors with learning-based dense SLAM, and then using 3D Gaussian splatting as our core map representation to efficiently model the scene. Upon loop closure, our method ensures on-the-fly global consistency through efficient pose graph bundle adjustment and instant map updates by explicitly deforming the 3D Gaussian units based on anchored keyframe updates. Furthermore, we introduce a grid-based scale alignment strategy to maintain improved scale consistency in prior depths for finer depth details. Through extensive experiments on Replica, ScanNet, and ScanNet++, we demonstrate significant improvements over existing Neural SLAM methods and even surpass RGB-D-based methods in both reconstruction and rendering quality. The project page and source code will be made available at https://hi-slam2.github.io/.

翻译：我们提出了HI-SLAM2，这是一个几何感知的高斯SLAM系统，仅使用RGB输入即可实现快速、准确的单目场景重建。现有的神经SLAM或基于3DGS的SLAM方法通常在渲染质量与几何精度之间进行权衡，我们的研究表明，仅凭RGB输入即可同时实现两者。我们方法的核心思想是通过将易于获取的单目先验信息与基于学习的稠密SLAM相结合，来增强几何估计能力，然后使用3D高斯泼溅作为核心地图表示来高效建模场景。在闭环检测时，我们的方法通过高效的位姿图光束法平差，并基于锚定关键帧的更新对3D高斯单元进行显式变形，从而实现即时地图更新，确保实时全局一致性。此外，我们引入了一种基于网格的尺度对齐策略，以在先验深度中保持更好的尺度一致性，从而获得更精细的深度细节。通过在Replica、ScanNet和ScanNet++数据集上进行的大量实验，我们证明了该方法相对于现有神经SLAM方法的显著改进，甚至在重建和渲染质量上超越了基于RGB-D的方法。项目页面和源代码将在https://hi-slam2.github.io/上提供。

0

相关内容

SLAM

即时定位与地图构建（SLAM或Simultaneouslocalizationandmapping）是这样一种技术：使得机器人和自动驾驶汽车等设备能在未知环境（没有先验知识的前提下）建立地图,或者在已知环境（已给出该地图的先验知识）中能更新地图,并保证这些设备能在同时追踪它们的当前位置。

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

专知会员服务

10+阅读 · 2月8日

【ICLR2025】基于图形引导的图像场景重建：3D高斯散射方法

【ICLR2025】基于图形引导的图像场景重建：3D高斯散射方法

专知会员服务

13+阅读 · 2025年2月25日

【AAAI2025】FatesGS：基于深度特征一致性的高斯溅射法进行快速精确的稀疏视角表面重建

【AAAI2025】FatesGS：基于深度特征一致性的高斯溅射法进行快速精确的稀疏视角表面重建

专知会员服务

10+阅读 · 2025年1月9日

基于异构数据融合的SLAM 研究综述

基于异构数据融合的SLAM 研究综述

专知会员服务

28+阅读 · 2024年9月18日

【CVPR2024】VastGaussian: 用于大型场景重建的巨大三维高斯

【CVPR2024】VastGaussian: 用于大型场景重建的巨大三维高斯

专知会员服务

25+阅读 · 2024年3月3日

什么是3D高斯喷溅(Gaussian Splatting，GS)技术？复旦等最新《3D高斯作为新视觉时代》综述，详述3DGS技术

什么是3D高斯喷溅(Gaussian Splatting，GS)技术？复旦等最新《3D高斯作为新视觉时代》综述，详述3DGS技术

专知会员服务

43+阅读 · 2024年2月18日

室内移动机器人的SLAM算法综述

专知会员服务

45+阅读 · 2021年9月15日

【开放书】SLAM 中的几何与学习方法，62页pdf

【开放书】SLAM 中的几何与学习方法，62页pdf

专知会员服务

111+阅读 · 2020年6月5日

【ICLR2020-CMU】学习使用主动神经SLAM进行探索，Active Neural SLAM

【ICLR2020-CMU】学习使用主动神经SLAM进行探索，Active Neural SLAM

专知会员服务

38+阅读 · 2020年4月13日

视觉惯性SLAM综述

专知会员服务

87+阅读 · 2019年12月13日

超全汇总 | ORB-SLAM2 / ORB-SLAM3 相关改进代码！

超全汇总 | ORB-SLAM2 / ORB-SLAM3 相关改进代码！

计算机视觉life

35+阅读 · 2020年11月22日

综述 | 激光与视觉融合SLAM

综述 | 激光与视觉融合SLAM

计算机视觉life

18+阅读 · 2020年10月8日

实战 | 如何制作一个SLAM轨迹真值获取装置？

实战 | 如何制作一个SLAM轨迹真值获取装置？

计算机视觉life

12+阅读 · 2019年10月16日

现在开源的RGB-D SLAM有哪些?

现在开源的RGB-D SLAM有哪些?

计算机视觉life

31+阅读 · 2019年5月8日

【泡泡图灵智库】GCNv2：高效关联预测实时SLAM（arXiv）

【泡泡图灵智库】GCNv2：高效关联预测实时SLAM（arXiv）

泡泡机器人SLAM

45+阅读 · 2019年4月15日

如何从零开始系统化学习视觉SLAM？

如何从零开始系统化学习视觉SLAM？

计算机视觉life

21+阅读 · 2019年4月13日

视觉SLAM技术综述

视觉SLAM技术综述

计算机视觉life

27+阅读 · 2019年1月4日

【泡泡图灵智库】DS-SLAM:一种面向动态环境的语义视觉SLAM(arXiv)

【泡泡图灵智库】DS-SLAM:一种面向动态环境的语义视觉SLAM(arXiv)

泡泡机器人SLAM

27+阅读 · 2018年12月14日

从零开始一起学习SLAM | SLAM有什么用？

从零开始一起学习SLAM | SLAM有什么用？

计算机视觉life

18+阅读 · 2018年9月17日

【泡泡一分钟】终极SLAM？结合事件相机、RGB和IMU用于高动态、高速场景的鲁棒视觉SLAM

【泡泡一分钟】终极SLAM？结合事件相机、RGB和IMU用于高动态、高速场景的鲁棒视觉SLAM

泡泡机器人SLAM

15+阅读 · 2018年4月2日

基于多元互信息和快速稀疏多核学习的高光谱遥感影像地物分类

国家自然科学基金

0+阅读 · 2015年12月31日

相干场成像高精度目标重构技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

2D/3D视觉信息融合仿生SLAM关键问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于深度神经网络的雷达目标高分辨距离像稳健识别方法

国家自然科学基金

6+阅读 · 2015年12月31日

基于线性规划感知的压缩高光谱遥感图像快速重建

国家自然科学基金

0+阅读 · 2015年12月31日

斜模式高光谱成像的超分辨率重建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于DOAS方法的对流层SO2地基星载联合遥感反演研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂场景点线光流三维重建模型的建立及鲁棒性分析

国家自然科学基金

2+阅读 · 2014年12月31日

基于多视图协同训练的高光谱遥感影像分类

国家自然科学基金

3+阅读 · 2014年12月31日

基于红外二氧化碳激光器的地表方向和半球发射率主被动协同反演和验证方法

国家自然科学基金

0+阅读 · 2014年12月31日

NRGS-SLAM: Monocular Non-Rigid SLAM for Endoscopy via Deformation-Aware 3D Gaussian Splatting

Arxiv

0+阅读 · 2月19日

GSO-SLAM: Bidirectionally Coupled Gaussian Splatting and Direct Visual Odometry

Arxiv

0+阅读 · 2月12日

OpenMonoGS-SLAM: Monocular Gaussian Splatting SLAM with Open-set Semantics

Arxiv

0+阅读 · 2月10日

Efficient Scene Modeling via Structure-Aware and Region-Prioritized 3D Gaussians

Arxiv

0+阅读 · 2月5日

Towards Next-Generation SLAM: A Survey on 3DGS-SLAM Focusing on Performance, Robustness, and Future Directions

Arxiv

0+阅读 · 2月4日

CAD-SLAM: Consistency-Aware Dynamic SLAM with Dynamic-Static Decoupled Mapping

Arxiv

0+阅读 · 2月3日

Split&Splat: Zero-Shot Panoptic Segmentation via Explicit Instance Modeling and 3D Gaussian Splatting

Arxiv

0+阅读 · 2月1日

RGS-SLAM: Robust Gaussian Splatting SLAM with One-Shot Dense Initialization

Arxiv

0+阅读 · 1月15日

SCE-SLAM: Scale-Consistent Monocular SLAM via Scene Coordinate Embeddings

Arxiv

0+阅读 · 1月14日

PointSLAM++: Robust Dense Neural Gaussian Point Cloud-based SLAM

Arxiv

0+阅读 · 1月10日

VIP会员

文章信息

相关主题

相关VIP内容

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

专知会员服务

10+阅读 · 2月8日

【ICLR2025】基于图形引导的图像场景重建：3D高斯散射方法

【ICLR2025】基于图形引导的图像场景重建：3D高斯散射方法

专知会员服务

13+阅读 · 2025年2月25日

【AAAI2025】FatesGS：基于深度特征一致性的高斯溅射法进行快速精确的稀疏视角表面重建

【AAAI2025】FatesGS：基于深度特征一致性的高斯溅射法进行快速精确的稀疏视角表面重建

专知会员服务

10+阅读 · 2025年1月9日

基于异构数据融合的SLAM 研究综述

基于异构数据融合的SLAM 研究综述

专知会员服务

28+阅读 · 2024年9月18日

【CVPR2024】VastGaussian: 用于大型场景重建的巨大三维高斯

【CVPR2024】VastGaussian: 用于大型场景重建的巨大三维高斯

专知会员服务

25+阅读 · 2024年3月3日

什么是3D高斯喷溅(Gaussian Splatting，GS)技术？复旦等最新《3D高斯作为新视觉时代》综述，详述3DGS技术

什么是3D高斯喷溅(Gaussian Splatting，GS)技术？复旦等最新《3D高斯作为新视觉时代》综述，详述3DGS技术

专知会员服务

43+阅读 · 2024年2月18日

室内移动机器人的SLAM算法综述

专知会员服务

45+阅读 · 2021年9月15日

【开放书】SLAM 中的几何与学习方法，62页pdf

【开放书】SLAM 中的几何与学习方法，62页pdf

专知会员服务

111+阅读 · 2020年6月5日

【ICLR2020-CMU】学习使用主动神经SLAM进行探索，Active Neural SLAM

【ICLR2020-CMU】学习使用主动神经SLAM进行探索，Active Neural SLAM

专知会员服务

38+阅读 · 2020年4月13日

视觉惯性SLAM综述

专知会员服务

87+阅读 · 2019年12月13日

热门VIP内容

开通专知VIP会员享更多权益服务

《可信人工智能赋能系统的支柱》

《从经典神经网络到不确定性下的拓扑神经网络：军事应用》2026最新40页报告

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

《人工智能：对战略与力量的影响》slides

相关资讯

超全汇总 | ORB-SLAM2 / ORB-SLAM3 相关改进代码！

超全汇总 | ORB-SLAM2 / ORB-SLAM3 相关改进代码！

计算机视觉life

35+阅读 · 2020年11月22日

综述 | 激光与视觉融合SLAM

综述 | 激光与视觉融合SLAM

计算机视觉life

18+阅读 · 2020年10月8日

实战 | 如何制作一个SLAM轨迹真值获取装置？

实战 | 如何制作一个SLAM轨迹真值获取装置？

计算机视觉life

12+阅读 · 2019年10月16日

现在开源的RGB-D SLAM有哪些?

现在开源的RGB-D SLAM有哪些?

计算机视觉life

31+阅读 · 2019年5月8日

【泡泡图灵智库】GCNv2：高效关联预测实时SLAM（arXiv）

【泡泡图灵智库】GCNv2：高效关联预测实时SLAM（arXiv）

泡泡机器人SLAM

45+阅读 · 2019年4月15日

如何从零开始系统化学习视觉SLAM？

如何从零开始系统化学习视觉SLAM？

计算机视觉life

21+阅读 · 2019年4月13日

视觉SLAM技术综述

视觉SLAM技术综述

计算机视觉life

27+阅读 · 2019年1月4日

【泡泡图灵智库】DS-SLAM:一种面向动态环境的语义视觉SLAM(arXiv)

【泡泡图灵智库】DS-SLAM:一种面向动态环境的语义视觉SLAM(arXiv)

泡泡机器人SLAM

27+阅读 · 2018年12月14日

从零开始一起学习SLAM | SLAM有什么用？

从零开始一起学习SLAM | SLAM有什么用？

计算机视觉life

18+阅读 · 2018年9月17日

【泡泡一分钟】终极SLAM？结合事件相机、RGB和IMU用于高动态、高速场景的鲁棒视觉SLAM

【泡泡一分钟】终极SLAM？结合事件相机、RGB和IMU用于高动态、高速场景的鲁棒视觉SLAM

泡泡机器人SLAM

15+阅读 · 2018年4月2日

相关论文

NRGS-SLAM: Monocular Non-Rigid SLAM for Endoscopy via Deformation-Aware 3D Gaussian Splatting

Arxiv

0+阅读 · 2月19日

GSO-SLAM: Bidirectionally Coupled Gaussian Splatting and Direct Visual Odometry

Arxiv

0+阅读 · 2月12日

OpenMonoGS-SLAM: Monocular Gaussian Splatting SLAM with Open-set Semantics

Arxiv

0+阅读 · 2月10日

Efficient Scene Modeling via Structure-Aware and Region-Prioritized 3D Gaussians

Arxiv

0+阅读 · 2月5日

Towards Next-Generation SLAM: A Survey on 3DGS-SLAM Focusing on Performance, Robustness, and Future Directions

Arxiv

0+阅读 · 2月4日

CAD-SLAM: Consistency-Aware Dynamic SLAM with Dynamic-Static Decoupled Mapping

Arxiv

0+阅读 · 2月3日

Split&Splat: Zero-Shot Panoptic Segmentation via Explicit Instance Modeling and 3D Gaussian Splatting

Arxiv

0+阅读 · 2月1日

RGS-SLAM: Robust Gaussian Splatting SLAM with One-Shot Dense Initialization

Arxiv

0+阅读 · 1月15日

SCE-SLAM: Scale-Consistent Monocular SLAM via Scene Coordinate Embeddings

Arxiv

0+阅读 · 1月14日

PointSLAM++: Robust Dense Neural Gaussian Point Cloud-based SLAM

Arxiv

0+阅读 · 1月10日

相关基金

基于多元互信息和快速稀疏多核学习的高光谱遥感影像地物分类

国家自然科学基金

0+阅读 · 2015年12月31日

相干场成像高精度目标重构技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

2D/3D视觉信息融合仿生SLAM关键问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于深度神经网络的雷达目标高分辨距离像稳健识别方法

国家自然科学基金

6+阅读 · 2015年12月31日

基于线性规划感知的压缩高光谱遥感图像快速重建

国家自然科学基金

0+阅读 · 2015年12月31日

斜模式高光谱成像的超分辨率重建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于DOAS方法的对流层SO2地基星载联合遥感反演研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂场景点线光流三维重建模型的建立及鲁棒性分析

国家自然科学基金

2+阅读 · 2014年12月31日

基于多视图协同训练的高光谱遥感影像分类

国家自然科学基金

3+阅读 · 2014年12月31日

基于红外二氧化碳激光器的地表方向和半球发射率主被动协同反演和验证方法

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员