VGGT-SLAM 2.0：实时稠密前馈场景重建 (VGGT-SLAM 2.0: Real time Dense Feed-forward Scene Reconstruction) - 专知论文

会员服务 ·

0

SLAM · 前馈 · 重建 · 场景重建 · 系统 ·

VGGT-SLAM 2.0: Real time Dense Feed-forward Scene Reconstruction

翻译：VGGT-SLAM 2.0：实时稠密前馈场景重建

Dominic Maggio,Luca Carlone

We present VGGT-SLAM 2.0, a real time RGB feed-forward SLAM system which substantially improves upon VGGT-SLAM for incrementally aligning submaps created from VGGT. Firstly, we remove high-dimensional 15-degree-of-freedom drift and planar degeneracy from VGGT-SLAM by creating a new factor graph design while still addressing the reconstruction ambiguity of VGGT given unknown camera intrinsics. Secondly, by studying the attention layers of VGGT, we show that one of the layers is well suited to assist in image retrieval verification for free without additional training, which enables both rejecting false positive matches and allows for completing more loop closures. Finally, we conduct a suite of experiments which includes showing VGGT-SLAM 2.0 can easily be adapted for open-set object detection and demonstrating real time performance while running online onboard a ground robot using a Jetson Thor. We also test in environments ranging from cluttered indoor apartments and office scenes to a 4,200 square foot barn, and we also demonstrate VGGT-SLAM 2.0 achieves the highest accuracy on the TUM dataset with about 23 percent less pose error than VGGT-SLAM. Code will be released upon publication.

翻译：本文提出VGGT-SLAM 2.0，一种实时RGB前馈SLAM系统，在VGGT-SLAM基础上实现了显著改进，用于增量式对齐由VGGT生成的子地图。首先，我们通过设计新的因子图结构，消除了VGGT-SLAM中高维15自由度漂移和平面退化问题，同时仍能处理相机内参未知时VGGT的重建歧义性。其次，通过研究VGGT的注意力层，我们发现其中一层无需额外训练即可有效辅助图像检索验证，既能拒绝误匹配，又能完成更多回环闭合。最后，我们进行了一系列实验，包括展示VGGT-SLAM 2.0可轻松适配开放集目标检测，并在Jetson Thor平台上实现地面机器人的在线实时运行。我们在从杂乱室内公寓、办公室场景到4200平方英尺谷仓等多种环境中进行测试，并证明VGGT-SLAM 2.0在TUM数据集上达到最高精度，其位姿误差较VGGT-SLAM降低约23%。代码将在论文发表时开源。

0

相关内容

SLAM

即时定位与地图构建（SLAM或Simultaneouslocalizationandmapping）是这样一种技术：使得机器人和自动驾驶汽车等设备能在未知环境（没有先验知识的前提下）建立地图,或者在已知环境（已给出该地图的先验知识）中能更新地图,并保证这些设备能在同时追踪它们的当前位置。

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

专知会员服务

10+阅读 · 2月8日

CVPR2025最新《Transformer模型》论文速读

CVPR2025最新《Transformer模型》论文速读

专知会员服务

26+阅读 · 2025年3月17日

【新书】SLAM手册从定位与建图到空间智能，194页pdf

【新书】SLAM手册从定位与建图到空间智能，194页pdf

专知会员服务

61+阅读 · 2024年11月16日

美军重点项目应用 |《为广域和全动态视频中的持久目标跟踪建立外观模型》145页

美军重点项目应用 |《为广域和全动态视频中的持久目标跟踪建立外观模型》145页

专知会员服务

49+阅读 · 2024年4月11日

Swin Transformer重磅升级！Swin V2：向更大容量、更高分辨率的更大模型迈进

Swin Transformer重磅升级！Swin V2：向更大容量、更高分辨率的更大模型迈进

专知会员服务

28+阅读 · 2021年11月20日

室内移动机器人的SLAM算法综述

专知会员服务

45+阅读 · 2021年9月15日

【CVPR2021】Transformer遇见跟踪器：利用时间上下文进行视觉追踪

【CVPR2021】Transformer遇见跟踪器：利用时间上下文进行视觉追踪

专知会员服务

17+阅读 · 2021年3月24日

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

专知会员服务

52+阅读 · 2020年5月26日

【ICLR2020-CMU】学习使用主动神经SLAM进行探索，Active Neural SLAM

【ICLR2020-CMU】学习使用主动神经SLAM进行探索，Active Neural SLAM

专知会员服务

38+阅读 · 2020年4月13日

【CIKM 2019论文】重力启发式图自编码器定向链路预测（Gravity-Inspired Graph Autoencoders for Directed Link Prediction），Guillaume Salha，Stratis Limnios

【CIKM 2019论文】重力启发式图自编码器定向链路预测（Gravity-Inspired Graph Autoencoders for Directed Link Prediction），Guillaume Salha，Stratis Limnios

专知会员服务

28+阅读 · 2019年11月20日

超全汇总 | ORB-SLAM2 / ORB-SLAM3 相关改进代码！

超全汇总 | ORB-SLAM2 / ORB-SLAM3 相关改进代码！

计算机视觉life

35+阅读 · 2020年11月22日

实战 | 如何制作一个SLAM轨迹真值获取装置？

实战 | 如何制作一个SLAM轨迹真值获取装置？

计算机视觉life

12+阅读 · 2019年10月16日

【泡泡点云时空】SqueezeSegV2：改进模型结构和无监督领域自适应的激光雷达点云道路目标分割方法

【泡泡点云时空】SqueezeSegV2：改进模型结构和无监督领域自适应的激光雷达点云道路目标分割方法

泡泡机器人SLAM

11+阅读 · 2019年9月12日

【泡泡一分钟】单目视觉惯性SLAM的重定位，全局优化和地图融合

【泡泡一分钟】单目视觉惯性SLAM的重定位，全局优化和地图融合

泡泡机器人SLAM

59+阅读 · 2019年7月15日

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

泡泡机器人SLAM

14+阅读 · 2019年6月28日

【泡泡图灵智库】GCNv2：高效关联预测实时SLAM（arXiv）

【泡泡图灵智库】GCNv2：高效关联预测实时SLAM（arXiv）

泡泡机器人SLAM

45+阅读 · 2019年4月15日

如何从零开始系统化学习视觉SLAM？

如何从零开始系统化学习视觉SLAM？

计算机视觉life

21+阅读 · 2019年4月13日

【泡泡机器人】也来谈语义SLAM/语义地图

【泡泡机器人】也来谈语义SLAM/语义地图

泡泡机器人SLAM

21+阅读 · 2019年3月12日

【泡泡图灵智库】DS-SLAM:一种面向动态环境的语义视觉SLAM(arXiv)

【泡泡图灵智库】DS-SLAM:一种面向动态环境的语义视觉SLAM(arXiv)

泡泡机器人SLAM

27+阅读 · 2018年12月14日

【泡泡机器人】ECCV2018之SLAM最新前沿动态（附文章链接和代码链接）

【泡泡机器人】ECCV2018之SLAM最新前沿动态（附文章链接和代码链接）

泡泡机器人SLAM

38+阅读 · 2018年9月23日

动态环境下的实时高清大规模三维地形重建研究

国家自然科学基金

3+阅读 · 2015年12月31日

2D/3D视觉信息融合仿生SLAM关键问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于线性规划感知的压缩高光谱遥感图像快速重建

国家自然科学基金

0+阅读 · 2015年12月31日

斜模式高光谱成像的超分辨率重建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

融合多模GNSS和强震仪观测的地震实时监测技术方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

无人机视频快速4-D重建及时空自适应索引方法研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于模型的无波前传感器自适应光学关键理论和方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于陀螺振动探测和编码曝光的遥感图像快速恢复方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

复杂场景点线光流三维重建模型的建立及鲁棒性分析

国家自然科学基金

2+阅读 · 2014年12月31日

大规模爆炸场数值模拟实时交互可视化软件

国家自然科学基金

1+阅读 · 2014年12月31日

VGGT-Motion: Motion-Aware Calibration-Free Monocular SLAM for Long-Range Consistency

Arxiv

0+阅读 · 2月5日

Doppler-SLAM: Doppler-Aided Radar-Inertial and LiDAR-Inertial Simultaneous Localization and Mapping

Arxiv

0+阅读 · 2月4日

Towards Next-Generation SLAM: A Survey on 3DGS-SLAM Focusing on Performance, Robustness, and Future Directions

Arxiv

0+阅读 · 2月4日

HI-SLAM2: Geometry-Aware Gaussian SLAM for Fast Monocular Scene Reconstruction

Arxiv

0+阅读 · 2月2日

SuperPoint-SLAM3: Augmenting ORB-SLAM3 with Deep Features, Adaptive NMS, and Learning-Based Loop Closure

Arxiv

0+阅读 · 1月29日

VersaQ-3D: A Reconfigurable Accelerator Enabling Feed-Forward and Generalizable 3D Reconstruction via Versatile Quantization

Arxiv

0+阅读 · 1月28日

MapAnything: Universal Feed-Forward Metric 3D Reconstruction

Arxiv

0+阅读 · 1月23日

Keyframe-Based Feed-Forward Visual Odometry

Arxiv

0+阅读 · 1月22日

SCE-SLAM: Scale-Consistent Monocular SLAM via Scene Coordinate Embeddings

Arxiv

0+阅读 · 1月14日

PointSLAM++: Robust Dense Neural Gaussian Point Cloud-based SLAM

Arxiv

0+阅读 · 1月10日

VIP会员

文章信息

相关主题

相关VIP内容

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

专知会员服务

10+阅读 · 2月8日

CVPR2025最新《Transformer模型》论文速读

CVPR2025最新《Transformer模型》论文速读

专知会员服务

26+阅读 · 2025年3月17日

【新书】SLAM手册从定位与建图到空间智能，194页pdf

【新书】SLAM手册从定位与建图到空间智能，194页pdf

专知会员服务

61+阅读 · 2024年11月16日

美军重点项目应用 |《为广域和全动态视频中的持久目标跟踪建立外观模型》145页

美军重点项目应用 |《为广域和全动态视频中的持久目标跟踪建立外观模型》145页

专知会员服务

49+阅读 · 2024年4月11日

Swin Transformer重磅升级！Swin V2：向更大容量、更高分辨率的更大模型迈进

Swin Transformer重磅升级！Swin V2：向更大容量、更高分辨率的更大模型迈进

专知会员服务

28+阅读 · 2021年11月20日

室内移动机器人的SLAM算法综述

专知会员服务

45+阅读 · 2021年9月15日

【CVPR2021】Transformer遇见跟踪器：利用时间上下文进行视觉追踪

【CVPR2021】Transformer遇见跟踪器：利用时间上下文进行视觉追踪

专知会员服务

17+阅读 · 2021年3月24日

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

专知会员服务

52+阅读 · 2020年5月26日

【ICLR2020-CMU】学习使用主动神经SLAM进行探索，Active Neural SLAM

【ICLR2020-CMU】学习使用主动神经SLAM进行探索，Active Neural SLAM

专知会员服务

38+阅读 · 2020年4月13日

【CIKM 2019论文】重力启发式图自编码器定向链路预测（Gravity-Inspired Graph Autoencoders for Directed Link Prediction），Guillaume Salha，Stratis Limnios

【CIKM 2019论文】重力启发式图自编码器定向链路预测（Gravity-Inspired Graph Autoencoders for Directed Link Prediction），Guillaume Salha，Stratis Limnios

专知会员服务

28+阅读 · 2019年11月20日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】基于自适应表征的高效视觉建模

《多域作战中融合网络、电子战与动能机动》

AI智能体时代大模型安全风险与攻防新挑战

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

相关资讯

超全汇总 | ORB-SLAM2 / ORB-SLAM3 相关改进代码！

超全汇总 | ORB-SLAM2 / ORB-SLAM3 相关改进代码！

计算机视觉life

35+阅读 · 2020年11月22日

实战 | 如何制作一个SLAM轨迹真值获取装置？

实战 | 如何制作一个SLAM轨迹真值获取装置？

计算机视觉life

12+阅读 · 2019年10月16日

【泡泡点云时空】SqueezeSegV2：改进模型结构和无监督领域自适应的激光雷达点云道路目标分割方法

【泡泡点云时空】SqueezeSegV2：改进模型结构和无监督领域自适应的激光雷达点云道路目标分割方法

泡泡机器人SLAM

11+阅读 · 2019年9月12日

【泡泡一分钟】单目视觉惯性SLAM的重定位，全局优化和地图融合

【泡泡一分钟】单目视觉惯性SLAM的重定位，全局优化和地图融合

泡泡机器人SLAM

59+阅读 · 2019年7月15日

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

泡泡机器人SLAM

14+阅读 · 2019年6月28日

【泡泡图灵智库】GCNv2：高效关联预测实时SLAM（arXiv）

【泡泡图灵智库】GCNv2：高效关联预测实时SLAM（arXiv）

泡泡机器人SLAM

45+阅读 · 2019年4月15日

如何从零开始系统化学习视觉SLAM？

如何从零开始系统化学习视觉SLAM？

计算机视觉life

21+阅读 · 2019年4月13日

【泡泡机器人】也来谈语义SLAM/语义地图

【泡泡机器人】也来谈语义SLAM/语义地图

泡泡机器人SLAM

21+阅读 · 2019年3月12日

【泡泡图灵智库】DS-SLAM:一种面向动态环境的语义视觉SLAM(arXiv)

【泡泡图灵智库】DS-SLAM:一种面向动态环境的语义视觉SLAM(arXiv)

泡泡机器人SLAM

27+阅读 · 2018年12月14日

【泡泡机器人】ECCV2018之SLAM最新前沿动态（附文章链接和代码链接）

【泡泡机器人】ECCV2018之SLAM最新前沿动态（附文章链接和代码链接）

泡泡机器人SLAM

38+阅读 · 2018年9月23日

相关论文

VGGT-Motion: Motion-Aware Calibration-Free Monocular SLAM for Long-Range Consistency

Arxiv

0+阅读 · 2月5日

Doppler-SLAM: Doppler-Aided Radar-Inertial and LiDAR-Inertial Simultaneous Localization and Mapping

Arxiv

0+阅读 · 2月4日

Towards Next-Generation SLAM: A Survey on 3DGS-SLAM Focusing on Performance, Robustness, and Future Directions

Arxiv

0+阅读 · 2月4日

HI-SLAM2: Geometry-Aware Gaussian SLAM for Fast Monocular Scene Reconstruction

Arxiv

0+阅读 · 2月2日

SuperPoint-SLAM3: Augmenting ORB-SLAM3 with Deep Features, Adaptive NMS, and Learning-Based Loop Closure

Arxiv

0+阅读 · 1月29日

VersaQ-3D: A Reconfigurable Accelerator Enabling Feed-Forward and Generalizable 3D Reconstruction via Versatile Quantization

Arxiv

0+阅读 · 1月28日

MapAnything: Universal Feed-Forward Metric 3D Reconstruction

Arxiv

0+阅读 · 1月23日

Keyframe-Based Feed-Forward Visual Odometry

Arxiv

0+阅读 · 1月22日

SCE-SLAM: Scale-Consistent Monocular SLAM via Scene Coordinate Embeddings

Arxiv

0+阅读 · 1月14日

PointSLAM++: Robust Dense Neural Gaussian Point Cloud-based SLAM

Arxiv

0+阅读 · 1月10日

相关基金

动态环境下的实时高清大规模三维地形重建研究

国家自然科学基金

3+阅读 · 2015年12月31日

2D/3D视觉信息融合仿生SLAM关键问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于线性规划感知的压缩高光谱遥感图像快速重建

国家自然科学基金

0+阅读 · 2015年12月31日

斜模式高光谱成像的超分辨率重建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

融合多模GNSS和强震仪观测的地震实时监测技术方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

无人机视频快速4-D重建及时空自适应索引方法研究

国家自然科学基金

8+阅读 · 2015年12月31日

基于模型的无波前传感器自适应光学关键理论和方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于陀螺振动探测和编码曝光的遥感图像快速恢复方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

复杂场景点线光流三维重建模型的建立及鲁棒性分析

国家自然科学基金

2+阅读 · 2014年12月31日

大规模爆炸场数值模拟实时交互可视化软件

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员