ViSTA-SLAM：基于对称双视图关联的视觉SLAM系统 (ViSTA-SLAM: Visual SLAM with Symmetric Two-view Association) - 专知论文

会员服务 ·

0

SLAM · 系统 · 关联 · 视觉SLAM · 设计 ·

ViSTA-SLAM: Visual SLAM with Symmetric Two-view Association

翻译：ViSTA-SLAM：基于对称双视图关联的视觉SLAM系统

Ganlin Zhang,Shenhan Qian,Xi Wang,Daniel Cremers

from arxiv, Accepted by 3DV 2026, project page: https://ganlinzhang.xyz/vista-slam/

We present ViSTA-SLAM as a real-time monocular visual SLAM system that operates without requiring camera intrinsics, making it broadly applicable across diverse camera setups. At its core, the system employs a lightweight symmetric two-view association (STA) model as the frontend, which simultaneously estimates relative camera poses and regresses local pointmaps from only two RGB images. This design reduces model complexity significantly, the size of our frontend is only 35\% that of comparable state-of-the-art methods, while enhancing the quality of two-view constraints used in the pipeline. In the backend, we construct a specially designed Sim(3) pose graph that incorporates loop closures to address accumulated drift. Extensive experiments demonstrate that our approach achieves superior performance in both camera tracking and dense 3D reconstruction quality compared to current methods. Github repository: https://github.com/zhangganlin/vista-slam

翻译：本文提出ViSTA-SLAM，一种无需相机内参即可运行的实时单目视觉SLAM系统，使其能够广泛适用于不同的相机配置。该系统的核心是采用轻量级对称双视图关联（STA）模型作为前端，该模型仅需两幅RGB图像即可同时估计相对相机位姿并回归局部点云图。这种设计显著降低了模型复杂度——我们的前端模型尺寸仅为同类先进方法的35%，同时提升了流程中所用双视图约束的质量。在后端，我们构建了一个专门设计的Sim(3)位姿图，通过融入回环检测以解决累积漂移问题。大量实验表明，与现有方法相比，我们的方法在相机跟踪和稠密三维重建质量方面均取得了更优的性能。项目代码仓库：https://github.com/zhangganlin/vista-slam

0

相关内容

SLAM

即时定位与地图构建（SLAM或Simultaneouslocalizationandmapping）是这样一种技术：使得机器人和自动驾驶汽车等设备能在未知环境（没有先验知识的前提下）建立地图,或者在已知环境（已给出该地图的先验知识）中能更新地图,并保证这些设备能在同时追踪它们的当前位置。

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

专知会员服务

10+阅读 · 2月8日

【新书】SLAM手册从定位与建图到空间智能，194页pdf

【新书】SLAM手册从定位与建图到空间智能，194页pdf

专知会员服务

61+阅读 · 2024年11月16日

基于异构数据融合的SLAM 研究综述

基于异构数据融合的SLAM 研究综述

专知会员服务

28+阅读 · 2024年9月18日

视觉如何模型统一？牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

视觉如何模型统一？牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

专知会员服务

47+阅读 · 2024年8月11日

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

专知会员服务

18+阅读 · 2022年3月19日

室内移动机器人的SLAM算法综述

专知会员服务

45+阅读 · 2021年9月15日

【CVPR2020】视觉导航的神经拓扑SLAM，56页ppt，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，56页ppt，Neural Topological SLAM for Visual Navigation

专知会员服务

14+阅读 · 2020年6月18日

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

专知会员服务

52+阅读 · 2020年5月26日

【电子书】《计算机视觉中的多视图几何(第2版)》英文版，Multiple View Geometry in Computer Vision，附673页PDF

【电子书】《计算机视觉中的多视图几何(第2版)》英文版，Multiple View Geometry in Computer Vision，附673页PDF

专知会员服务

132+阅读 · 2020年3月22日

视觉惯性SLAM综述

专知会员服务

87+阅读 · 2019年12月13日

超全汇总 | ORB-SLAM2 / ORB-SLAM3 相关改进代码！

超全汇总 | ORB-SLAM2 / ORB-SLAM3 相关改进代码！

计算机视觉life

35+阅读 · 2020年11月22日

综述 | 激光与视觉融合SLAM

综述 | 激光与视觉融合SLAM

计算机视觉life

18+阅读 · 2020年10月8日

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

泡泡机器人SLAM

14+阅读 · 2019年6月28日

OpenVSLAM：日本新开源”全能“视觉SLAM框架

OpenVSLAM：日本新开源”全能“视觉SLAM框架

计算机视觉life

13+阅读 · 2019年6月12日

如何从零开始系统化学习视觉SLAM？

如何从零开始系统化学习视觉SLAM？

计算机视觉life

21+阅读 · 2019年4月13日

视觉SLAM技术综述

视觉SLAM技术综述

计算机视觉life

27+阅读 · 2019年1月4日

【泡泡图灵智库】DS-SLAM:一种面向动态环境的语义视觉SLAM(arXiv)

【泡泡图灵智库】DS-SLAM:一种面向动态环境的语义视觉SLAM(arXiv)

泡泡机器人SLAM

27+阅读 · 2018年12月14日

从零开始一起学习SLAM | SLAM有什么用？

从零开始一起学习SLAM | SLAM有什么用？

计算机视觉life

18+阅读 · 2018年9月17日

【泡泡一分钟】终极SLAM？结合事件相机、RGB和IMU用于高动态、高速场景的鲁棒视觉SLAM

【泡泡一分钟】终极SLAM？结合事件相机、RGB和IMU用于高动态、高速场景的鲁棒视觉SLAM

泡泡机器人SLAM

15+阅读 · 2018年4月2日

视觉里程计：起源、优势、对比、应用

视觉里程计：起源、优势、对比、应用

计算机视觉life

18+阅读 · 2017年7月17日

基于共性视觉特征与反馈机制的SAR图像目标检测方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

面向新颖成像模式的敏捷卫星姿态滚动优化控制

国家自然科学基金

0+阅读 · 2015年12月31日

2D/3D视觉信息融合仿生SLAM关键问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

广义双随机相位编码系统中以QR码为载体的信息加密及无损恢复

国家自然科学基金

0+阅读 · 2015年12月31日

基于特征学习的空间非合作目标单目视觉位姿测量研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向无线多媒体传感器网络的高效压缩视频感知

国家自然科学基金

0+阅读 · 2015年12月31日

高分辨率太赫兹主动关联成像技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

成像系统的光学/数字处理联合设计方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于陀螺振动探测和编码曝光的遥感图像快速恢复方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

Doppler-SLAM: Doppler-Aided Radar-Inertial and LiDAR-Inertial Simultaneous Localization and Mapping

Arxiv

0+阅读 · 2月4日

Towards Next-Generation SLAM: A Survey on 3DGS-SLAM Focusing on Performance, Robustness, and Future Directions

Arxiv

0+阅读 · 2月4日

CAD-SLAM: Consistency-Aware Dynamic SLAM with Dynamic-Static Decoupled Mapping

Arxiv

0+阅读 · 2月3日

HI-SLAM2: Geometry-Aware Gaussian SLAM for Fast Monocular Scene Reconstruction

Arxiv

0+阅读 · 2月2日

SuperPoint-SLAM3: Augmenting ORB-SLAM3 with Deep Features, Adaptive NMS, and Learning-Based Loop Closure

Arxiv

0+阅读 · 1月29日

VGGT-SLAM 2.0: Real time Dense Feed-forward Scene Reconstruction

Arxiv

0+阅读 · 1月27日

SCE-SLAM: Scale-Consistent Monocular SLAM via Scene Coordinate Embeddings

Arxiv

0+阅读 · 1月14日

FeatureSLAM: Feature-enriched 3D gaussian splatting SLAM in real time

Arxiv

0+阅读 · 1月9日

P2U-SLAM: A Monocular Wide-FoV SLAM System Based on Point Uncertainty and Pose Uncertainty

Arxiv

0+阅读 · 1月3日

FoundationSLAM: Unleashing the Power of Depth Foundation Models for End-to-End Dense Visual SLAM

Arxiv

0+阅读 · 2025年12月31日

VIP会员

文章信息

相关主题

相关VIP内容

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

专知会员服务

10+阅读 · 2月8日

【新书】SLAM手册从定位与建图到空间智能，194页pdf

【新书】SLAM手册从定位与建图到空间智能，194页pdf

专知会员服务

61+阅读 · 2024年11月16日

基于异构数据融合的SLAM 研究综述

基于异构数据融合的SLAM 研究综述

专知会员服务

28+阅读 · 2024年9月18日

视觉如何模型统一？牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

视觉如何模型统一？牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

专知会员服务

47+阅读 · 2024年8月11日

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

专知会员服务

18+阅读 · 2022年3月19日

室内移动机器人的SLAM算法综述

专知会员服务

45+阅读 · 2021年9月15日

【CVPR2020】视觉导航的神经拓扑SLAM，56页ppt，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，56页ppt，Neural Topological SLAM for Visual Navigation

专知会员服务

14+阅读 · 2020年6月18日

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

专知会员服务

52+阅读 · 2020年5月26日

【电子书】《计算机视觉中的多视图几何(第2版)》英文版，Multiple View Geometry in Computer Vision，附673页PDF

【电子书】《计算机视觉中的多视图几何(第2版)》英文版，Multiple View Geometry in Computer Vision，附673页PDF

专知会员服务

132+阅读 · 2020年3月22日

视觉惯性SLAM综述

专知会员服务

87+阅读 · 2019年12月13日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】基于自适应表征的高效视觉建模

《多域作战中融合网络、电子战与动能机动》

AI智能体时代大模型安全风险与攻防新挑战

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

相关资讯

超全汇总 | ORB-SLAM2 / ORB-SLAM3 相关改进代码！

超全汇总 | ORB-SLAM2 / ORB-SLAM3 相关改进代码！

计算机视觉life

35+阅读 · 2020年11月22日

综述 | 激光与视觉融合SLAM

综述 | 激光与视觉融合SLAM

计算机视觉life

18+阅读 · 2020年10月8日

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

泡泡机器人SLAM

14+阅读 · 2019年6月28日

OpenVSLAM：日本新开源”全能“视觉SLAM框架

OpenVSLAM：日本新开源”全能“视觉SLAM框架

计算机视觉life

13+阅读 · 2019年6月12日

如何从零开始系统化学习视觉SLAM？

如何从零开始系统化学习视觉SLAM？

计算机视觉life

21+阅读 · 2019年4月13日

视觉SLAM技术综述

视觉SLAM技术综述

计算机视觉life

27+阅读 · 2019年1月4日

【泡泡图灵智库】DS-SLAM:一种面向动态环境的语义视觉SLAM(arXiv)

【泡泡图灵智库】DS-SLAM:一种面向动态环境的语义视觉SLAM(arXiv)

泡泡机器人SLAM

27+阅读 · 2018年12月14日

从零开始一起学习SLAM | SLAM有什么用？

从零开始一起学习SLAM | SLAM有什么用？

计算机视觉life

18+阅读 · 2018年9月17日

【泡泡一分钟】终极SLAM？结合事件相机、RGB和IMU用于高动态、高速场景的鲁棒视觉SLAM

【泡泡一分钟】终极SLAM？结合事件相机、RGB和IMU用于高动态、高速场景的鲁棒视觉SLAM

泡泡机器人SLAM

15+阅读 · 2018年4月2日

视觉里程计：起源、优势、对比、应用

视觉里程计：起源、优势、对比、应用

计算机视觉life

18+阅读 · 2017年7月17日

相关论文

Doppler-SLAM: Doppler-Aided Radar-Inertial and LiDAR-Inertial Simultaneous Localization and Mapping

Arxiv

0+阅读 · 2月4日

Towards Next-Generation SLAM: A Survey on 3DGS-SLAM Focusing on Performance, Robustness, and Future Directions

Arxiv

0+阅读 · 2月4日

CAD-SLAM: Consistency-Aware Dynamic SLAM with Dynamic-Static Decoupled Mapping

Arxiv

0+阅读 · 2月3日

HI-SLAM2: Geometry-Aware Gaussian SLAM for Fast Monocular Scene Reconstruction

Arxiv

0+阅读 · 2月2日

SuperPoint-SLAM3: Augmenting ORB-SLAM3 with Deep Features, Adaptive NMS, and Learning-Based Loop Closure

Arxiv

0+阅读 · 1月29日

VGGT-SLAM 2.0: Real time Dense Feed-forward Scene Reconstruction

Arxiv

0+阅读 · 1月27日

SCE-SLAM: Scale-Consistent Monocular SLAM via Scene Coordinate Embeddings

Arxiv

0+阅读 · 1月14日

FeatureSLAM: Feature-enriched 3D gaussian splatting SLAM in real time

Arxiv

0+阅读 · 1月9日

P2U-SLAM: A Monocular Wide-FoV SLAM System Based on Point Uncertainty and Pose Uncertainty

Arxiv

0+阅读 · 1月3日

FoundationSLAM: Unleashing the Power of Depth Foundation Models for End-to-End Dense Visual SLAM

Arxiv

0+阅读 · 2025年12月31日

相关基金

基于共性视觉特征与反馈机制的SAR图像目标检测方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

面向新颖成像模式的敏捷卫星姿态滚动优化控制

国家自然科学基金

0+阅读 · 2015年12月31日

2D/3D视觉信息融合仿生SLAM关键问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

广义双随机相位编码系统中以QR码为载体的信息加密及无损恢复

国家自然科学基金

0+阅读 · 2015年12月31日

基于特征学习的空间非合作目标单目视觉位姿测量研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向无线多媒体传感器网络的高效压缩视频感知

国家自然科学基金

0+阅读 · 2015年12月31日

高分辨率太赫兹主动关联成像技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

成像系统的光学/数字处理联合设计方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于陀螺振动探测和编码曝光的遥感图像快速恢复方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员