SCE-SLAM：基于场景坐标嵌入的尺度一致性单目SLAM (SCE-SLAM: Scale-Consistent Monocular SLAM via Scene Coordinate Embeddings) - 专知论文

会员服务 ·

0

SLAM · 嵌入 · 一致 · 约束 · 单目视觉 ·

SCE-SLAM: Scale-Consistent Monocular SLAM via Scene Coordinate Embeddings

翻译：SCE-SLAM：基于场景坐标嵌入的尺度一致性单目SLAM

Yuchen Wu,Jiahe Li,Xiaohan Yu,Lina Yu,Jin Zheng,Xiao Bai

Monocular visual SLAM enables 3D reconstruction from internet video and autonomous navigation on resource-constrained platforms, yet suffers from scale drift, i.e., the gradual divergence of estimated scale over long sequences. Existing frame-to-frame methods achieve real-time performance through local optimization but accumulate scale drift due to the lack of global constraints among independent windows. To address this, we propose SCE-SLAM, an end-to-end SLAM system that maintains scale consistency through scene coordinate embeddings, which are learned patch-level representations encoding 3D geometric relationships under a canonical scale reference. The framework consists of two key modules: geometry-guided aggregation that leverages 3D spatial proximity to propagate scale information from historical observations through geometry-modulated attention, and scene coordinate bundle adjustment that anchors current estimates to the reference scale through explicit 3D coordinate constraints decoded from the scene coordinate embeddings. Experiments on KITTI, Waymo, and vKITTI demonstrate substantial improvements: our method reduces absolute trajectory error by 8.36m on KITTI compared to the best prior approach, while maintaining 36 FPS and achieving scale consistency across large-scale scenes.

翻译：单目视觉SLAM能够从网络视频中进行三维重建并在资源受限平台上实现自主导航，但其存在尺度漂移问题，即在长序列中估计尺度会逐渐发散。现有的帧间方法通过局部优化实现实时性能，但由于独立窗口间缺乏全局约束，会累积尺度漂移。为解决此问题，我们提出了SCE-SLAM，这是一种通过场景坐标嵌入保持尺度一致性的端到端SLAM系统。场景坐标嵌入是学习得到的块级表示，在规范尺度参考下编码三维几何关系。该框架包含两个关键模块：几何引导聚合模块利用三维空间邻近性，通过几何调制注意力从历史观测中传播尺度信息；场景坐标束调整模块通过从场景坐标嵌入解码出的显式三维坐标约束，将当前估计锚定到参考尺度。在KITTI、Waymo和vKITTI数据集上的实验证明了显著改进：与现有最佳方法相比，我们的方法在KITTI上将绝对轨迹误差降低了8.36米，同时保持36 FPS的帧率，并在大规模场景中实现了尺度一致性。

0

相关内容

SLAM

即时定位与地图构建（SLAM或Simultaneouslocalizationandmapping）是这样一种技术：使得机器人和自动驾驶汽车等设备能在未知环境（没有先验知识的前提下）建立地图,或者在已知环境（已给出该地图的先验知识）中能更新地图,并保证这些设备能在同时追踪它们的当前位置。

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

专知会员服务

10+阅读 · 2月8日

【新书】SLAM手册从定位与建图到空间智能，194页pdf

【新书】SLAM手册从定位与建图到空间智能，194页pdf

专知会员服务

61+阅读 · 2024年11月16日

基于异构数据融合的SLAM 研究综述

基于异构数据融合的SLAM 研究综述

专知会员服务

28+阅读 · 2024年9月18日

【MIT博士论文】低动态环境中的长期基于对象SLAM，160页pdf

【MIT博士论文】低动态环境中的长期基于对象SLAM，160页pdf

专知会员服务

27+阅读 · 2024年3月19日

浙大刘勇教授团队发表综述文章：多源融合SLAM的现状与挑战

浙大刘勇教授团队发表综述文章：多源融合SLAM的现状与挑战

专知会员服务

43+阅读 · 2022年4月7日

室内移动机器人的SLAM算法综述

专知会员服务

45+阅读 · 2021年9月15日

【CVPR2020】视觉导航的神经拓扑SLAM，56页ppt，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，56页ppt，Neural Topological SLAM for Visual Navigation

专知会员服务

14+阅读 · 2020年6月18日

【开放书】SLAM 中的几何与学习方法，62页pdf

【开放书】SLAM 中的几何与学习方法，62页pdf

专知会员服务

111+阅读 · 2020年6月5日

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

专知会员服务

52+阅读 · 2020年5月26日

视觉惯性SLAM综述

专知会员服务

87+阅读 · 2019年12月13日

超全汇总 | ORB-SLAM2 / ORB-SLAM3 相关改进代码！

超全汇总 | ORB-SLAM2 / ORB-SLAM3 相关改进代码！

计算机视觉life

35+阅读 · 2020年11月22日

综述 | 激光与视觉融合SLAM

综述 | 激光与视觉融合SLAM

计算机视觉life

18+阅读 · 2020年10月8日

实战 | 如何制作一个SLAM轨迹真值获取装置？

实战 | 如何制作一个SLAM轨迹真值获取装置？

计算机视觉life

12+阅读 · 2019年10月16日

综述 | SLAM回环检测方法

综述 | SLAM回环检测方法

计算机视觉life

16+阅读 · 2019年8月19日

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

泡泡机器人SLAM

14+阅读 · 2019年6月28日

如何从零开始系统化学习视觉SLAM？

如何从零开始系统化学习视觉SLAM？

计算机视觉life

21+阅读 · 2019年4月13日

高翔：谈谈语义SLAM/地图

高翔：谈谈语义SLAM/地图

计算机视觉life

37+阅读 · 2019年3月26日

视觉SLAM技术综述

视觉SLAM技术综述

计算机视觉life

27+阅读 · 2019年1月4日

【泡泡图灵智库】DS-SLAM:一种面向动态环境的语义视觉SLAM(arXiv)

【泡泡图灵智库】DS-SLAM:一种面向动态环境的语义视觉SLAM(arXiv)

泡泡机器人SLAM

27+阅读 · 2018年12月14日

从零开始一起学习SLAM | SLAM有什么用？

从零开始一起学习SLAM | SLAM有什么用？

计算机视觉life

18+阅读 · 2018年9月17日

基于共性视觉特征与反馈机制的SAR图像目标检测方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

未知环境下基于单目视觉的移动平台目标跟踪方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

视频场景下大位移运动目标的持续性跟踪方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

2D/3D视觉信息融合仿生SLAM关键问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于特征学习的空间非合作目标单目视觉位姿测量研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于尺度集的高分辨率遥感影像多尺度分类

国家自然科学基金

0+阅读 · 2015年12月31日

基于结构光场照明的单像素成像技术及应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

由偏振标记，由光纤远程柔性、共路传输的二合一固体微片激光回馈干涉仪

国家自然科学基金

0+阅读 · 2014年12月31日

合成孔径雷达（SAR）在地球科学应用中的尺度效应研究

国家自然科学基金

0+阅读 · 2014年12月31日

单光子高精度测距器件集成及卫星编队飞行应用

国家自然科学基金

0+阅读 · 2014年12月31日

SceneVGGT: VGGT-based online 3D semantic SLAM for indoor scene understanding and navigation

Arxiv

0+阅读 · 2月19日

NRGS-SLAM: Monocular Non-Rigid SLAM for Endoscopy via Deformation-Aware 3D Gaussian Splatting

Arxiv

0+阅读 · 2月19日

GSO-SLAM: Bidirectionally Coupled Gaussian Splatting and Direct Visual Odometry

Arxiv

0+阅读 · 2月12日

OpenMonoGS-SLAM: Monocular Gaussian Splatting SLAM with Open-set Semantics

Arxiv

0+阅读 · 2月10日

VGGT-Motion: Motion-Aware Calibration-Free Monocular SLAM for Long-Range Consistency

Arxiv

0+阅读 · 2月5日

Doppler-SLAM: Doppler-Aided Radar-Inertial and LiDAR-Inertial Simultaneous Localization and Mapping

Arxiv

0+阅读 · 2月4日

Towards Next-Generation SLAM: A Survey on 3DGS-SLAM Focusing on Performance, Robustness, and Future Directions

Arxiv

0+阅读 · 2月4日

CAD-SLAM: Consistency-Aware Dynamic SLAM with Dynamic-Static Decoupled Mapping

Arxiv

0+阅读 · 2月3日

HI-SLAM2: Geometry-Aware Gaussian SLAM for Fast Monocular Scene Reconstruction

Arxiv

0+阅读 · 2月2日

RGS-SLAM: Robust Gaussian Splatting SLAM with One-Shot Dense Initialization

Arxiv

0+阅读 · 1月15日

VIP会员

文章信息

相关主题

相关VIP内容

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

专知会员服务

10+阅读 · 2月8日

【新书】SLAM手册从定位与建图到空间智能，194页pdf

【新书】SLAM手册从定位与建图到空间智能，194页pdf

专知会员服务

61+阅读 · 2024年11月16日

基于异构数据融合的SLAM 研究综述

基于异构数据融合的SLAM 研究综述

专知会员服务

28+阅读 · 2024年9月18日

【MIT博士论文】低动态环境中的长期基于对象SLAM，160页pdf

【MIT博士论文】低动态环境中的长期基于对象SLAM，160页pdf

专知会员服务

27+阅读 · 2024年3月19日

浙大刘勇教授团队发表综述文章：多源融合SLAM的现状与挑战

浙大刘勇教授团队发表综述文章：多源融合SLAM的现状与挑战

专知会员服务

43+阅读 · 2022年4月7日

室内移动机器人的SLAM算法综述

专知会员服务

45+阅读 · 2021年9月15日

【CVPR2020】视觉导航的神经拓扑SLAM，56页ppt，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，56页ppt，Neural Topological SLAM for Visual Navigation

专知会员服务

14+阅读 · 2020年6月18日

【开放书】SLAM 中的几何与学习方法，62页pdf

【开放书】SLAM 中的几何与学习方法，62页pdf

专知会员服务

111+阅读 · 2020年6月5日

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

专知会员服务

52+阅读 · 2020年5月26日

视觉惯性SLAM综述

专知会员服务

87+阅读 · 2019年12月13日

热门VIP内容

开通专知VIP会员享更多权益服务

《可信人工智能赋能系统的支柱》

《从经典神经网络到不确定性下的拓扑神经网络：军事应用》2026最新40页报告

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

《人工智能：对战略与力量的影响》slides

相关资讯

超全汇总 | ORB-SLAM2 / ORB-SLAM3 相关改进代码！

超全汇总 | ORB-SLAM2 / ORB-SLAM3 相关改进代码！

计算机视觉life

35+阅读 · 2020年11月22日

综述 | 激光与视觉融合SLAM

综述 | 激光与视觉融合SLAM

计算机视觉life

18+阅读 · 2020年10月8日

实战 | 如何制作一个SLAM轨迹真值获取装置？

实战 | 如何制作一个SLAM轨迹真值获取装置？

计算机视觉life

12+阅读 · 2019年10月16日

综述 | SLAM回环检测方法

综述 | SLAM回环检测方法

计算机视觉life

16+阅读 · 2019年8月19日

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

泡泡机器人SLAM

14+阅读 · 2019年6月28日

如何从零开始系统化学习视觉SLAM？

如何从零开始系统化学习视觉SLAM？

计算机视觉life

21+阅读 · 2019年4月13日

高翔：谈谈语义SLAM/地图

高翔：谈谈语义SLAM/地图

计算机视觉life

37+阅读 · 2019年3月26日

视觉SLAM技术综述

视觉SLAM技术综述

计算机视觉life

27+阅读 · 2019年1月4日

【泡泡图灵智库】DS-SLAM:一种面向动态环境的语义视觉SLAM(arXiv)

【泡泡图灵智库】DS-SLAM:一种面向动态环境的语义视觉SLAM(arXiv)

泡泡机器人SLAM

27+阅读 · 2018年12月14日

从零开始一起学习SLAM | SLAM有什么用？

从零开始一起学习SLAM | SLAM有什么用？

计算机视觉life

18+阅读 · 2018年9月17日

相关论文

SceneVGGT: VGGT-based online 3D semantic SLAM for indoor scene understanding and navigation

Arxiv

0+阅读 · 2月19日

NRGS-SLAM: Monocular Non-Rigid SLAM for Endoscopy via Deformation-Aware 3D Gaussian Splatting

Arxiv

0+阅读 · 2月19日

GSO-SLAM: Bidirectionally Coupled Gaussian Splatting and Direct Visual Odometry

Arxiv

0+阅读 · 2月12日

OpenMonoGS-SLAM: Monocular Gaussian Splatting SLAM with Open-set Semantics

Arxiv

0+阅读 · 2月10日

VGGT-Motion: Motion-Aware Calibration-Free Monocular SLAM for Long-Range Consistency

Arxiv

0+阅读 · 2月5日

Doppler-SLAM: Doppler-Aided Radar-Inertial and LiDAR-Inertial Simultaneous Localization and Mapping

Arxiv

0+阅读 · 2月4日

Towards Next-Generation SLAM: A Survey on 3DGS-SLAM Focusing on Performance, Robustness, and Future Directions

Arxiv

0+阅读 · 2月4日

CAD-SLAM: Consistency-Aware Dynamic SLAM with Dynamic-Static Decoupled Mapping

Arxiv

0+阅读 · 2月3日

HI-SLAM2: Geometry-Aware Gaussian SLAM for Fast Monocular Scene Reconstruction

Arxiv

0+阅读 · 2月2日

RGS-SLAM: Robust Gaussian Splatting SLAM with One-Shot Dense Initialization

Arxiv

0+阅读 · 1月15日

相关基金

基于共性视觉特征与反馈机制的SAR图像目标检测方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

未知环境下基于单目视觉的移动平台目标跟踪方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

视频场景下大位移运动目标的持续性跟踪方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

2D/3D视觉信息融合仿生SLAM关键问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于特征学习的空间非合作目标单目视觉位姿测量研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于尺度集的高分辨率遥感影像多尺度分类

国家自然科学基金

0+阅读 · 2015年12月31日

基于结构光场照明的单像素成像技术及应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

由偏振标记，由光纤远程柔性、共路传输的二合一固体微片激光回馈干涉仪

国家自然科学基金

0+阅读 · 2014年12月31日

合成孔径雷达（SAR）在地球科学应用中的尺度效应研究

国家自然科学基金

0+阅读 · 2014年12月31日

单光子高精度测距器件集成及卫星编队飞行应用

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员