A key component of Visual Simultaneous Localization and Mapping (VSLAM) is estimating relative camera poses using matched keypoints. Accurate estimation is challenged by noisy correspondences. Classical methods rely on stochastic hypothesis sampling and iterative estimation, while learning-based methods often lack explicit geometric structure. In this work, we reformulate relative pose estimation as a relational inference problem over epipolar correspondence graphs, where matched keypoints are nodes and nearby ones are connected by edges. Graph operations such as pruning, message passing, and pooling estimate a quaternion rotation, translation vector, and the Essential Matrix (EM). Minimizing a loss comprising (i) $\mathcal{L}_2$ differences with ground truth (GT), (ii) Frobenius norm between estimated and GT EMs, (iii) singular value differences, (iv) heading angle differences, and (v) scale differences, yields the relative pose between image pairs. The dense detector-free method LoFTR is used for matching. Experiments on indoor and outdoor benchmarks show improved robustness to dense noise and large baseline variation compared to classical and learning-guided approaches, highlighting the effectiveness of global relational consensus.


翻译:视觉同时定位与地图构建(VSLAM)的核心组件之一是利用匹配关键点估计相对相机姿态。噪声对应关系对准确估计构成挑战。经典方法依赖随机假设采样和迭代估计,而基于学习的方法通常缺乏显式几何结构。本文提出将相对姿态估计重新表述为极线对应图上的关系推理问题,其中匹配关键点为节点,邻近节点通过边连接。通过剪枝、消息传递和池化等图操作,估计四元数旋转、平移向量及本质矩阵(EM)。最小化包含以下项的损失函数:(i)与真值(GT)的$\mathcal{L}_2$差异;(ii)估计EM与真值EM之间的Frobenius范数;(iii)奇异值差异;(iv)航向角差异;(v)尺度差异,从而获得图像对间的相对姿态。匹配采用无检测器密集方法LoFTR。在室内外基准上的实验表明,与经典方法及学习引导方法相比,本方法对密集噪声和大基线变化具有更强的鲁棒性,凸显了全局关系共识的有效性。

0
下载
关闭预览

相关内容

深度学习图像匹配:综述与展望
专知会员服务
18+阅读 · 2025年6月6日
基于深度学习的物体姿态估计综述
专知会员服务
26+阅读 · 2024年5月15日
「多模态遥感图像匹配方法」最新研究综述
专知会员服务
33+阅读 · 2023年4月7日
高级地图匹配算法:研究现状和趋势
专知会员服务
18+阅读 · 2021年10月28日
CVPR 2021 Oral | 室内动态场景中的相机重定位
专知会员服务
16+阅读 · 2021年4月12日
【AAAI2023】用于图对比学习的谱特征增强
专知
20+阅读 · 2022年12月11日
综述 | 图像配准 Image registration
计算机视觉life
19+阅读 · 2019年9月12日
综述 | SLAM回环检测方法
计算机视觉life
16+阅读 · 2019年8月19日
深度学习应用在图像匹配的效果如何?
中国图象图形学报
10+阅读 · 2019年6月11日
深度学习人体姿态估计算法综述
AI前线
25+阅读 · 2019年5月19日
Maplab:研究视觉惯性建图和定位的开源框架
泡泡机器人SLAM
16+阅读 · 2018年4月4日
概率图模型体系:HMM、MEMM、CRF
机器学习研究会
30+阅读 · 2018年2月10日
视觉里程计:起源、优势、对比、应用
计算机视觉life
18+阅读 · 2017年7月17日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
4+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
4+阅读 · 6月22日
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关资讯
【AAAI2023】用于图对比学习的谱特征增强
专知
20+阅读 · 2022年12月11日
综述 | 图像配准 Image registration
计算机视觉life
19+阅读 · 2019年9月12日
综述 | SLAM回环检测方法
计算机视觉life
16+阅读 · 2019年8月19日
深度学习应用在图像匹配的效果如何?
中国图象图形学报
10+阅读 · 2019年6月11日
深度学习人体姿态估计算法综述
AI前线
25+阅读 · 2019年5月19日
Maplab:研究视觉惯性建图和定位的开源框架
泡泡机器人SLAM
16+阅读 · 2018年4月4日
概率图模型体系:HMM、MEMM、CRF
机器学习研究会
30+阅读 · 2018年2月10日
视觉里程计:起源、优势、对比、应用
计算机视觉life
18+阅读 · 2017年7月17日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员