Reliable robotic navigation necessitates the seamless integration of accurate global localization and dense, metric-consistent obstacle perception. A common strategy to achieve these capabilities involves integrating diverse sensing modalities: cameras offer rich visual features for localization, while active sensors like LiDAR provide direct metric measurements. However, such multi-sensor configurations necessitate complex spatial-temporal calibration and increase deployment overhead. Although vision-only approaches offer a low-cost and scalable alternative, existing monocular visual systems typically struggle to simultaneously achieve efficient, globally consistent localization and dense, metric-consistent geometric perception. To bridge this gap, we propose \textbf{VGP-Nav}, a unified framework for \textit{Metric-Aware Visual Geometric Perception} that relies solely on monocular RGB input to jointly support metric localization and obstacle perception. Our key insight is to anchor localization-grounded visual geometry to physically meaningful scale constraints derived from ground-plane geometry, thereby providing a reliable metric reference for monocular perception. VGP-Nav resolves monocular scale ambiguity online and produces localization-grounded, metric obstacle representations that are directly applicable to downstream planning. Extensive experiments demonstrate strong generalization across diverse environments and successful deployment on real mobile robots, highlighting the practicality of our approach for scalable, low-cost, and safe autonomous navigation.


翻译:可靠的机器人导航需要精确的全局定位与稠密、度量一致的障碍物感知的无缝集成。实现这些能力的常见策略涉及整合多种传感模态:相机提供丰富的视觉特征用于定位,而激光雷达等主动传感器则提供直接的度量测量。然而,此类多传感器配置需要复杂的时空标定并增加部署开销。尽管纯视觉方法提供了一种低成本且可扩展的替代方案,但现有的单目视觉系统通常难以同时实现高效、全局一致的定位和稠密、度量一致的几何感知。为弥合这一差距,我们提出\textbf{VGP-Nav},一个统一的度量感知视觉几何感知框架,仅依赖单目RGB输入联合支持度量定位与障碍物感知。我们的关键洞察在于将基于定位的视觉几何锚定到由地平面几何导出的物理意义尺度约束,从而为单目感知提供可靠的度量参考。VGP-Nav在线解决单目尺度模糊问题,并生成可直接应用于下游规划的、基于定位的度量障碍物表示。大量实验证明了在多样环境中的强泛化能力以及在实际移动机器人上的成功部署,突显了该方法对于可扩展、低成本且安全自主导航的实用性。

0
下载
关闭预览

相关内容

用于自主船舶态势感知的传感器和人工智能技术综述
专知会员服务
68+阅读 · 2022年10月22日
自动驾驶车辆定位技术概述|厚势汽车
厚势
10+阅读 · 2019年5月16日
深度学习在自动驾驶感知领域的应用
AI100
11+阅读 · 2019年3月6日
【紫冬分享】移动机器人视觉里程计综述
中国科学院自动化研究所
12+阅读 · 2018年10月31日
报名 | 让机器读懂你的意图——人体姿态估计入门
人工智能头条
10+阅读 · 2017年9月19日
国家自然科学基金
12+阅读 · 2017年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
29+阅读 · 2011年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
7+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
6+阅读 · 6月17日
相关VIP内容
用于自主船舶态势感知的传感器和人工智能技术综述
专知会员服务
68+阅读 · 2022年10月22日
相关基金
国家自然科学基金
12+阅读 · 2017年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
29+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员