360DVO：用于单目360度相机的深度视觉里程计 (360DVO: Deep Visual Odometry for Monocular 360-Degree Camera) - 专知论文

会员服务 ·

0

奇虎 360 · 视觉里程 · 视觉里程计 · 系统 · 鲁棒 ·

360DVO: Deep Visual Odometry for Monocular 360-Degree Camera

翻译：360DVO：用于单目360度相机的深度视觉里程计

Xiaopeng Guo,Yinzhe Xu,Huajian Huang,Sai-Kit Yeung

from arxiv, 12 pages. Received by RA-L

Monocular omnidirectional visual odometry (OVO) systems leverage 360-degree cameras to overcome field-of-view limitations of perspective VO systems. However, existing methods, reliant on handcrafted features or photometric objectives, often lack robustness in challenging scenarios, such as aggressive motion and varying illumination. To address this, we present 360DVO, the first deep learning-based OVO framework. Our approach introduces a distortion-aware spherical feature extractor (DAS-Feat) that adaptively learns distortion-resistant features from 360-degree images. These sparse feature patches are then used to establish constraints for effective pose estimation within a novel omnidirectional differentiable bundle adjustment (ODBA) module. To facilitate evaluation in realistic settings, we also contribute a new real-world OVO benchmark. Extensive experiments on this benchmark and public synthetic datasets (TartanAir V2 and 360VO) demonstrate that 360DVO surpasses state-of-the-art baselines (including 360VO and OpenVSLAM), improving robustness by 50% and accuracy by 37.5%. Homepage: https://chris1004336379.github.io/360DVO-homepage

翻译：单目全向视觉里程计（OVO）系统利用360度相机来克服透视VO系统的视野限制。然而，现有方法依赖于手工特征或光度目标，在挑战性场景（如剧烈运动和变化光照）中通常缺乏鲁棒性。为解决此问题，我们提出了360DVO，首个基于深度学习的OVO框架。我们的方法引入了一个感知畸变的球面特征提取器（DAS-Feat），它能自适应地从360度图像中学习抗畸变特征。这些稀疏特征块随后被用于在一个新颖的全向可微光束法平差（ODBA）模块中建立有效位姿估计的约束。为了促进在真实场景中的评估，我们还贡献了一个新的真实世界OVO基准。在此基准和公开合成数据集（TartanAir V2 和 360VO）上进行的大量实验表明，360DVO超越了最先进的基线方法（包括360VO和OpenVSLAM），将鲁棒性提高了50%，精度提高了37.5%。主页：https://chris1004336379.github.io/360DVO-homepage

0

相关内容

奇虎 360

中国领先的互联网安全服务与软件公司，主营以360安全卫士、360浏览器等为代表的网络安全产品。主要依靠在线广告、互联网增值服务创收。目前，公司PC端产品和服务的月活跃用户为4.42亿，市场渗透率为95%。

2012年8月，公司推出「360 搜索」业务，正式进军搜索引擎市场。作为中国互联网界最受争议的公司，奇虎360先后与腾讯、百度等互联网巨头产生过激烈的产品竞争。

2011年3月，公司以「QIHU」为代码正式登陆纽约证券交易所。

迈向深度基础模型：基于视觉的深度估计最新趋势

迈向深度基础模型：基于视觉的深度估计最新趋势

专知会员服务

23+阅读 · 2025年7月16日

【HKUST博士论文】可扩展的基于视觉的 3D 物体检测与单目深度估计用于自动驾驶

【HKUST博士论文】可扩展的基于视觉的 3D 物体检测与单目深度估计用于自动驾驶

专知会员服务

18+阅读 · 2025年1月20日

跨多种数据模态的视觉目标跟踪：综述

跨多种数据模态的视觉目标跟踪：综述

专知会员服务

29+阅读 · 2024年12月16日

【TPAMI2023】PSLT：一种带有梯形自注意力和逐步位移的轻量级视觉Transformer

【TPAMI2023】PSLT：一种带有梯形自注意力和逐步位移的轻量级视觉Transformer

专知会员服务

26+阅读 · 2023年9月4日

什么是鸟瞰图感知(BEV)?上海AI实验室与商汤等最新《鸟瞰图视觉感知》综述，26页pdf阐述BEV 最新回顾、评价与方法

什么是鸟瞰图感知(BEV)?上海AI实验室与商汤等最新《鸟瞰图视觉感知》综述，26页pdf阐述BEV 最新回顾、评价与方法

专知会员服务

71+阅读 · 2022年9月14日

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

专知会员服务

18+阅读 · 2022年3月19日

【博士论文】基于深度学习的单目场景深度估计方法研究

【博士论文】基于深度学习的单目场景深度估计方法研究

专知会员服务

57+阅读 · 2021年12月8日

【CVPR2020】自监督的深度视觉测程与在线适应，Self-Supervised Deep Visual Odometry

【CVPR2020】自监督的深度视觉测程与在线适应，Self-Supervised Deep Visual Odometry

专知会员服务

32+阅读 · 2020年5月14日

【电子书】《计算机视觉中的多视图几何(第2版)》英文版，Multiple View Geometry in Computer Vision，附673页PDF

【电子书】《计算机视觉中的多视图几何(第2版)》英文版，Multiple View Geometry in Computer Vision，附673页PDF

专知会员服务

132+阅读 · 2020年3月22日

【深度估计| 2019最新综述】单目深度估计方法综述（Monocular Depth Estimation: A Survey）

专知会员服务

69+阅读 · 2019年11月23日

NeurIPS2019|首篇单目无监督深度估计与视觉里程计，效果超越双目算法，已开源

NeurIPS2019|首篇单目无监督深度估计与视觉里程计，效果超越双目算法，已开源

极市平台

29+阅读 · 2019年9月4日

计算机视觉方向简介 | 视觉惯性里程计(VIO)

计算机视觉方向简介 | 视觉惯性里程计(VIO)

计算机视觉life

64+阅读 · 2019年6月16日

【泡泡图灵智库】LIMO: LiDAR-单目相机视觉里程计（arXiv）

【泡泡图灵智库】LIMO: LiDAR-单目相机视觉里程计（arXiv）

泡泡机器人SLAM

48+阅读 · 2019年5月14日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

计算机视觉方向简介 | 基于单目视觉的三维重建算法

计算机视觉方向简介 | 基于单目视觉的三维重建算法

计算机视觉life

32+阅读 · 2019年4月9日

【泡泡一分钟】LIMO：激光和单目相机融合的视觉里程计

【泡泡一分钟】LIMO：激光和单目相机融合的视觉里程计

泡泡机器人SLAM

13+阅读 · 2019年1月16日

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

商汤科技

14+阅读 · 2018年6月2日

深度相机原理揭秘--双目立体视觉

深度相机原理揭秘--双目立体视觉

计算机视觉life

10+阅读 · 2017年11月7日

视觉里程计：特征点法之全面梳理

视觉里程计：特征点法之全面梳理

计算机视觉life

12+阅读 · 2017年8月2日

视觉里程计：起源、优势、对比、应用

视觉里程计：起源、优势、对比、应用

计算机视觉life

18+阅读 · 2017年7月17日

未知环境下基于单目视觉的移动平台目标跟踪方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

多目主动相机智能监控关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于特征学习的空间非合作目标单目视觉位姿测量研究

国家自然科学基金

2+阅读 · 2015年12月31日

“数据-知识”驱动的大区域高分辨率遥感影像多尺度分割并行计算方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于尺度集的高分辨率遥感影像多尺度分类

国家自然科学基金

0+阅读 · 2015年12月31日

深度学习框架下基于情境线索的视觉注意研究

国家自然科学基金

2+阅读 · 2015年12月31日

自由视点三维视频中纹理-深度图像联合建模及应用

国家自然科学基金

0+阅读 · 2015年12月31日

高数值孔径曲面复眼成像体系研究

国家自然科学基金

0+阅读 · 2014年12月31日

单光子高精度测距器件集成及卫星编队飞行应用

国家自然科学基金

0+阅读 · 2014年12月31日

基于人眼视觉特性与ASIFT的多尺度变换域视频水印算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

SalFormer360: a transformer-based saliency estimation model for 360-degree videos

Arxiv

0+阅读 · 2月4日

LEVIO: Lightweight Embedded Visual Inertial Odometry for Resource-Constrained Devices

Arxiv

0+阅读 · 2月3日

360Anything: Geometry-Free Lifting of Images and Videos to 360°

Arxiv

0+阅读 · 1月22日

Keyframe-Based Feed-Forward Visual Odometry

Arxiv

0+阅读 · 1月22日

PanoDreamer: Optimization-Based Single Image to 360 3D Scene With Diffusion

Arxiv

0+阅读 · 1月21日

Omni-LIVO: Robust RGB-Colored Multi-Camera Visual-Inertial-LiDAR Odometry via Photometric Migration and ESIKF Fusion

Arxiv

0+阅读 · 1月20日

EqVIO: An Equivariant Filter for Visual Inertial Odometry

Arxiv

0+阅读 · 1月16日

ORB-SfMLearner: ORB-Guided Self-supervised Visual Odometry with Selective Online Adaptation

Arxiv

0+阅读 · 1月11日

GeoSurDepth: Spatial Geometry-Consistent Self-Supervised Depth Estimation for Surround-View Cameras

Arxiv

0+阅读 · 1月9日

360DVO: Deep Visual Odometry for Monocular 360-Degree Camera

Arxiv

0+阅读 · 1月9日

VIP会员

文章信息

相关主题

视觉里程计

相关VIP内容

迈向深度基础模型：基于视觉的深度估计最新趋势

迈向深度基础模型：基于视觉的深度估计最新趋势

专知会员服务

23+阅读 · 2025年7月16日

【HKUST博士论文】可扩展的基于视觉的 3D 物体检测与单目深度估计用于自动驾驶

【HKUST博士论文】可扩展的基于视觉的 3D 物体检测与单目深度估计用于自动驾驶

专知会员服务

18+阅读 · 2025年1月20日

跨多种数据模态的视觉目标跟踪：综述

跨多种数据模态的视觉目标跟踪：综述

专知会员服务

29+阅读 · 2024年12月16日

【TPAMI2023】PSLT：一种带有梯形自注意力和逐步位移的轻量级视觉Transformer

【TPAMI2023】PSLT：一种带有梯形自注意力和逐步位移的轻量级视觉Transformer

专知会员服务

26+阅读 · 2023年9月4日

什么是鸟瞰图感知(BEV)?上海AI实验室与商汤等最新《鸟瞰图视觉感知》综述，26页pdf阐述BEV 最新回顾、评价与方法

什么是鸟瞰图感知(BEV)?上海AI实验室与商汤等最新《鸟瞰图视觉感知》综述，26页pdf阐述BEV 最新回顾、评价与方法

专知会员服务

71+阅读 · 2022年9月14日

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

专知会员服务

18+阅读 · 2022年3月19日

【博士论文】基于深度学习的单目场景深度估计方法研究

【博士论文】基于深度学习的单目场景深度估计方法研究

专知会员服务

57+阅读 · 2021年12月8日

【CVPR2020】自监督的深度视觉测程与在线适应，Self-Supervised Deep Visual Odometry

【CVPR2020】自监督的深度视觉测程与在线适应，Self-Supervised Deep Visual Odometry

专知会员服务

32+阅读 · 2020年5月14日

【电子书】《计算机视觉中的多视图几何(第2版)》英文版，Multiple View Geometry in Computer Vision，附673页PDF

【电子书】《计算机视觉中的多视图几何(第2版)》英文版，Multiple View Geometry in Computer Vision，附673页PDF

专知会员服务

132+阅读 · 2020年3月22日

【深度估计| 2019最新综述】单目深度估计方法综述（Monocular Depth Estimation: A Survey）

专知会员服务

69+阅读 · 2019年11月23日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】基于自适应表征的高效视觉建模

《多域作战中融合网络、电子战与动能机动》

AI智能体时代大模型安全风险与攻防新挑战

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

相关资讯

NeurIPS2019|首篇单目无监督深度估计与视觉里程计，效果超越双目算法，已开源

NeurIPS2019|首篇单目无监督深度估计与视觉里程计，效果超越双目算法，已开源

极市平台

29+阅读 · 2019年9月4日

计算机视觉方向简介 | 视觉惯性里程计(VIO)

计算机视觉方向简介 | 视觉惯性里程计(VIO)

计算机视觉life

64+阅读 · 2019年6月16日

【泡泡图灵智库】LIMO: LiDAR-单目相机视觉里程计（arXiv）

【泡泡图灵智库】LIMO: LiDAR-单目相机视觉里程计（arXiv）

泡泡机器人SLAM

48+阅读 · 2019年5月14日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

计算机视觉方向简介 | 基于单目视觉的三维重建算法

计算机视觉方向简介 | 基于单目视觉的三维重建算法

计算机视觉life

32+阅读 · 2019年4月9日

【泡泡一分钟】LIMO：激光和单目相机融合的视觉里程计

【泡泡一分钟】LIMO：激光和单目相机融合的视觉里程计

泡泡机器人SLAM

13+阅读 · 2019年1月16日

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

商汤科技

14+阅读 · 2018年6月2日

深度相机原理揭秘--双目立体视觉

深度相机原理揭秘--双目立体视觉

计算机视觉life

10+阅读 · 2017年11月7日

视觉里程计：特征点法之全面梳理

视觉里程计：特征点法之全面梳理

计算机视觉life

12+阅读 · 2017年8月2日

视觉里程计：起源、优势、对比、应用

视觉里程计：起源、优势、对比、应用

计算机视觉life

18+阅读 · 2017年7月17日

相关论文

SalFormer360: a transformer-based saliency estimation model for 360-degree videos

Arxiv

0+阅读 · 2月4日

LEVIO: Lightweight Embedded Visual Inertial Odometry for Resource-Constrained Devices

Arxiv

0+阅读 · 2月3日

360Anything: Geometry-Free Lifting of Images and Videos to 360°

Arxiv

0+阅读 · 1月22日

Keyframe-Based Feed-Forward Visual Odometry

Arxiv

0+阅读 · 1月22日

PanoDreamer: Optimization-Based Single Image to 360 3D Scene With Diffusion

Arxiv

0+阅读 · 1月21日

Omni-LIVO: Robust RGB-Colored Multi-Camera Visual-Inertial-LiDAR Odometry via Photometric Migration and ESIKF Fusion

Arxiv

0+阅读 · 1月20日

EqVIO: An Equivariant Filter for Visual Inertial Odometry

Arxiv

0+阅读 · 1月16日

ORB-SfMLearner: ORB-Guided Self-supervised Visual Odometry with Selective Online Adaptation

Arxiv

0+阅读 · 1月11日

GeoSurDepth: Spatial Geometry-Consistent Self-Supervised Depth Estimation for Surround-View Cameras

Arxiv

0+阅读 · 1月9日

360DVO: Deep Visual Odometry for Monocular 360-Degree Camera

Arxiv

0+阅读 · 1月9日

相关基金

未知环境下基于单目视觉的移动平台目标跟踪方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

多目主动相机智能监控关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于特征学习的空间非合作目标单目视觉位姿测量研究

国家自然科学基金

2+阅读 · 2015年12月31日

“数据-知识”驱动的大区域高分辨率遥感影像多尺度分割并行计算方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于尺度集的高分辨率遥感影像多尺度分类

国家自然科学基金

0+阅读 · 2015年12月31日

深度学习框架下基于情境线索的视觉注意研究

国家自然科学基金

2+阅读 · 2015年12月31日

自由视点三维视频中纹理-深度图像联合建模及应用

国家自然科学基金

0+阅读 · 2015年12月31日

高数值孔径曲面复眼成像体系研究

国家自然科学基金

0+阅读 · 2014年12月31日

单光子高精度测距器件集成及卫星编队飞行应用

国家自然科学基金

0+阅读 · 2014年12月31日

基于人眼视觉特性与ASIFT的多尺度变换域视频水印算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员