Deep Learning-Powered Visual SLAM Aimed at Assisting Visually Impaired Navigation - 专知论文

会员服务 ·

0

SLAM · 视觉SLAM · RGB-D · 深度学习 · 运动模糊 ·

Deep Learning-Powered Visual SLAM Aimed at Assisting Visually Impaired Navigation

翻译：深度学习赋能的视觉SLAM技术及其在视障导航辅助中的应用

Marziyeh Bamdad,Hans-Peter Hutter,Alireza Darvishy

from arxiv, 8 pages, 7 figures, 4 tables. Published in the Proceedings of the 20th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications (VISIGRAPP 2025), VISAPP

Despite advancements in SLAM technologies, robust operation under challenging conditions such as low-texture, motion-blur, or challenging lighting remains an open challenge. Such conditions are common in applications such as assistive navigation for the visually impaired. These challenges undermine localization accuracy and tracking stability, reducing navigation reliability and safety. To overcome these limitations, we present SELM-SLAM3, a deep learning-enhanced visual SLAM framework that integrates SuperPoint and LightGlue for robust feature extraction and matching. We evaluated our framework using TUM RGB-D, ICL-NUIM, and TartanAir datasets, which feature diverse and challenging scenarios. SELM-SLAM3 outperforms conventional ORB-SLAM3 by an average of 87.84% and exceeds state-of-the-art RGB-D SLAM systems by 36.77%. Our framework demonstrates enhanced performance under challenging conditions, such as low-texture scenes and fast motion, providing a reliable platform for developing navigation aids for the visually impaired.

翻译：尽管SLAM技术取得了显著进展，但在低纹理、运动模糊或光照不良等挑战性条件下实现鲁棒运行仍是一个开放性问题。这类场景在视障辅助导航等应用中普遍存在，会严重削弱定位精度与跟踪稳定性，进而降低导航的可靠性与安全性。为突破这些局限，我们提出SELM-SLAM3——一种集成SuperPoint与LightGlue的深度学习增强型视觉SLAM框架，可实现稳健的特征提取与匹配。采用包含多样化挑战场景的TUM RGB-D、ICL-NUIM及TartanAir数据集进行评估，SELM-SLAM3较传统ORB-SLAM3平均性能提升87.84%，并超越现有最优RGB-D SLAM系统36.77%。该框架在低纹理场景与快速运动等复杂条件下表现出优异性能，为开发视障导航辅助设备提供了可靠平台。

0

相关内容

SLAM

即时定位与地图构建（SLAM或Simultaneouslocalizationandmapping）是这样一种技术：使得机器人和自动驾驶汽车等设备能在未知环境（没有先验知识的前提下）建立地图,或者在已知环境（已给出该地图的先验知识）中能更新地图,并保证这些设备能在同时追踪它们的当前位置。

《基于事件相机的模拟与神经网络处理在自主空中加油中的应用》最新100页

《基于事件相机的模拟与神经网络处理在自主空中加油中的应用》最新100页

专知会员服务

12+阅读 · 5月13日

自动驾驶领域中基于深度学习的激光雷达超分辨率技术综述

自动驾驶领域中基于深度学习的激光雷达超分辨率技术综述

专知会员服务

11+阅读 · 2月19日

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

专知会员服务

13+阅读 · 2月8日

《具备集体态势感知能力的深度强化学习智能体在超视距空战中的应用研究》最新文献

《具备集体态势感知能力的深度强化学习智能体在超视距空战中的应用研究》最新文献

专知会员服务

52+阅读 · 2025年9月23日

基于异构数据融合的SLAM 研究综述

基于异构数据融合的SLAM 研究综述

专知会员服务

28+阅读 · 2024年9月18日

基于深度学习的视觉目标检测技术综述

基于深度学习的视觉目标检测技术综述

专知会员服务

61+阅读 · 2022年6月22日

人工智能技术在军事领域的应用思考

人工智能技术在军事领域的应用思考

专知会员服务

270+阅读 · 2022年6月10日

【CVPR2020】视觉导航的神经拓扑SLAM，56页ppt，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，56页ppt，Neural Topological SLAM for Visual Navigation

专知会员服务

14+阅读 · 2020年6月18日

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

专知会员服务

52+阅读 · 2020年5月26日

视觉惯性SLAM综述

专知会员服务

87+阅读 · 2019年12月13日

综述 | 激光与视觉融合SLAM

综述 | 激光与视觉融合SLAM

计算机视觉life

18+阅读 · 2020年10月8日

ICRA 2019 论文速览 | 基于Deep Learning 的SLAM

ICRA 2019 论文速览 | 基于Deep Learning 的SLAM

计算机视觉life

41+阅读 · 2019年7月22日

如何从零开始系统化学习视觉SLAM？

如何从零开始系统化学习视觉SLAM？

计算机视觉life

21+阅读 · 2019年4月13日

高翔：谈谈语义SLAM/地图

高翔：谈谈语义SLAM/地图

计算机视觉life

37+阅读 · 2019年3月26日

深度学习在计算机视觉领域（包括图像，视频，3-D点云，深度图）的应用一览

深度学习在计算机视觉领域（包括图像，视频，3-D点云，深度图）的应用一览

极市平台

18+阅读 · 2019年3月21日

深度学习在自动驾驶感知领域的应用

深度学习在自动驾驶感知领域的应用

AI100

11+阅读 · 2019年3月6日

激光slam导航方案凭什么更被各大厂家青睐？

激光slam导航方案凭什么更被各大厂家青睐？

计算机视觉life

15+阅读 · 2019年1月25日

视觉SLAM技术综述

视觉SLAM技术综述

计算机视觉life

27+阅读 · 2019年1月4日

【泡泡图灵智库】DS-SLAM:一种面向动态环境的语义视觉SLAM(arXiv)

【泡泡图灵智库】DS-SLAM:一种面向动态环境的语义视觉SLAM(arXiv)

泡泡机器人SLAM

27+阅读 · 2018年12月14日

从零开始一起学习SLAM | SLAM有什么用？

从零开始一起学习SLAM | SLAM有什么用？

计算机视觉life

18+阅读 · 2018年9月17日

基于深度学习的联合作战态势智能辅助分析研究

国家自然科学基金

338+阅读 · 2017年12月31日

基于地形辅助的深海长航时ARV自主导航技术研究

国家自然科学基金

15+阅读 · 2017年12月31日

临近空间高超声速飞行器低复杂度再入姿态控制器设计研究

国家自然科学基金

1+阅读 · 2015年12月31日

仿生天空偏振光自主定位导航传感器关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的高频地波雷达特定目标跟踪方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

2D/3D视觉信息融合仿生SLAM关键问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

复杂低空飞行中机会信号导航的信号优选及融合定位方法研究

国家自然科学基金

9+阅读 · 2015年12月31日

无人机自主导航中LiDAR点云与图像特征提取与配准方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于视频图像处理的神经导航空间配准方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向多源遥感图像的深度学习技术与系统研究

国家自然科学基金

17+阅读 · 2014年12月31日

DynoSLAM: Dynamic SLAM with Generative Graph Neural Networks for Real-World Social Navigation

DynoSLAM: Dynamic SLAM with Generative Graph Neural Networks for Real-World Social Navigation

Arxiv

0+阅读 · 5月4日

Three-Step Nav: A Hierarchical Global-Local Planner for Zero-Shot Vision-and-Language Navigation

Arxiv

0+阅读 · 4月29日

Efficiently Closing Loops in LiDAR-Based SLAM Using Point Cloud Density Maps

Arxiv

0+阅读 · 4月22日

Enhancing Glass Surface Reconstruction via Depth Prior for Robot Navigation

Arxiv

0+阅读 · 4月20日

Dual Pose-Graph Semantic Localization for Vision-Based Autonomous Drone Racing

Arxiv

0+阅读 · 4月16日

RMGS-SLAM: Real-time Multi-sensor Gaussian Splatting SLAM

Arxiv

0+阅读 · 4月14日

VULCAN: Vision-Language-Model Enhanced Multi-Agent Cooperative Navigation for Indoor Fire-Disaster Response

Arxiv

0+阅读 · 4月14日

SING3R-SLAM: Submap-based Indoor Monocular Gaussian SLAM with 3D Reconstruction Priors

Arxiv

0+阅读 · 4月3日

Compact Keyframe-Optimized Multi-Agent Gaussian Splatting SLAM

Arxiv

0+阅读 · 4月1日

Cross-Modal Reinforcement Learning for Navigation with Degraded Depth Measurements

Arxiv

0+阅读 · 3月23日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

1+阅读 · 今天14:45

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

1+阅读 · 今天14:43

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

3+阅读 · 今天14:31

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 今天14:20

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

2+阅读 · 今天14:11

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

3+阅读 · 今天14:07

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 今天14:03

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 今天13:59

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

《基于事件相机的模拟与神经网络处理在自主空中加油中的应用》最新100页

《基于事件相机的模拟与神经网络处理在自主空中加油中的应用》最新100页

专知会员服务

12+阅读 · 5月13日

自动驾驶领域中基于深度学习的激光雷达超分辨率技术综述

自动驾驶领域中基于深度学习的激光雷达超分辨率技术综述

专知会员服务

11+阅读 · 2月19日

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

专知会员服务

13+阅读 · 2月8日

《具备集体态势感知能力的深度强化学习智能体在超视距空战中的应用研究》最新文献

《具备集体态势感知能力的深度强化学习智能体在超视距空战中的应用研究》最新文献

专知会员服务

52+阅读 · 2025年9月23日

基于异构数据融合的SLAM 研究综述

基于异构数据融合的SLAM 研究综述

专知会员服务

28+阅读 · 2024年9月18日

基于深度学习的视觉目标检测技术综述

基于深度学习的视觉目标检测技术综述

专知会员服务

61+阅读 · 2022年6月22日

人工智能技术在军事领域的应用思考

人工智能技术在军事领域的应用思考

专知会员服务

270+阅读 · 2022年6月10日

【CVPR2020】视觉导航的神经拓扑SLAM，56页ppt，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，56页ppt，Neural Topological SLAM for Visual Navigation

专知会员服务

14+阅读 · 2020年6月18日

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

专知会员服务

52+阅读 · 2020年5月26日

视觉惯性SLAM综述

专知会员服务

87+阅读 · 2019年12月13日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

综述 | 激光与视觉融合SLAM

综述 | 激光与视觉融合SLAM

计算机视觉life

18+阅读 · 2020年10月8日

ICRA 2019 论文速览 | 基于Deep Learning 的SLAM

ICRA 2019 论文速览 | 基于Deep Learning 的SLAM

计算机视觉life

41+阅读 · 2019年7月22日

如何从零开始系统化学习视觉SLAM？

如何从零开始系统化学习视觉SLAM？

计算机视觉life

21+阅读 · 2019年4月13日

高翔：谈谈语义SLAM/地图

高翔：谈谈语义SLAM/地图

计算机视觉life

37+阅读 · 2019年3月26日

深度学习在计算机视觉领域（包括图像，视频，3-D点云，深度图）的应用一览

深度学习在计算机视觉领域（包括图像，视频，3-D点云，深度图）的应用一览

极市平台

18+阅读 · 2019年3月21日

深度学习在自动驾驶感知领域的应用

深度学习在自动驾驶感知领域的应用

AI100

11+阅读 · 2019年3月6日

激光slam导航方案凭什么更被各大厂家青睐？

激光slam导航方案凭什么更被各大厂家青睐？

计算机视觉life

15+阅读 · 2019年1月25日

视觉SLAM技术综述

视觉SLAM技术综述

计算机视觉life

27+阅读 · 2019年1月4日

【泡泡图灵智库】DS-SLAM:一种面向动态环境的语义视觉SLAM(arXiv)

【泡泡图灵智库】DS-SLAM:一种面向动态环境的语义视觉SLAM(arXiv)

泡泡机器人SLAM

27+阅读 · 2018年12月14日

从零开始一起学习SLAM | SLAM有什么用？

从零开始一起学习SLAM | SLAM有什么用？

计算机视觉life

18+阅读 · 2018年9月17日

相关论文

DynoSLAM: Dynamic SLAM with Generative Graph Neural Networks for Real-World Social Navigation

DynoSLAM: Dynamic SLAM with Generative Graph Neural Networks for Real-World Social Navigation

Arxiv

0+阅读 · 5月4日

Three-Step Nav: A Hierarchical Global-Local Planner for Zero-Shot Vision-and-Language Navigation

Arxiv

0+阅读 · 4月29日

Efficiently Closing Loops in LiDAR-Based SLAM Using Point Cloud Density Maps

Arxiv

0+阅读 · 4月22日

Enhancing Glass Surface Reconstruction via Depth Prior for Robot Navigation

Arxiv

0+阅读 · 4月20日

Dual Pose-Graph Semantic Localization for Vision-Based Autonomous Drone Racing

Arxiv

0+阅读 · 4月16日

RMGS-SLAM: Real-time Multi-sensor Gaussian Splatting SLAM

Arxiv

0+阅读 · 4月14日

VULCAN: Vision-Language-Model Enhanced Multi-Agent Cooperative Navigation for Indoor Fire-Disaster Response

Arxiv

0+阅读 · 4月14日

SING3R-SLAM: Submap-based Indoor Monocular Gaussian SLAM with 3D Reconstruction Priors

Arxiv

0+阅读 · 4月3日

Compact Keyframe-Optimized Multi-Agent Gaussian Splatting SLAM

Arxiv

0+阅读 · 4月1日

Cross-Modal Reinforcement Learning for Navigation with Degraded Depth Measurements

Arxiv

0+阅读 · 3月23日

相关基金

基于深度学习的联合作战态势智能辅助分析研究

国家自然科学基金

338+阅读 · 2017年12月31日

基于地形辅助的深海长航时ARV自主导航技术研究

国家自然科学基金

15+阅读 · 2017年12月31日

临近空间高超声速飞行器低复杂度再入姿态控制器设计研究

国家自然科学基金

1+阅读 · 2015年12月31日

仿生天空偏振光自主定位导航传感器关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的高频地波雷达特定目标跟踪方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

2D/3D视觉信息融合仿生SLAM关键问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

复杂低空飞行中机会信号导航的信号优选及融合定位方法研究

国家自然科学基金

9+阅读 · 2015年12月31日

无人机自主导航中LiDAR点云与图像特征提取与配准方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于视频图像处理的神经导航空间配准方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向多源遥感图像的深度学习技术与系统研究

国家自然科学基金

17+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员