What does really matter in image goal navigation? - 专知论文

会员服务 ·

0

相对位姿估计 · 位姿估计 · 自由空间 · CVPR 2022 · 端到端 ·

What does really matter in image goal navigation?

翻译：图像目标导航中真正重要的是什么？

Gianluca Monaci,Philippe Weinzaepfel,Christian Wolf

Image goal navigation requires two different skills: firstly, core navigation skills, including the detection of free space and obstacles, and taking decisions based on an internal representation; and secondly, computing directional information by comparing visual observations to the goal image. Current state-of-the-art methods either rely on dedicated image-matching, or pre-training of computer vision modules on relative pose estimation. In this paper, we study whether this task can be efficiently solved with end-to-end training of full agents with RL, as has been claimed by recent work. A positive answer would have impact beyond Embodied AI and allow training of relative pose estimation from reward for navigation alone. In this large experimental study we investigate the effect of architectural choices like late fusion, channel stacking, space-to-depth projections and cross-attention, and their role in the emergence of relative pose estimators from navigation training. We show that the success of recent methods is influenced up to a certain extent by simulator settings, leading to shortcuts in simulation. However, we also show that these capabilities can be transferred to more realistic setting, up to some extent. We also find evidence for correlations between navigation performance and probed (emerging) relative pose estimation performance, an important sub skill.

翻译：图像目标导航需要两种不同的技能：首先是核心导航技能，包括自由空间和障碍物的检测，以及基于内部表征进行决策；其次是通过将视觉观测与目标图像进行比较来计算方向信息。当前最先进的方法要么依赖于专用的图像匹配，要么依赖于在相对位姿估计任务上对计算机视觉模块进行预训练。在本文中，我们研究该任务是否能够像近期工作所声称的那样，通过对完整智能体进行端到端的强化学习训练来高效解决。一个肯定的答案将产生超越具身人工智能的影响，并允许仅从导航奖励中训练相对位姿估计。在这项大规模实验研究中，我们调查了诸如晚期融合、通道堆叠、空间到深度投影和交叉注意力等架构选择的影响，以及它们在导航训练中促使相对位姿估计器涌现的作用。我们表明，近期方法的成功在一定程度上受到模拟器设置的影响，导致了模拟中的捷径。然而，我们也证明这些能力可以在一定程度上迁移到更现实的设置中。我们还发现了导航性能与被探测（涌现的）相对位姿估计性能之间存在相关性的证据，后者是一项重要的子技能。

0

相关内容

相对位姿估计

相对位姿估计

基于深度学习的图像匹配:方法、应用与挑战

基于深度学习的图像匹配:方法、应用与挑战

专知会员服务

25+阅读 · 2024年7月19日

基于深度学习的视觉目标检测技术综述

基于深度学习的视觉目标检测技术综述

专知会员服务

62+阅读 · 2022年6月22日

基于深度学习的图像目标检测算法综述

基于深度学习的图像目标检测算法综述

专知会员服务

101+阅读 · 2022年4月15日

【视觉和语言导航:任务、方法和未来方向的综述】Vision-and-Language Navigation: A Survey of Tasks, Methods, and Future Directions

【视觉和语言导航:任务、方法和未来方向的综述】Vision-and-Language Navigation: A Survey of Tasks, Methods, and Future Directions

专知会员服务

38+阅读 · 2022年3月25日

自动驾驶渐行渐近，卫惯导航大有可为

专知会员服务

39+阅读 · 2021年9月7日

光学遥感图像目标检测算法综述

专知会员服务

75+阅读 · 2021年3月23日

【视频目标检测与跟踪：综述论文】Video Object Segmentation and Tracking: A Survey

专知会员服务

66+阅读 · 2020年6月4日

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

专知会员服务

52+阅读 · 2020年5月26日

【目标检测 | 2019最新综述】目标检测的最新进展，附40页PDF，Recent Advances in Deep Learning for Object Detection

【目标检测 | 2019最新综述】目标检测的最新进展，附40页PDF，Recent Advances in Deep Learning for Object Detection

专知会员服务

86+阅读 · 2019年11月15日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知会员服务

80+阅读 · 2019年10月12日

自动驾驶高精度定位如何在复杂环境进行

自动驾驶高精度定位如何在复杂环境进行

智能交通技术

18+阅读 · 2019年9月27日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

最全综述 | 图像目标检测

最全综述 | 图像目标检测

计算机视觉life

31+阅读 · 2019年6月24日

深度学习应用在图像匹配的效果如何？

深度学习应用在图像匹配的效果如何？

中国图象图形学报

10+阅读 · 2019年6月11日

【深度学习】增加检测类别？这是一份目标检测的一般指南

【深度学习】增加检测类别？这是一份目标检测的一般指南

产业智能官

13+阅读 · 2018年5月27日

深度学习目标检测从入门到精通：第一篇

深度学习目标检测从入门到精通：第一篇

专知

43+阅读 · 2018年1月24日

计算机视觉中，有哪些比较好的目标跟踪算法？（下）

计算机视觉中，有哪些比较好的目标跟踪算法？（下）

AI研习社

17+阅读 · 2017年11月23日

计算机视觉中，有哪些比较好的目标跟踪算法？（上）

计算机视觉中，有哪些比较好的目标跟踪算法？（上）

AI研习社

15+阅读 · 2017年11月22日

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

炼数成金订阅号

11+阅读 · 2017年9月20日

开发 | 计算机视觉中，究竟有哪些好用的目标跟踪算法（上）

开发 | 计算机视觉中，究竟有哪些好用的目标跟踪算法（上）

AI科技评论

12+阅读 · 2017年9月17日

基于共性视觉特征与反馈机制的SAR图像目标检测方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于视觉特性的目标检测算法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于对象模型与多点空间统计的高分辨率遥感影像分类策略

国家自然科学基金

4+阅读 · 2015年12月31日

基于语义模型的高分辨率卫星遥感图像人造目标检测方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

有向图谱理论在图像匹配中应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

图像分割中若干图论问题的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于视频图像处理的神经导航空间配准方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

解决地图要素空间冲突的智能化协同模型和算法

国家自然科学基金

6+阅读 · 2014年12月31日

基于视觉注意与眼动跟踪的地图认知计算模型与方法研究

国家自然科学基金

6+阅读 · 2014年12月31日

P$^{3}$Nav: End-to-End Perception, Prediction and Planning for Vision-and-Language Navigation

Arxiv

0+阅读 · 3月18日

GOT-Edit: Geometry-Aware Generic Object Tracking via Online Model Editing

Arxiv

0+阅读 · 2月24日

Learning to Retrieve Navigable Candidates for Efficient Vision-and-Language Navigation

Arxiv

0+阅读 · 2月17日

SignScene: Visual Sign Grounding for Mapless Navigation

Arxiv

0+阅读 · 2月13日

Hydra-Nav: Object Navigation via Adaptive Dual-Process Reasoning

Arxiv

0+阅读 · 2月10日

VISOR: VIsual Spatial Object Reasoning for Language-driven Object Navigation

Arxiv

0+阅读 · 2月7日

3D Object Detection for Autonomous Driving: A Survey

Arxiv

0+阅读 · 2月6日

User-Centric Object Navigation: A Benchmark with Integrated User Habits for Personalized Embodied Object Search

Arxiv

0+阅读 · 2月6日

From Vision to Decision: Neuromorphic Control for Autonomous Navigation and Tracking

Arxiv

0+阅读 · 2月5日

What does really matter in image goal navigation?

Arxiv

0+阅读 · 2月2日

VIP会员

文章信息

相关主题

相对位姿估计

最新内容

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

2+阅读 · 今天2:42

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

1+阅读 · 今天2:37

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

3+阅读 · 今天2:23

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

5+阅读 · 今天2:21

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

2+阅读 · 今天1:46

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

5+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

4+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

4+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

8+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

8+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

7+阅读 · 7月31日

相关VIP内容

基于深度学习的图像匹配:方法、应用与挑战

基于深度学习的图像匹配:方法、应用与挑战

专知会员服务

25+阅读 · 2024年7月19日

基于深度学习的视觉目标检测技术综述

基于深度学习的视觉目标检测技术综述

专知会员服务

62+阅读 · 2022年6月22日

基于深度学习的图像目标检测算法综述

基于深度学习的图像目标检测算法综述

专知会员服务

101+阅读 · 2022年4月15日

【视觉和语言导航:任务、方法和未来方向的综述】Vision-and-Language Navigation: A Survey of Tasks, Methods, and Future Directions

【视觉和语言导航:任务、方法和未来方向的综述】Vision-and-Language Navigation: A Survey of Tasks, Methods, and Future Directions

专知会员服务

38+阅读 · 2022年3月25日

自动驾驶渐行渐近，卫惯导航大有可为

专知会员服务

39+阅读 · 2021年9月7日

光学遥感图像目标检测算法综述

专知会员服务

75+阅读 · 2021年3月23日

【视频目标检测与跟踪：综述论文】Video Object Segmentation and Tracking: A Survey

专知会员服务

66+阅读 · 2020年6月4日

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

专知会员服务

52+阅读 · 2020年5月26日

【目标检测 | 2019最新综述】目标检测的最新进展，附40页PDF，Recent Advances in Deep Learning for Object Detection

【目标检测 | 2019最新综述】目标检测的最新进展，附40页PDF，Recent Advances in Deep Learning for Object Detection

专知会员服务

86+阅读 · 2019年11月15日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知会员服务

80+阅读 · 2019年10月12日

热门VIP内容

开通专知VIP会员享更多权益服务

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

从采集到决策：美军视角下的战术情报范式重构

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

相关资讯

自动驾驶高精度定位如何在复杂环境进行

自动驾驶高精度定位如何在复杂环境进行

智能交通技术

18+阅读 · 2019年9月27日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

最全综述 | 图像目标检测

最全综述 | 图像目标检测

计算机视觉life

31+阅读 · 2019年6月24日

深度学习应用在图像匹配的效果如何？

深度学习应用在图像匹配的效果如何？

中国图象图形学报

10+阅读 · 2019年6月11日

【深度学习】增加检测类别？这是一份目标检测的一般指南

【深度学习】增加检测类别？这是一份目标检测的一般指南

产业智能官

13+阅读 · 2018年5月27日

深度学习目标检测从入门到精通：第一篇

深度学习目标检测从入门到精通：第一篇

专知

43+阅读 · 2018年1月24日

计算机视觉中，有哪些比较好的目标跟踪算法？（下）

计算机视觉中，有哪些比较好的目标跟踪算法？（下）

AI研习社

17+阅读 · 2017年11月23日

计算机视觉中，有哪些比较好的目标跟踪算法？（上）

计算机视觉中，有哪些比较好的目标跟踪算法？（上）

AI研习社

15+阅读 · 2017年11月22日

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

炼数成金订阅号

11+阅读 · 2017年9月20日

开发 | 计算机视觉中，究竟有哪些好用的目标跟踪算法（上）

开发 | 计算机视觉中，究竟有哪些好用的目标跟踪算法（上）

AI科技评论

12+阅读 · 2017年9月17日

相关论文

P$^{3}$Nav: End-to-End Perception, Prediction and Planning for Vision-and-Language Navigation

Arxiv

0+阅读 · 3月18日

GOT-Edit: Geometry-Aware Generic Object Tracking via Online Model Editing

Arxiv

0+阅读 · 2月24日

Learning to Retrieve Navigable Candidates for Efficient Vision-and-Language Navigation

Arxiv

0+阅读 · 2月17日

SignScene: Visual Sign Grounding for Mapless Navigation

Arxiv

0+阅读 · 2月13日

Hydra-Nav: Object Navigation via Adaptive Dual-Process Reasoning

Arxiv

0+阅读 · 2月10日

VISOR: VIsual Spatial Object Reasoning for Language-driven Object Navigation

Arxiv

0+阅读 · 2月7日

3D Object Detection for Autonomous Driving: A Survey

Arxiv

0+阅读 · 2月6日

User-Centric Object Navigation: A Benchmark with Integrated User Habits for Personalized Embodied Object Search

Arxiv

0+阅读 · 2月6日

From Vision to Decision: Neuromorphic Control for Autonomous Navigation and Tracking

Arxiv

0+阅读 · 2月5日

What does really matter in image goal navigation?

Arxiv

0+阅读 · 2月2日

相关基金

基于共性视觉特征与反馈机制的SAR图像目标检测方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于视觉特性的目标检测算法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于对象模型与多点空间统计的高分辨率遥感影像分类策略

国家自然科学基金

4+阅读 · 2015年12月31日

基于语义模型的高分辨率卫星遥感图像人造目标检测方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

有向图谱理论在图像匹配中应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

图像分割中若干图论问题的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于视频图像处理的神经导航空间配准方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

解决地图要素空间冲突的智能化协同模型和算法

国家自然科学基金

6+阅读 · 2014年12月31日

基于视觉注意与眼动跟踪的地图认知计算模型与方法研究

国家自然科学基金

6+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员