Sem-NaVAE：基于生成轨迹先验的语义引导室外无地图导航 (Sem-NaVAE: Semantically-Guided Outdoor Mapless Navigation via Generative Trajectory Priors) - 专知论文

会员服务 ·

0

搜索引擎营销 · 分割 · 系统 · 变分 · 变分自编码 ·

Sem-NaVAE: Semantically-Guided Outdoor Mapless Navigation via Generative Trajectory Priors

翻译：Sem-NaVAE：基于生成轨迹先验的语义引导室外无地图导航

Gonzalo Olguin,Javier Ruiz-del-Solar

from arxiv, 8 pages, 5 figures

This work presents a mapless global navigation approach for outdoor applications. It combines the exploratory capacity of conditional variational autoencoders (CVAEs) to generate trajectories and the semantic segmentation capabilities of a lightweight visual language model (VLM) to select the trajectory to execute. Open-vocabulary segmentation is used to score and select the generated trajectories based on natural language, and a state-of-the-art local planner executes velocity commands. One of the key features of the proposed approach is its ability to generate a large variability of trajectories and to select them and navigate in real-time. The approach was validated through real-world outdoor navigation experiments, achieving superior performance compared to state-of-the-art methods. A video showing an experimental run of the system can be found in https://www.youtube.com/watch?v=i3R5ey5O2yk.

翻译：本研究提出了一种适用于室外应用的无地图全局导航方法。该方法结合了条件变分自编码器（CVAE）生成轨迹的探索能力，以及轻量级视觉语言模型（VLM）选择待执行轨迹的语义分割能力。系统利用开放词汇分割，基于自然语言对生成的轨迹进行评分与选择，并由一个先进的局部规划器执行速度指令。所提方法的关键特性之一在于其能够生成高度多样化的轨迹，并实时进行选择与导航。该方法通过真实室外导航实验进行了验证，与现有先进方法相比，表现出更优越的性能。展示系统实验运行过程的视频可在 https://www.youtube.com/watch?v=i3R5ey5O2yk 查看。

0

相关内容

搜索引擎营销

搜索引擎营销

SEM 是 Search Engine Marketing 的缩写，中文意思是搜索引擎营销。SEM 是一种新的网络营销形式。SEM 所做的就是全面而有效的利用搜索引擎来进行网络营销和推广。SEM 追求最高的性价比，以最小的投入，获最大的来自搜索引擎的访问量，并产生商业价值。

《战场GPS拒止环境下基于地标定位的安全路径导航》

《战场GPS拒止环境下基于地标定位的安全路径导航》

专知会员服务

18+阅读 · 2025年5月22日

《利用卷积神经网络实现无人地面战车在 GPS 信号屏蔽环境中的自主航行》最新135页

《利用卷积神经网络实现无人地面战车在 GPS 信号屏蔽环境中的自主航行》最新135页

专知会员服务

38+阅读 · 2024年11月11日

《用于导航的磁异常绘图（含代码）》最新570页

《用于导航的磁异常绘图（含代码）》最新570页

专知会员服务

32+阅读 · 2024年11月8日

RSS 2024 | NaVid：视觉语言导航大模型

RSS 2024 | NaVid：视觉语言导航大模型

专知会员服务

34+阅读 · 2024年6月9日

【AAAI2024】VLN-VIDEO: 利用驾驶视频进行户外视觉语言导航

【AAAI2024】VLN-VIDEO: 利用驾驶视频进行户外视觉语言导航

专知会员服务

10+阅读 · 2024年2月10日

《用于无人地面车辆自主导航和测绘的小尺寸、重量、功率和成本 (SWaP-C) 有效载荷》美陆军2023最新60页报告

《用于无人地面车辆自主导航和测绘的小尺寸、重量、功率和成本 (SWaP-C) 有效载荷》美陆军2023最新60页报告

专知会员服务

45+阅读 · 2023年11月10日

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

专知会员服务

49+阅读 · 2022年12月8日

【视觉和语言导航:任务、方法和未来方向的综述】Vision-and-Language Navigation: A Survey of Tasks, Methods, and Future Directions

【视觉和语言导航:任务、方法和未来方向的综述】Vision-and-Language Navigation: A Survey of Tasks, Methods, and Future Directions

专知会员服务

37+阅读 · 2022年3月25日

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

专知会员服务

52+阅读 · 2020年5月26日

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

123+阅读 · 2020年5月18日

武大提出FarSeg：遥感图像分割新网络，解决前景背景不平衡问题 | CVPR 2020

武大提出FarSeg：遥感图像分割新网络，解决前景背景不平衡问题 | CVPR 2020

CVer

17+阅读 · 2020年7月10日

地平线提出AFDet：首个Anchor free、NMS free的3D目标检测算法

地平线提出AFDet：首个Anchor free、NMS free的3D目标检测算法

CVer

10+阅读 · 2020年6月27日

概率/机器学习/文本挖掘/NLP技术学习路线图，值得收藏，附下载

概率/机器学习/文本挖掘/NLP技术学习路线图，值得收藏，附下载

专知

29+阅读 · 2019年9月25日

LinkTrack UWB高精度定位系统首发，一套可以随时搭建的"小卫星"定位系统，集定位|导航|授时|通信于一体

LinkTrack UWB高精度定位系统首发，一套可以随时搭建的"小卫星"定位系统，集定位|导航|授时|通信于一体

无人机

10+阅读 · 2019年7月18日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

云头条

18+阅读 · 2019年4月23日

【CVPR Oral】视频跟踪新思路，完全无需手工标注

【CVPR Oral】视频跟踪新思路，完全无需手工标注

新智元

19+阅读 · 2019年4月21日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

极市平台

14+阅读 · 2018年3月21日

基于地形辅助的深海长航时ARV自主导航技术研究

国家自然科学基金

14+阅读 · 2017年12月31日

面向空中智能交通的大规模飞行航迹处理与分析方法研究

国家自然科学基金

8+阅读 · 2015年12月31日

高动态环境下的多普勒测速脉冲星导航方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于三维激光测距的移动机器人室外环境语义地图构建

国家自然科学基金

2+阅读 · 2015年12月31日

面向多用户行为的无线识别关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

仿动物大脑网格细胞神经定位机制的同步定位与地图构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

几何/拓扑混合空间中的仿生导航方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

三维复杂地形环境下基于无人机追逃问题的航路规划方法研究

国家自然科学基金

26+阅读 · 2015年12月31日

未知环境中移动机器人探索式路径规划方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

形状先验和数据驱动的高分辨遥感影像目标提取

国家自然科学基金

3+阅读 · 2014年12月31日

LAMP: Implicit Language Map for Robot Navigation

Arxiv

0+阅读 · 2月12日

Hydra-Nav: Object Navigation via Adaptive Dual-Process Reasoning

Arxiv

0+阅读 · 2月10日

NavDreamer: Video Models as Zero-Shot 3D Navigators

Arxiv

0+阅读 · 2月10日

AutoFly: Vision-Language-Action Model for UAV Autonomous Navigation in the Wild

Arxiv

0+阅读 · 2月10日

Bridging the Indoor-Outdoor Gap: Vision-Centric Instruction-Guided Embodied Navigation for the Last Meters

Arxiv

0+阅读 · 2月6日

SEMNAV: Enhancing Visual Semantic Navigation in Robotics through Semantic Segmentation

Arxiv

0+阅读 · 2月3日

MapDream: Task-Driven Map Learning for Vision-Language Navigation

Arxiv

0+阅读 · 2月3日

USS-Nav: Unified Spatio-Semantic Scene Graph for Lightweight UAV Zero-Shot Object Navigation

Arxiv

0+阅读 · 2月3日

AirHunt: Bridging VLM Semantics and Continuous Planning for Efficient Aerial Object Navigation

Arxiv

0+阅读 · 1月19日

UrbanNav: Learning Language-Guided Urban Navigation from Web-Scale Human Trajectories

Arxiv

0+阅读 · 1月15日

VIP会员

文章信息

相关主题

搜索引擎营销

变分自编码

相关VIP内容

《战场GPS拒止环境下基于地标定位的安全路径导航》

《战场GPS拒止环境下基于地标定位的安全路径导航》

专知会员服务

18+阅读 · 2025年5月22日

《利用卷积神经网络实现无人地面战车在 GPS 信号屏蔽环境中的自主航行》最新135页

《利用卷积神经网络实现无人地面战车在 GPS 信号屏蔽环境中的自主航行》最新135页

专知会员服务

38+阅读 · 2024年11月11日

《用于导航的磁异常绘图（含代码）》最新570页

《用于导航的磁异常绘图（含代码）》最新570页

专知会员服务

32+阅读 · 2024年11月8日

RSS 2024 | NaVid：视觉语言导航大模型

RSS 2024 | NaVid：视觉语言导航大模型

专知会员服务

34+阅读 · 2024年6月9日

【AAAI2024】VLN-VIDEO: 利用驾驶视频进行户外视觉语言导航

【AAAI2024】VLN-VIDEO: 利用驾驶视频进行户外视觉语言导航

专知会员服务

10+阅读 · 2024年2月10日

《用于无人地面车辆自主导航和测绘的小尺寸、重量、功率和成本 (SWaP-C) 有效载荷》美陆军2023最新60页报告

《用于无人地面车辆自主导航和测绘的小尺寸、重量、功率和成本 (SWaP-C) 有效载荷》美陆军2023最新60页报告

专知会员服务

45+阅读 · 2023年11月10日

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

【CMU博士论文】非结构化环境中的多模态导航学习，177页pdf

专知会员服务

49+阅读 · 2022年12月8日

【视觉和语言导航:任务、方法和未来方向的综述】Vision-and-Language Navigation: A Survey of Tasks, Methods, and Future Directions

【视觉和语言导航:任务、方法和未来方向的综述】Vision-and-Language Navigation: A Survey of Tasks, Methods, and Future Directions

专知会员服务

37+阅读 · 2022年3月25日

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

专知会员服务

52+阅读 · 2020年5月26日

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

【牛津大学博士论文】基于强化学习的无地图机器人导航，Reinforcement Learning Based MRN

专知会员服务

123+阅读 · 2020年5月18日

热门VIP内容

开通专知VIP会员享更多权益服务

《可信人工智能赋能系统的支柱》

《从经典神经网络到不确定性下的拓扑神经网络：军事应用》2026最新40页报告

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

《人工智能：对战略与力量的影响》slides

相关资讯

武大提出FarSeg：遥感图像分割新网络，解决前景背景不平衡问题 | CVPR 2020

武大提出FarSeg：遥感图像分割新网络，解决前景背景不平衡问题 | CVPR 2020

CVer

17+阅读 · 2020年7月10日

地平线提出AFDet：首个Anchor free、NMS free的3D目标检测算法

地平线提出AFDet：首个Anchor free、NMS free的3D目标检测算法

CVer

10+阅读 · 2020年6月27日

概率/机器学习/文本挖掘/NLP技术学习路线图，值得收藏，附下载

概率/机器学习/文本挖掘/NLP技术学习路线图，值得收藏，附下载

专知

29+阅读 · 2019年9月25日

LinkTrack UWB高精度定位系统首发，一套可以随时搭建的"小卫星"定位系统，集定位|导航|授时|通信于一体

LinkTrack UWB高精度定位系统首发，一套可以随时搭建的"小卫星"定位系统，集定位|导航|授时|通信于一体

无人机

10+阅读 · 2019年7月18日

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

中科院自动化所提出 BIFT 模型：面向自然语言生成，同步双向推断

AI科技评论

12+阅读 · 2019年5月2日

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

无需建模：谷歌SpecAugment即可获得最先进的语音识别性能

云头条

18+阅读 · 2019年4月23日

【CVPR Oral】视频跟踪新思路，完全无需手工标注

【CVPR Oral】视频跟踪新思路，完全无需手工标注

新智元

19+阅读 · 2019年4月21日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

极市平台

14+阅读 · 2018年3月21日

相关论文

LAMP: Implicit Language Map for Robot Navigation

Arxiv

0+阅读 · 2月12日

Hydra-Nav: Object Navigation via Adaptive Dual-Process Reasoning

Arxiv

0+阅读 · 2月10日

NavDreamer: Video Models as Zero-Shot 3D Navigators

Arxiv

0+阅读 · 2月10日

AutoFly: Vision-Language-Action Model for UAV Autonomous Navigation in the Wild

Arxiv

0+阅读 · 2月10日

Bridging the Indoor-Outdoor Gap: Vision-Centric Instruction-Guided Embodied Navigation for the Last Meters

Arxiv

0+阅读 · 2月6日

SEMNAV: Enhancing Visual Semantic Navigation in Robotics through Semantic Segmentation

Arxiv

0+阅读 · 2月3日

MapDream: Task-Driven Map Learning for Vision-Language Navigation

Arxiv

0+阅读 · 2月3日

USS-Nav: Unified Spatio-Semantic Scene Graph for Lightweight UAV Zero-Shot Object Navigation

Arxiv

0+阅读 · 2月3日

AirHunt: Bridging VLM Semantics and Continuous Planning for Efficient Aerial Object Navigation

Arxiv

0+阅读 · 1月19日

UrbanNav: Learning Language-Guided Urban Navigation from Web-Scale Human Trajectories

Arxiv

0+阅读 · 1月15日

相关基金

基于地形辅助的深海长航时ARV自主导航技术研究

国家自然科学基金

14+阅读 · 2017年12月31日

面向空中智能交通的大规模飞行航迹处理与分析方法研究

国家自然科学基金

8+阅读 · 2015年12月31日

高动态环境下的多普勒测速脉冲星导航方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于三维激光测距的移动机器人室外环境语义地图构建

国家自然科学基金

2+阅读 · 2015年12月31日

面向多用户行为的无线识别关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

仿动物大脑网格细胞神经定位机制的同步定位与地图构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

几何/拓扑混合空间中的仿生导航方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

三维复杂地形环境下基于无人机追逃问题的航路规划方法研究

国家自然科学基金

26+阅读 · 2015年12月31日

未知环境中移动机器人探索式路径规划方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

形状先验和数据驱动的高分辨遥感影像目标提取

国家自然科学基金

3+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员