AirNav: A Large-Scale Real-World UAV Vision-and-Language Navigation Dataset with Natural and Diverse Instructions - 专知论文

会员服务 ·

0

数据集 · 包含 · 微调 · 无人机 · 合成 ·

AirNav: A Large-Scale Real-World UAV Vision-and-Language Navigation Dataset with Natural and Diverse Instructions

翻译：AirNav：一个大规模真实世界无人机视觉与语言导航数据集，包含自然且多样化的指令

Hengxing Cai,Yijie Rao,Ligang Huang,Zanyang Zhong,Jinhan Dong,Jingjun Tan,Wenhao Lu,Renxin Zhong

Existing Unmanned Aerial Vehicle (UAV) Vision-Language Navigation (VLN) datasets face issues such as dependence on virtual environments, lack of naturalness in instructions, and limited scale. To address these challenges, we propose AirNav, a large-scale UAV VLN benchmark constructed from real urban aerial data, rather than synthetic environments, with natural and diverse instructions. Additionally, we introduce the AirVLN-R1, which combines Supervised Fine-Tuning and Reinforcement Fine-Tuning to enhance performance and generalization. The feasibility of the model is preliminarily evaluated through real-world tests. Our dataset and code are publicly available.

翻译：现有无人机视觉与语言导航数据集存在依赖虚拟环境、指令缺乏自然性以及规模有限等问题。为应对这些挑战，我们提出了AirNav——一个基于真实城市航拍数据（而非合成环境）构建的大规模无人机视觉与语言导航基准数据集，其指令具有自然性与多样性。此外，我们提出了AirVLN-R1模型，该模型结合监督微调与强化微调以提升性能与泛化能力。通过真实场景测试对模型的可行性进行了初步验证。我们的数据集与代码均已公开。

0

相关内容

数据集

数据集，又称为资料集、数据集合或资料集合，是一种由数据所组成的集合。
Data set（或dataset）是一个数据的集合，通常以表格形式出现。每一列代表一个特定变量。每一行都对应于某一成员的数据集的问题。它列出的价值观为每一个变量，如身高和体重的一个物体或价值的随机数。每个数值被称为数据资料。对应于行数，该数据集的数据可能包括一个或多个成员。

实时无人机指令处理：一种面向无人机系统的大语言模型方法

实时无人机指令处理：一种面向无人机系统的大语言模型方法

专知会员服务

20+阅读 · 2025年10月24日

基于视觉的无人机定位与导航方法研究综述

基于视觉的无人机定位与导航方法研究综述

专知会员服务

22+阅读 · 2025年5月21日

《面向无人机实时认知任务解决的视觉-语言-动作（VLA）模型与评估基准》

《面向无人机实时认知任务解决的视觉-语言-动作（VLA）模型与评估基准》

专知会员服务

42+阅读 · 2025年3月9日

2024 年全球十大顶尖军用无人机

2024 年全球十大顶尖军用无人机

专知会员服务

41+阅读 · 2024年4月9日

【AAAI2024】VLN-VIDEO: 利用驾驶视频进行户外视觉语言导航

【AAAI2024】VLN-VIDEO: 利用驾驶视频进行户外视觉语言导航

专知会员服务

10+阅读 · 2024年2月10日

《使用强化学习的自主无人飞行器导航：综述》

《使用强化学习的自主无人飞行器导航：综述》

专知会员服务

86+阅读 · 2023年6月18日

【首本无人机UAVs硬核书】《通信、监视和交付无人机自主导航与部署》，275页pdf

【首本无人机UAVs硬核书】《通信、监视和交付无人机自主导航与部署》，275页pdf

专知会员服务

99+阅读 · 2022年9月13日

【含源代码】《用机器学习提高超视距空战中的态势感知能力》最新论文，巴西空军高级研究学院、卡内基梅隆大学机器人研究所

【含源代码】《用机器学习提高超视距空战中的态势感知能力》最新论文，巴西空军高级研究学院、卡内基梅隆大学机器人研究所

专知会员服务

121+阅读 · 2022年6月20日

北理工最新《基于深度学习的无人机UAV目标检测与跟踪》研究综述论文，24页pdf227篇文献概述深度无人机目标检测进展

北理工最新《基于深度学习的无人机UAV目标检测与跟踪》研究综述论文，24页pdf227篇文献概述深度无人机目标检测进展

专知会员服务

166+阅读 · 2021年10月28日

【华盛顿大学】用于视觉和语言导航的多视图学习，Multi-View Learning for Vision-and-Language Navigation

【华盛顿大学】用于视觉和语言导航的多视图学习，Multi-View Learning for Vision-and-Language Navigation

专知会员服务

31+阅读 · 2020年3月11日

军用无人机行业深度报告

军用无人机行业深度报告

专知

17+阅读 · 2022年8月21日

【万字长文】《信息集群：无人机群与信息战》美国陆军战争学院季刊最新17页论文

【万字长文】《信息集群：无人机群与信息战》美国陆军战争学院季刊最新17页论文

专知

47+阅读 · 2022年8月16日

《无人机系统中的人类系统集成指南》加拿大国防研究和发展部64页报告

《无人机系统中的人类系统集成指南》加拿大国防研究和发展部64页报告

专知

52+阅读 · 2022年8月11日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

111+阅读 · 2022年4月28日

DARPA将无人机带入“狗斗”，实现视距范围内的“AI”空战

DARPA将无人机带入“狗斗”，实现视距范围内的“AI”空战

无人机

33+阅读 · 2019年6月29日

Windows开源无人机仿真工具：AirSim1.0 入门

Windows开源无人机仿真工具：AirSim1.0 入门

无人机

28+阅读 · 2019年6月8日

无人驾驶开源仿真平台整理

无人驾驶开源仿真平台整理

智能交通技术

27+阅读 · 2019年5月9日

无人机图像处理技术精髓汇总 (二) 机器学习图像分割剖析

无人机图像处理技术精髓汇总 (二) 机器学习图像分割剖析

深度学习

15+阅读 · 2018年12月19日

无人机图像处理技术精髓汇总 (一) 三维还原重建技术简介

无人机图像处理技术精髓汇总 (一) 三维还原重建技术简介

深度学习

14+阅读 · 2018年12月18日

无人机飞行控制方法概述

无人机飞行控制方法概述

无人机

13+阅读 · 2017年10月7日

无人驾驶中4D场景实时解析算法研究

国家自然科学基金

12+阅读 · 2017年12月31日

基于自动导航的旋翼式微小型无人机农作物遥感信息解析方法

国家自然科学基金

4+阅读 · 2015年12月31日

基于弱监督贝叶斯推断模型的多无人机协同跟踪技术研究

国家自然科学基金

14+阅读 · 2015年12月31日

面向无人机基于在线场景建模的室外目标检测与跟踪方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

无人机视频快速4-D重建及时空自适应索引方法研究

国家自然科学基金

8+阅读 · 2015年12月31日

三维复杂地形环境下基于无人机追逃问题的航路规划方法研究

国家自然科学基金

26+阅读 · 2015年12月31日

无人机自主导航中LiDAR点云与图像特征提取与配准方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

无人机对地目标跟踪与定位的基础理论与关键技术

国家自然科学基金

19+阅读 · 2011年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

USS-Nav: Unified Spatio-Semantic Scene Graph for Lightweight UAV Zero-Shot Object Navigation

Arxiv

0+阅读 · 2月3日

SkySim: A ROS2-based Simulation Environment for Natural Language Control of Drone Swarms using Large Language Models

Arxiv

0+阅读 · 2月1日

AIR-VLA: Vision-Language-Action Systems for Aerial Manipulation

Arxiv

0+阅读 · 1月29日

AirHunt: Bridging VLM Semantics and Continuous Planning for Efficient Aerial Object Navigation

Arxiv

0+阅读 · 1月19日

SpatialNav: Leveraging Spatial Scene Graphs for Zero-Shot Vision-and-Language Navigation

Arxiv

0+阅读 · 1月11日

NavAI: A Generalizable LLM Framework for Navigation Tasks in Virtual Reality Environments

NavAI: A Generalizable LLM Framework for Navigation Tasks in Virtual Reality Environments

Arxiv

0+阅读 · 1月6日

AdaVLN: Towards Visual Language Navigation in Continuous Indoor Environments with Moving Humans

Arxiv

0+阅读 · 1月6日

CausalNav: A Long-term Embodied Navigation System for Autonomous Mobile Robots in Dynamic Outdoor Scenarios

Arxiv

0+阅读 · 1月5日

AirSpatialBot: A Spatially-Aware Aerial Agent for Fine-Grained Vehicle Attribute Recognization and Retrieval

Arxiv

0+阅读 · 1月4日

AINav: Large Language Model-Based Adaptive Interactive Navigation

Arxiv

0+阅读 · 2025年12月31日

VIP会员

文章信息

相关主题

最新内容

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

专知会员服务

0+阅读 · 4分钟前

《人机协同在安全关键型操作决策中的应用》120页

《人机协同在安全关键型操作决策中的应用》120页

专知会员服务

0+阅读 · 13分钟前

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

专知会员服务

0+阅读 · 今天1:47

综述 | Memory for Large Language Models：大模型记忆机制全景

综述 | Memory for Large Language Models：大模型记忆机制全景

专知会员服务

2+阅读 · 7月29日

博士论文 | Riemannian Deep Learning：模块、网络与几何

博士论文 | Riemannian Deep Learning：模块、网络与几何

专知会员服务

1+阅读 · 7月29日

《越野作战环境下路径规划的多准则整数规划模型》

《越野作战环境下路径规划的多准则整数规划模型》

专知会员服务

9+阅读 · 7月29日

人工智能大语言模型引擎如何重塑全球冲突信息环境最新50页

人工智能大语言模型引擎如何重塑全球冲突信息环境最新50页

专知会员服务

6+阅读 · 7月29日

《防空系统对自主武器系统辩论中“有意义的人类控制”的启示》70页报告

《防空系统对自主武器系统辩论中“有意义的人类控制”的启示》70页报告

专知会员服务

5+阅读 · 7月29日

“对标ChatGPT”：乌军研发Marichka AI系统用于战场筹划

“对标ChatGPT”：乌军研发Marichka AI系统用于战场筹划

专知会员服务

10+阅读 · 7月29日

《同步多无人机系统中的故障与通信》

《同步多无人机系统中的故障与通信》

专知会员服务

4+阅读 · 7月29日

论文解读 | 医学图像修复中的扩散模型：挑战、分类与未来方向

论文解读 | 医学图像修复中的扩散模型：挑战、分类与未来方向

专知会员服务

4+阅读 · 7月28日

博士论文 | 从算法到基础模型：强化学习的统一视角

博士论文 | 从算法到基础模型：强化学习的统一视角

专知会员服务

10+阅读 · 7月28日

面向国防作战的最佳自主与蜂群无人机技术

面向国防作战的最佳自主与蜂群无人机技术

专知会员服务

7+阅读 · 7月28日

《异构人类团队的协作决策过程混合建模研究》

《异构人类团队的协作决策过程混合建模研究》

专知会员服务

8+阅读 · 7月28日

《C5ISR系统中的注意力动态与自适应决策支持研究：视觉与多模态注意力引导对任务绩效影响的递归量化分析》最新36页报告

《C5ISR系统中的注意力动态与自适应决策支持研究：视觉与多模态注意力引导对任务绩效影响的递归量化分析》最新36页报告

专知会员服务

8+阅读 · 7月28日

相关VIP内容

实时无人机指令处理：一种面向无人机系统的大语言模型方法

实时无人机指令处理：一种面向无人机系统的大语言模型方法

专知会员服务

20+阅读 · 2025年10月24日

基于视觉的无人机定位与导航方法研究综述

基于视觉的无人机定位与导航方法研究综述

专知会员服务

22+阅读 · 2025年5月21日

《面向无人机实时认知任务解决的视觉-语言-动作（VLA）模型与评估基准》

《面向无人机实时认知任务解决的视觉-语言-动作（VLA）模型与评估基准》

专知会员服务

42+阅读 · 2025年3月9日

2024 年全球十大顶尖军用无人机

2024 年全球十大顶尖军用无人机

专知会员服务

41+阅读 · 2024年4月9日

【AAAI2024】VLN-VIDEO: 利用驾驶视频进行户外视觉语言导航

【AAAI2024】VLN-VIDEO: 利用驾驶视频进行户外视觉语言导航

专知会员服务

10+阅读 · 2024年2月10日

《使用强化学习的自主无人飞行器导航：综述》

《使用强化学习的自主无人飞行器导航：综述》

专知会员服务

86+阅读 · 2023年6月18日

【首本无人机UAVs硬核书】《通信、监视和交付无人机自主导航与部署》，275页pdf

【首本无人机UAVs硬核书】《通信、监视和交付无人机自主导航与部署》，275页pdf

专知会员服务

99+阅读 · 2022年9月13日

【含源代码】《用机器学习提高超视距空战中的态势感知能力》最新论文，巴西空军高级研究学院、卡内基梅隆大学机器人研究所

【含源代码】《用机器学习提高超视距空战中的态势感知能力》最新论文，巴西空军高级研究学院、卡内基梅隆大学机器人研究所

专知会员服务

121+阅读 · 2022年6月20日

北理工最新《基于深度学习的无人机UAV目标检测与跟踪》研究综述论文，24页pdf227篇文献概述深度无人机目标检测进展

北理工最新《基于深度学习的无人机UAV目标检测与跟踪》研究综述论文，24页pdf227篇文献概述深度无人机目标检测进展

专知会员服务

166+阅读 · 2021年10月28日

【华盛顿大学】用于视觉和语言导航的多视图学习，Multi-View Learning for Vision-and-Language Navigation

【华盛顿大学】用于视觉和语言导航的多视图学习，Multi-View Learning for Vision-and-Language Navigation

专知会员服务

31+阅读 · 2020年3月11日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | Memory for Large Language Models：大模型记忆机制全景

《越野作战环境下路径规划的多准则整数规划模型》

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

博士论文 | Riemannian Deep Learning：模块、网络与几何

相关资讯

军用无人机行业深度报告

军用无人机行业深度报告

专知

17+阅读 · 2022年8月21日

【万字长文】《信息集群：无人机群与信息战》美国陆军战争学院季刊最新17页论文

【万字长文】《信息集群：无人机群与信息战》美国陆军战争学院季刊最新17页论文

专知

47+阅读 · 2022年8月16日

《无人机系统中的人类系统集成指南》加拿大国防研究和发展部64页报告

《无人机系统中的人类系统集成指南》加拿大国防研究和发展部64页报告

专知

52+阅读 · 2022年8月11日

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

《人工智能在空战指挥与控制中的应用》中文版，美国空军大学空军指挥参谋学院

专知

111+阅读 · 2022年4月28日

DARPA将无人机带入“狗斗”，实现视距范围内的“AI”空战

DARPA将无人机带入“狗斗”，实现视距范围内的“AI”空战

无人机

33+阅读 · 2019年6月29日

Windows开源无人机仿真工具：AirSim1.0 入门

Windows开源无人机仿真工具：AirSim1.0 入门

无人机

28+阅读 · 2019年6月8日

无人驾驶开源仿真平台整理

无人驾驶开源仿真平台整理

智能交通技术

27+阅读 · 2019年5月9日

无人机图像处理技术精髓汇总 (二) 机器学习图像分割剖析

无人机图像处理技术精髓汇总 (二) 机器学习图像分割剖析

深度学习

15+阅读 · 2018年12月19日

无人机图像处理技术精髓汇总 (一) 三维还原重建技术简介

无人机图像处理技术精髓汇总 (一) 三维还原重建技术简介

深度学习

14+阅读 · 2018年12月18日

无人机飞行控制方法概述

无人机飞行控制方法概述

无人机

13+阅读 · 2017年10月7日

相关论文

USS-Nav: Unified Spatio-Semantic Scene Graph for Lightweight UAV Zero-Shot Object Navigation

Arxiv

0+阅读 · 2月3日

SkySim: A ROS2-based Simulation Environment for Natural Language Control of Drone Swarms using Large Language Models

Arxiv

0+阅读 · 2月1日

AIR-VLA: Vision-Language-Action Systems for Aerial Manipulation

Arxiv

0+阅读 · 1月29日

AirHunt: Bridging VLM Semantics and Continuous Planning for Efficient Aerial Object Navigation

Arxiv

0+阅读 · 1月19日

SpatialNav: Leveraging Spatial Scene Graphs for Zero-Shot Vision-and-Language Navigation

Arxiv

0+阅读 · 1月11日

NavAI: A Generalizable LLM Framework for Navigation Tasks in Virtual Reality Environments

NavAI: A Generalizable LLM Framework for Navigation Tasks in Virtual Reality Environments

Arxiv

0+阅读 · 1月6日

AdaVLN: Towards Visual Language Navigation in Continuous Indoor Environments with Moving Humans

Arxiv

0+阅读 · 1月6日

CausalNav: A Long-term Embodied Navigation System for Autonomous Mobile Robots in Dynamic Outdoor Scenarios

Arxiv

0+阅读 · 1月5日

AirSpatialBot: A Spatially-Aware Aerial Agent for Fine-Grained Vehicle Attribute Recognization and Retrieval

Arxiv

0+阅读 · 1月4日

AINav: Large Language Model-Based Adaptive Interactive Navigation

Arxiv

0+阅读 · 2025年12月31日

相关基金

无人驾驶中4D场景实时解析算法研究

国家自然科学基金

12+阅读 · 2017年12月31日

基于自动导航的旋翼式微小型无人机农作物遥感信息解析方法

国家自然科学基金

4+阅读 · 2015年12月31日

基于弱监督贝叶斯推断模型的多无人机协同跟踪技术研究

国家自然科学基金

14+阅读 · 2015年12月31日

面向无人机基于在线场景建模的室外目标检测与跟踪方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

无人机视频快速4-D重建及时空自适应索引方法研究

国家自然科学基金

8+阅读 · 2015年12月31日

三维复杂地形环境下基于无人机追逃问题的航路规划方法研究

国家自然科学基金

26+阅读 · 2015年12月31日

无人机自主导航中LiDAR点云与图像特征提取与配准方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

无人机对地目标跟踪与定位的基础理论与关键技术

国家自然科学基金

19+阅读 · 2011年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员