Autonomous FPV Flight with Translational Optical Flow and Uncertainty Mask - 专知论文

会员服务 ·

0

光流 · 不确定 · 不确定性 · 光流估计 · 结构 ·

Autonomous FPV Flight with Translational Optical Flow and Uncertainty Mask

翻译：自主FPV飞行：基于平移光流与不确定性掩模

Yang Deng,Yu Hu,Feng Yu,Linzuo Zhang,Danping Zou

Autonomous FPV quadrotor flight in complex environments using a monocular RGB camera as the sole exteroceptive sensor remains a fundamental challenge. Recent research has shown that using optical flow as the input of a neural network can achieve end-to-end autonomous flight in cluttered scenes. However, extracting the most relevant information from the flow estimation is the key bottleneck limiting agility and robustness. Existing methods struggle to disentangle obstacle-induced optical flow from the ego-motion background flow and suffer from low signal-to-noise ratios near the focus of expansion (FoE). To address these issues, we decompose the optical flow into translational and rotational components and utilize only the translational flow, which captures scene geometry and depth cues. In addition, we introduce an uncertainty mask derived from inconsistencies between forward and backward flow estimates. This mask highlights obstacle structures, including those within the FoE region. Both cues are fed to a control policy trained in a differentiable simulation framework, which enables efficient first-order optimization across perception and control. We validate our approach through extensive experiments in both simulated and real-world forest environments. The proposed system achieves robust flight at speeds of up to 13.91 m/s in simulation and 11.79 m/s in real-world tests, with a 93.3\% success rate over 30 real-world trials, nearly doubling the previously reported 6 m/s real-world speed of the monocular-RGB optical-flow UAV obstacle avoidance system.

翻译：复杂环境中仅以单目RGB摄像头作为唯一外部感知传感器的自主FPV四旋翼飞行器飞行仍是一项根本性挑战。近期研究表明，利用光流作为神经网络输入可在杂乱场景中实现端到端自主飞行。然而，从光流估计中提取最相关信息是制约敏捷性与鲁棒性的关键瓶颈。现有方法难以区分障碍物诱发光流与自运动背景光流，且在膨胀中心（FoE）附近存在信噪比过低的问题。针对这些问题，我们将光流分解为平移分量和旋转分量，仅利用能捕捉场景几何与深度线索的平移光流。此外，我们提出了一种基于前向与后向光流估计不一致性的不确定性掩模，该掩模能突出障碍物结构（包括FoE区域内的结构）。两种线索被输入至可微分仿真框架中训练的控制策略，从而实现感知与控制间高效的一阶优化。我们在模拟与真实森林环境中通过大量实验验证了该方法的效果。所提系统在模拟环境中实现最高13.91米/秒的稳健飞行，在真实测试中达到11.79米/秒，30次真实试验的成功率达93.3%，几乎将此前报道的6米/秒单目RGB光流无人机避障系统真实飞行速度提升一倍。

0

相关内容

《FPV武装无人机的战斗飞行艺术与科学》最新报告

《FPV武装无人机的战斗飞行艺术与科学》最新报告

专知会员服务

37+阅读 · 2025年10月30日

《面向自主对接机动的机器视觉感知技术研究》最新150页

《面向自主对接机动的机器视觉感知技术研究》最新150页

专知会员服务

22+阅读 · 2025年9月15日

【ICCV2025】FlowSeek：借助深度基础模型与运动基实现更简易的光流估计

【ICCV2025】FlowSeek：借助深度基础模型与运动基实现更简易的光流估计

专知会员服务

9+阅读 · 2025年9月8日

《飞行自组织网络通信协议评估体系：三维高斯-马尔科夫移动模型的创新升级》172页

《飞行自组织网络通信协议评估体系：三维高斯-马尔科夫移动模型的创新升级》172页

专知会员服务

26+阅读 · 2025年8月12日

人工智能控制系统助力自主无人机在不确定环境中保持目标航迹：MIT最新研究成果（付论文）

人工智能控制系统助力自主无人机在不确定环境中保持目标航迹：MIT最新研究成果（付论文）

专知会员服务

25+阅读 · 2025年6月10日

《基于大语言模型的避障决策和自主水面航行器控制》

《基于大语言模型的避障决策和自主水面航行器控制》

专知会员服务

35+阅读 · 2024年12月5日

《利用卷积神经网络实现无人地面战车在 GPS 信号屏蔽环境中的自主航行》最新135页

《利用卷积神经网络实现无人地面战车在 GPS 信号屏蔽环境中的自主航行》最新135页

专知会员服务

40+阅读 · 2024年11月11日

《第一人称视角（FPV）无人机大战中的新领域与创新》

《第一人称视角（FPV）无人机大战中的新领域与创新》

专知会员服务

47+阅读 · 2024年11月1日

无人机系统自主安全: 定义、建模与分级

无人机系统自主安全: 定义、建模与分级

专知会员服务

77+阅读 · 2022年12月28日

【含源代码】《用机器学习提高超视距空战中的态势感知能力》最新论文，巴西空军高级研究学院、卡内基梅隆大学机器人研究所

【含源代码】《用机器学习提高超视距空战中的态势感知能力》最新论文，巴西空军高级研究学院、卡内基梅隆大学机器人研究所

专知会员服务

121+阅读 · 2022年6月20日

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

专知

74+阅读 · 2022年11月19日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

地平线提出AFDet：首个Anchor free、NMS free的3D目标检测算法

地平线提出AFDet：首个Anchor free、NMS free的3D目标检测算法

CVer

10+阅读 · 2020年6月27日

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

新智元

10+阅读 · 2019年7月2日

【泡泡图灵智库】自动驾驶中的基于立体视觉的3D语义物体和相机运动追踪（ECCV）

【泡泡图灵智库】自动驾驶中的基于立体视觉的3D语义物体和相机运动追踪（ECCV）

泡泡机器人SLAM

10+阅读 · 2019年4月18日

自动驾驶车载激光雷达技术现状分析

自动驾驶车载激光雷达技术现状分析

智能交通技术

17+阅读 · 2019年4月9日

新型相机DVS/Event-based camera的发展及应用

新型相机DVS/Event-based camera的发展及应用

计算机视觉life

16+阅读 · 2019年3月12日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

商汤科技

14+阅读 · 2018年6月2日

无人机飞行控制方法概述

无人机飞行控制方法概述

无人机

12+阅读 · 2017年10月7日

临近空间高超声速飞行器低复杂度再入姿态控制器设计研究

国家自然科学基金

1+阅读 · 2015年12月31日

仿生天空偏振光自主定位导航传感器关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

飞行器三维不变矩特征提取与识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

高超声速飞行器超紧耦合自主可靠导航方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

多旋翼无人飞行器大机动轨迹跟踪飞行非线性鲁棒控制

国家自然科学基金

2+阅读 · 2015年12月31日

基于连续波四相位法的飞行时间(TOF)三维成像图像传感器研究

国家自然科学基金

1+阅读 · 2015年12月31日

倾转旋翼飞行器模态转换阶段非线性控制方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

无人机自主导航中LiDAR点云与图像特征提取与配准方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

自组织递归二型小波模糊神经网络的研究及在微型飞行器姿态控制中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

高动态环境下低可探测性飞行器自主任务规划方法研究

国家自然科学基金

18+阅读 · 2013年12月31日

FLAP: FOV-Constrained Active Perception Planning for Prior-Map-Free 3D Navigation

Arxiv

0+阅读 · 6月16日

GraphBEV++: Multi-Modal Feature Alignment for Autonomous Driving

Arxiv

0+阅读 · 6月15日

FEMOT: Multi-Object Tracking using Frame and Event Cameras

Arxiv

0+阅读 · 6月12日

Planar-Sector LOS Guidance for Interception of Agile Targets with Lifting-Wing Quadcopters

Arxiv

0+阅读 · 6月10日

Decentralized End-to-End Multi-AAV Pursuit Using Predictive Spatio-Temporal Observation via Deep Reinforcement Learning

Arxiv

0+阅读 · 6月7日

Autonomous Aerial Manipulation via Contextual Contrastive Meta Reinforcement Learning

Arxiv

0+阅读 · 6月7日

MinNav: Minimalist Navigation Using Optical Flow For Active Tiny Aerial Robots

Arxiv

0+阅读 · 6月5日

A Simulation Platform for Flapping-Wing Vehicles

Arxiv

0+阅读 · 6月1日

LiftNav: Path Planning via Semantic Lifting in TSDF-Guided Gaussian Splatting

Arxiv

0+阅读 · 5月29日

Swarical: An Integrated Hierarchical Approach to Localizing Flying Light Specks

Arxiv

0+阅读 · 5月22日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

3+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

4+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

9+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

8+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

5+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

7+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

6+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

10+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

4+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

6+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

7+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

6+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

5+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

相关VIP内容

《FPV武装无人机的战斗飞行艺术与科学》最新报告

《FPV武装无人机的战斗飞行艺术与科学》最新报告

专知会员服务

37+阅读 · 2025年10月30日

《面向自主对接机动的机器视觉感知技术研究》最新150页

《面向自主对接机动的机器视觉感知技术研究》最新150页

专知会员服务

22+阅读 · 2025年9月15日

【ICCV2025】FlowSeek：借助深度基础模型与运动基实现更简易的光流估计

【ICCV2025】FlowSeek：借助深度基础模型与运动基实现更简易的光流估计

专知会员服务

9+阅读 · 2025年9月8日

《飞行自组织网络通信协议评估体系：三维高斯-马尔科夫移动模型的创新升级》172页

《飞行自组织网络通信协议评估体系：三维高斯-马尔科夫移动模型的创新升级》172页

专知会员服务

26+阅读 · 2025年8月12日

人工智能控制系统助力自主无人机在不确定环境中保持目标航迹：MIT最新研究成果（付论文）

人工智能控制系统助力自主无人机在不确定环境中保持目标航迹：MIT最新研究成果（付论文）

专知会员服务

25+阅读 · 2025年6月10日

《基于大语言模型的避障决策和自主水面航行器控制》

《基于大语言模型的避障决策和自主水面航行器控制》

专知会员服务

35+阅读 · 2024年12月5日

《利用卷积神经网络实现无人地面战车在 GPS 信号屏蔽环境中的自主航行》最新135页

《利用卷积神经网络实现无人地面战车在 GPS 信号屏蔽环境中的自主航行》最新135页

专知会员服务

40+阅读 · 2024年11月11日

《第一人称视角（FPV）无人机大战中的新领域与创新》

《第一人称视角（FPV）无人机大战中的新领域与创新》

专知会员服务

47+阅读 · 2024年11月1日

无人机系统自主安全: 定义、建模与分级

无人机系统自主安全: 定义、建模与分级

专知会员服务

77+阅读 · 2022年12月28日

【含源代码】《用机器学习提高超视距空战中的态势感知能力》最新论文，巴西空军高级研究学院、卡内基梅隆大学机器人研究所

【含源代码】《用机器学习提高超视距空战中的态势感知能力》最新论文，巴西空军高级研究学院、卡内基梅隆大学机器人研究所

专知会员服务

121+阅读 · 2022年6月20日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

专知

74+阅读 · 2022年11月19日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

地平线提出AFDet：首个Anchor free、NMS free的3D目标检测算法

地平线提出AFDet：首个Anchor free、NMS free的3D目标检测算法

CVer

10+阅读 · 2020年6月27日

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

新智元

10+阅读 · 2019年7月2日

【泡泡图灵智库】自动驾驶中的基于立体视觉的3D语义物体和相机运动追踪（ECCV）

【泡泡图灵智库】自动驾驶中的基于立体视觉的3D语义物体和相机运动追踪（ECCV）

泡泡机器人SLAM

10+阅读 · 2019年4月18日

自动驾驶车载激光雷达技术现状分析

自动驾驶车载激光雷达技术现状分析

智能交通技术

17+阅读 · 2019年4月9日

新型相机DVS/Event-based camera的发展及应用

新型相机DVS/Event-based camera的发展及应用

计算机视觉life

16+阅读 · 2019年3月12日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

商汤科技

14+阅读 · 2018年6月2日

无人机飞行控制方法概述

无人机飞行控制方法概述

无人机

12+阅读 · 2017年10月7日

相关论文

FLAP: FOV-Constrained Active Perception Planning for Prior-Map-Free 3D Navigation

Arxiv

0+阅读 · 6月16日

GraphBEV++: Multi-Modal Feature Alignment for Autonomous Driving

Arxiv

0+阅读 · 6月15日

FEMOT: Multi-Object Tracking using Frame and Event Cameras

Arxiv

0+阅读 · 6月12日

Planar-Sector LOS Guidance for Interception of Agile Targets with Lifting-Wing Quadcopters

Arxiv

0+阅读 · 6月10日

Decentralized End-to-End Multi-AAV Pursuit Using Predictive Spatio-Temporal Observation via Deep Reinforcement Learning

Arxiv

0+阅读 · 6月7日

Autonomous Aerial Manipulation via Contextual Contrastive Meta Reinforcement Learning

Arxiv

0+阅读 · 6月7日

MinNav: Minimalist Navigation Using Optical Flow For Active Tiny Aerial Robots

Arxiv

0+阅读 · 6月5日

A Simulation Platform for Flapping-Wing Vehicles

Arxiv

0+阅读 · 6月1日

LiftNav: Path Planning via Semantic Lifting in TSDF-Guided Gaussian Splatting

Arxiv

0+阅读 · 5月29日

Swarical: An Integrated Hierarchical Approach to Localizing Flying Light Specks

Arxiv

0+阅读 · 5月22日

相关基金

临近空间高超声速飞行器低复杂度再入姿态控制器设计研究

国家自然科学基金

1+阅读 · 2015年12月31日

仿生天空偏振光自主定位导航传感器关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

飞行器三维不变矩特征提取与识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

高超声速飞行器超紧耦合自主可靠导航方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

多旋翼无人飞行器大机动轨迹跟踪飞行非线性鲁棒控制

国家自然科学基金

2+阅读 · 2015年12月31日

基于连续波四相位法的飞行时间(TOF)三维成像图像传感器研究

国家自然科学基金

1+阅读 · 2015年12月31日

倾转旋翼飞行器模态转换阶段非线性控制方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

无人机自主导航中LiDAR点云与图像特征提取与配准方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

自组织递归二型小波模糊神经网络的研究及在微型飞行器姿态控制中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

高动态环境下低可探测性飞行器自主任务规划方法研究

国家自然科学基金

18+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员