WildLIFT: Lifting monocular drone video to 3D for species-agnostic wildlife monitoring - 专知论文

会员服务 ·

0

视频 · 分析 · 标注 · 几何信息 · 结构 ·

WildLIFT: Lifting monocular drone video to 3D for species-agnostic wildlife monitoring

翻译：WildLIFT：将单目无人机视频提升至三维空间，实现物种无关的野生动物监测

Vandita Shukla,Fabio Remondino,Blair Costelloe,Benjamin Risse

Monocular RGB cameras mounted on drones are widely used for wildlife monitoring, yet most analytical pipelines remain confined to two-dimensional image space, leaving geometric information in video underexploited. We present WildLIFT, a computational framework that integrates three-dimensional scene geometry from monocular drone video with open-vocabulary 2D instance segmentation to enable species-agnostic 3D detection and tracking. Oriented 3D bounding box labels with semantic face information enable quantitative assessment of viewpoint coverage and inter-animal occlusion, producing structured metadata for downstream ecological analyses. We validate the framework on 2,581 manually curated frames comprising over 6,700 3D detections across four large mammal species. WildLIFT maintains high identity consistency in multi-animal scenes and substantially reduces manual 3D annotation effort through keyframe-based refinement. By transforming standard drone footage into structured 3D and viewpoint-aware representations, WildLIFT extends the analytical utility of aerial wildlife datasets for behavioural research and population monitoring.

翻译：搭载于无人机上的单目RGB相机被广泛用于野生动物监测，然而大多数分析流程仍局限于二维图像空间，视频中的几何信息未得到充分利用。我们提出WildLIFT计算框架，该框架将单目无人机视频中的三维场景几何信息与开放词汇2D实例分割相结合，实现物种无关的3D检测与跟踪。带有语义面信息的有向三维包围框标注，能够对视角覆盖范围和动物间遮挡进行定量评估，为下游生态学分析生成结构化元数据。我们在包含四种大型哺乳动物、超过6,700个三维检测实例的2,581帧人工标注数据上验证了该框架性能。在多动物场景中，WildLIFT保持了高身份一致性，并通过基于关键帧的优化显著减少了人工三维标注工作量。通过将标准无人机视频转化为结构化的三维及视角感知表征，WildLIFT拓展了航空野生动物数据集在行为研究与种群监测中的分析效用。

0

相关内容

视频

面向无人机视角的多源信息融合目标检测

面向无人机视角的多源信息融合目标检测

专知会员服务

19+阅读 · 2025年2月2日

基于深度学习的无人机目标检测研究综述

基于深度学习的无人机目标检测研究综述

专知会员服务

108+阅读 · 2023年6月22日

面向无人机的视觉目标跟踪算法：综述与展望

面向无人机的视觉目标跟踪算法：综述与展望

专知会员服务

81+阅读 · 2023年2月28日

《小型无人机实时多模态定位和识别的深度学习》2023最新论文（含讲解PPT、演示视频），北约科技组织“分布式多光谱和多静态传感”会议

《小型无人机实时多模态定位和识别的深度学习》2023最新论文（含讲解PPT、演示视频），北约科技组织“分布式多光谱和多静态传感”会议

专知会员服务

76+阅读 · 2023年2月6日

无人机视角下的目标检测研究进展

无人机视角下的目标检测研究进展

专知会员服务

127+阅读 · 2023年1月22日

港中文发布最新《自动驾驶三维物体检测》综述论文，32页pdf涵盖367篇文献全面概述基于激光雷达、基于相机和多模态的物体检测进展

港中文发布最新《自动驾驶三维物体检测》综述论文，32页pdf涵盖367篇文献全面概述基于激光雷达、基于相机和多模态的物体检测进展

专知会员服务

44+阅读 · 2022年6月23日

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

专知会员服务

18+阅读 · 2022年3月19日

北理工最新《基于深度学习的无人机UAV目标检测与跟踪》研究综述论文，24页pdf227篇文献概述深度无人机目标检测进展

北理工最新《基于深度学习的无人机UAV目标检测与跟踪》研究综述论文，24页pdf227篇文献概述深度无人机目标检测进展

专知会员服务

164+阅读 · 2021年10月28日

天津大学等发布最新「无人机视觉检测和跟踪」综述论文：过去、现在和未来

天津大学等发布最新「无人机视觉检测和跟踪」综述论文：过去、现在和未来

专知会员服务

63+阅读 · 2020年1月21日

【综述论文推荐】无人机计算机视觉：过去、现在与未来，Vision Meets Drones: Past, Present and Future

【综述论文推荐】无人机计算机视觉：过去、现在与未来，Vision Meets Drones: Past, Present and Future

专知会员服务

44+阅读 · 2020年1月20日

大牛教你完成你的第一个智能无人机（含YOLOv3和SLAM部署）

大牛教你完成你的第一个智能无人机（含YOLOv3和SLAM部署）

CVer

14+阅读 · 2020年6月21日

SlimYOLOv3：更窄、更快、更好的无人机目标检测算法

SlimYOLOv3：更窄、更快、更好的无人机目标检测算法

极市平台

11+阅读 · 2019年9月19日

贾佳亚等提出Fast Point R-CNN，利用点云快速高效检测3D目标

贾佳亚等提出Fast Point R-CNN，利用点云快速高效检测3D目标

机器之心

11+阅读 · 2019年9月10日

【未来黑科技】深度玩转行人重识别与跨境追踪

【未来黑科技】深度玩转行人重识别与跨境追踪

炼数成金订阅号

11+阅读 · 2019年4月18日

新型相机DVS/Event-based camera的发展及应用

新型相机DVS/Event-based camera的发展及应用

计算机视觉life

16+阅读 · 2019年3月12日

无人机图像处理技术精髓汇总 (二) 机器学习图像分割剖析

无人机图像处理技术精髓汇总 (二) 机器学习图像分割剖析

深度学习

15+阅读 · 2018年12月19日

无人机图像处理技术精髓汇总 (一) 三维还原重建技术简介

无人机图像处理技术精髓汇总 (一) 三维还原重建技术简介

深度学习

13+阅读 · 2018年12月18日

AI如何帮助卫星遥感释放价值？

AI如何帮助卫星遥感释放价值？

未来论坛

19+阅读 · 2018年8月8日

智能无人机集群技术概述

智能无人机集群技术概述

无人机

46+阅读 · 2018年2月28日

无人机飞行控制方法概述

无人机飞行控制方法概述

无人机

12+阅读 · 2017年10月7日

基于自动导航的旋翼式微小型无人机农作物遥感信息解析方法

国家自然科学基金

4+阅读 · 2015年12月31日

多目主动相机智能监控关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于弱监督贝叶斯推断模型的多无人机协同跟踪技术研究

国家自然科学基金

14+阅读 · 2015年12月31日

面向无人机基于在线场景建模的室外目标检测与跟踪方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

无人机视频快速4-D重建及时空自适应索引方法研究

国家自然科学基金

8+阅读 · 2015年12月31日

无人机自主导航中LiDAR点云与图像特征提取与配准方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

形状先验和数据驱动的高分辨遥感影像目标提取

国家自然科学基金

3+阅读 · 2014年12月31日

高动态编队无人机自主高精度时间同步方法研究

国家自然科学基金

11+阅读 · 2013年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

Leveraging Previous-Traversal Point Cloud Map Priors for Camera-Based 3D Object Detection and Tracking

Arxiv

0+阅读 · 4月28日

Altitude-Adaptive Vision-Only Geo-Localization for UAVs in GPS-Denied Environments

Arxiv

0+阅读 · 4月24日

Real-Time Structural Detection for Indoor Navigation from 3D LiDAR Using Bird's-Eye-View Images

Arxiv

0+阅读 · 4月20日

From Limited Labels to Open Domains:An Efficient Learning Method for Drone-view Geo-Localization

Arxiv

1+阅读 · 4月17日

"Take Me Home, Wi-Fi Drone": A Drone-based Wireless System for Wilderness Search and Rescue

Arxiv

0+阅读 · 4月10日

SFFNet: Synergistic Feature Fusion Network With Dual-Domain Edge Enhancement for UAV Image Object Detection

Arxiv

0+阅读 · 4月3日

SHOW3D: Capturing Scenes of 3D Hands and Objects in the Wild

Arxiv

0+阅读 · 3月30日

SonoWorld: From One Image to a 3D Audio-Visual Scene

Arxiv

0+阅读 · 3月30日

One View Is Enough! Monocular Training for In-the-Wild Novel View Generation

Arxiv

0+阅读 · 3月24日

Real-Time Structural Detection for Indoor Navigation from 3D LiDAR Using Bird's-Eye-View Images

Arxiv

0+阅读 · 3月20日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

2+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

2+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

3+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

3+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

3+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

3+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

4+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

21+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

面向无人机视角的多源信息融合目标检测

面向无人机视角的多源信息融合目标检测

专知会员服务

19+阅读 · 2025年2月2日

基于深度学习的无人机目标检测研究综述

基于深度学习的无人机目标检测研究综述

专知会员服务

108+阅读 · 2023年6月22日

面向无人机的视觉目标跟踪算法：综述与展望

面向无人机的视觉目标跟踪算法：综述与展望

专知会员服务

81+阅读 · 2023年2月28日

《小型无人机实时多模态定位和识别的深度学习》2023最新论文（含讲解PPT、演示视频），北约科技组织“分布式多光谱和多静态传感”会议

《小型无人机实时多模态定位和识别的深度学习》2023最新论文（含讲解PPT、演示视频），北约科技组织“分布式多光谱和多静态传感”会议

专知会员服务

76+阅读 · 2023年2月6日

无人机视角下的目标检测研究进展

无人机视角下的目标检测研究进展

专知会员服务

127+阅读 · 2023年1月22日

港中文发布最新《自动驾驶三维物体检测》综述论文，32页pdf涵盖367篇文献全面概述基于激光雷达、基于相机和多模态的物体检测进展

港中文发布最新《自动驾驶三维物体检测》综述论文，32页pdf涵盖367篇文献全面概述基于激光雷达、基于相机和多模态的物体检测进展

专知会员服务

44+阅读 · 2022年6月23日

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

专知会员服务

18+阅读 · 2022年3月19日

北理工最新《基于深度学习的无人机UAV目标检测与跟踪》研究综述论文，24页pdf227篇文献概述深度无人机目标检测进展

北理工最新《基于深度学习的无人机UAV目标检测与跟踪》研究综述论文，24页pdf227篇文献概述深度无人机目标检测进展

专知会员服务

164+阅读 · 2021年10月28日

天津大学等发布最新「无人机视觉检测和跟踪」综述论文：过去、现在和未来

天津大学等发布最新「无人机视觉检测和跟踪」综述论文：过去、现在和未来

专知会员服务

63+阅读 · 2020年1月21日

【综述论文推荐】无人机计算机视觉：过去、现在与未来，Vision Meets Drones: Past, Present and Future

【综述论文推荐】无人机计算机视觉：过去、现在与未来，Vision Meets Drones: Past, Present and Future

专知会员服务

44+阅读 · 2020年1月20日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

大牛教你完成你的第一个智能无人机（含YOLOv3和SLAM部署）

大牛教你完成你的第一个智能无人机（含YOLOv3和SLAM部署）

CVer

14+阅读 · 2020年6月21日

SlimYOLOv3：更窄、更快、更好的无人机目标检测算法

SlimYOLOv3：更窄、更快、更好的无人机目标检测算法

极市平台

11+阅读 · 2019年9月19日

贾佳亚等提出Fast Point R-CNN，利用点云快速高效检测3D目标

贾佳亚等提出Fast Point R-CNN，利用点云快速高效检测3D目标

机器之心

11+阅读 · 2019年9月10日

【未来黑科技】深度玩转行人重识别与跨境追踪

【未来黑科技】深度玩转行人重识别与跨境追踪

炼数成金订阅号

11+阅读 · 2019年4月18日

新型相机DVS/Event-based camera的发展及应用

新型相机DVS/Event-based camera的发展及应用

计算机视觉life

16+阅读 · 2019年3月12日

无人机图像处理技术精髓汇总 (二) 机器学习图像分割剖析

无人机图像处理技术精髓汇总 (二) 机器学习图像分割剖析

深度学习

15+阅读 · 2018年12月19日

无人机图像处理技术精髓汇总 (一) 三维还原重建技术简介

无人机图像处理技术精髓汇总 (一) 三维还原重建技术简介

深度学习

13+阅读 · 2018年12月18日

AI如何帮助卫星遥感释放价值？

AI如何帮助卫星遥感释放价值？

未来论坛

19+阅读 · 2018年8月8日

智能无人机集群技术概述

智能无人机集群技术概述

无人机

46+阅读 · 2018年2月28日

无人机飞行控制方法概述

无人机飞行控制方法概述

无人机

12+阅读 · 2017年10月7日

相关论文

Leveraging Previous-Traversal Point Cloud Map Priors for Camera-Based 3D Object Detection and Tracking

Arxiv

0+阅读 · 4月28日

Altitude-Adaptive Vision-Only Geo-Localization for UAVs in GPS-Denied Environments

Arxiv

0+阅读 · 4月24日

Real-Time Structural Detection for Indoor Navigation from 3D LiDAR Using Bird's-Eye-View Images

Arxiv

0+阅读 · 4月20日

From Limited Labels to Open Domains:An Efficient Learning Method for Drone-view Geo-Localization

Arxiv

1+阅读 · 4月17日

"Take Me Home, Wi-Fi Drone": A Drone-based Wireless System for Wilderness Search and Rescue

Arxiv

0+阅读 · 4月10日

SFFNet: Synergistic Feature Fusion Network With Dual-Domain Edge Enhancement for UAV Image Object Detection

Arxiv

0+阅读 · 4月3日

SHOW3D: Capturing Scenes of 3D Hands and Objects in the Wild

Arxiv

0+阅读 · 3月30日

SonoWorld: From One Image to a 3D Audio-Visual Scene

Arxiv

0+阅读 · 3月30日

One View Is Enough! Monocular Training for In-the-Wild Novel View Generation

Arxiv

0+阅读 · 3月24日

Real-Time Structural Detection for Indoor Navigation from 3D LiDAR Using Bird's-Eye-View Images

Arxiv

0+阅读 · 3月20日

相关基金

基于自动导航的旋翼式微小型无人机农作物遥感信息解析方法

国家自然科学基金

4+阅读 · 2015年12月31日

多目主动相机智能监控关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于弱监督贝叶斯推断模型的多无人机协同跟踪技术研究

国家自然科学基金

14+阅读 · 2015年12月31日

面向无人机基于在线场景建模的室外目标检测与跟踪方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

无人机视频快速4-D重建及时空自适应索引方法研究

国家自然科学基金

8+阅读 · 2015年12月31日

无人机自主导航中LiDAR点云与图像特征提取与配准方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

形状先验和数据驱动的高分辨遥感影像目标提取

国家自然科学基金

3+阅读 · 2014年12月31日

高动态编队无人机自主高精度时间同步方法研究

国家自然科学基金

11+阅读 · 2013年12月31日

基于群体智能的多无人机编队自主协调控制及验证

国家自然科学基金

21+阅读 · 2013年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员