EFSI-DETR：面向无人机图像实时小目标检测的高效频率-语义集成 (EFSI-DETR: Efficient Frequency-Semantic Integration for Real-Time Small Object Detection in UAV Imagery) - 专知论文

会员服务 ·

0

小目标检测 · 融合 · 语义特征 · 目标检测 · 语义集成 ·

EFSI-DETR: Efficient Frequency-Semantic Integration for Real-Time Small Object Detection in UAV Imagery

翻译：EFSI-DETR：面向无人机图像实时小目标检测的高效频率-语义集成

Yu Xia,Chang Liu,Tianqi Xiang,Zhigang Tu

Real-time small object detection in Unmanned Aerial Vehicle (UAV) imagery remains challenging due to limited feature representation and ineffective multi-scale fusion. Existing methods underutilize frequency information and rely on static convolutional operations, which constrain the capacity to obtain rich feature representations and hinder the effective exploitation of deep semantic features. To address these issues, we propose EFSI-DETR, a novel detection framework that integrates efficient semantic feature enhancement with dynamic frequency-spatial guidance. EFSI-DETR comprises two main components: (1) a Dynamic Frequency-Spatial Unified Synergy Network (DyFusNet) that jointly exploits frequency and spatial cues for robust multi-scale feature fusion, (2) an Efficient Semantic Feature Concentrator (ESFC) that enables deep semantic extraction with minimal computational cost. Furthermore, a Fine-grained Feature Retention (FFR) strategy is adopted to incorporate spatially rich shallow features during fusion to preserve fine-grained details, crucial for small object detection in UAV imagery. Extensive experiments on VisDrone and CODrone benchmarks demonstrate that our EFSI-DETR achieves the state-of-the-art performance with real-time efficiency, yielding improvement of \textbf{1.6}\% and \textbf{5.8}\% in AP and AP$_{s}$ on VisDrone, while obtaining \textbf{188} FPS inference speed on a single RTX 4090 GPU.

翻译：无人机（UAV）图像中的实时小目标检测由于特征表示有限以及多尺度融合效果不佳，仍然面临挑战。现有方法未能充分利用频率信息，并依赖于静态卷积操作，这限制了获取丰富特征表示的能力，并阻碍了对深层语义特征的有效挖掘。为解决这些问题，我们提出了EFSI-DETR，一种新颖的检测框架，它将高效的语义特征增强与动态的频率-空间引导相结合。EFSI-DETR包含两个主要组件：（1）动态频率-空间统一协同网络（DyFusNet），它联合利用频率和空间线索进行鲁棒的多尺度特征融合；（2）高效语义特征集中器（ESFC），能够以最小的计算成本实现深层语义提取。此外，采用了一种细粒度特征保留（FFR）策略，在融合过程中融入空间上丰富的浅层特征，以保留对无人机图像中小目标检测至关重要的细粒度细节。在VisDrone和CODrone基准上进行的大量实验表明，我们的EFSI-DETR在保持实时效率的同时，达到了最先进的性能，在VisDrone数据集上的AP和AP$_{s}$分别提升了\textbf{1.6}\%和\textbf{5.8}\%，同时在单个RTX 4090 GPU上获得了\textbf{188} FPS的推理速度。

0

相关内容

小目标检测

小目标检测

面向无人机视角的多源信息融合目标检测

面向无人机视角的多源信息融合目标检测

专知会员服务

21+阅读 · 2025年2月2日

基于深度学习的小目标检测基准研究进展

基于深度学习的小目标检测基准研究进展

专知会员服务

29+阅读 · 2024年4月30日

《面向大范围实时目标检测的蜂群侦察无人机系统》

《面向大范围实时目标检测的蜂群侦察无人机系统》

专知会员服务

74+阅读 · 2024年2月20日

遥感影像小目标检测研究进展

遥感影像小目标检测研究进展

专知会员服务

54+阅读 · 2023年3月17日

小目标如何检测？西工大韩军伟等发布《大规模小目标检测》综述，20页pdf全面阐述小目标检测方法和自动驾驶与空中场景基准数据集

小目标如何检测？西工大韩军伟等发布《大规模小目标检测》综述，20页pdf全面阐述小目标检测方法和自动驾驶与空中场景基准数据集

专知会员服务

94+阅读 · 2022年7月29日

北理工最新《基于深度学习的无人机UAV目标检测与跟踪》研究综述论文，24页pdf227篇文献概述深度无人机目标检测进展

北理工最新《基于深度学习的无人机UAV目标检测与跟踪》研究综述论文，24页pdf227篇文献概述深度无人机目标检测进展

专知会员服务

163+阅读 · 2021年10月28日

小目标检测研究进展

专知会员服务

91+阅读 · 2021年8月8日

基于深度学习的小目标检测方法综述

专知会员服务

125+阅读 · 2021年4月29日

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

专知会员服务

33+阅读 · 2020年10月11日

【Google AI新论文EfficientDet】规模化高效化的物体检测，EfficientDet: Scalable and Efficient Object Detection(附pdf)

【Google AI新论文EfficientDet】规模化高效化的物体检测，EfficientDet: Scalable and Efficient Object Detection(附pdf)

专知会员服务

27+阅读 · 2019年11月24日

编辑推荐 | 红外弱小目标检测算法综述

编辑推荐 | 红外弱小目标检测算法综述

中国图象图形学报

21+阅读 · 2020年10月12日

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

专知

18+阅读 · 2020年10月11日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

泡泡机器人SLAM

14+阅读 · 2019年6月28日

密歇根大学40页《20年目标检测综述》最新论文，带你全面了解目标检测方法

密歇根大学40页《20年目标检测综述》最新论文，带你全面了解目标检测方法

专知

70+阅读 · 2019年5月14日

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

全球人工智能

13+阅读 · 2019年4月30日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

基于深度学习的目标检测算法剖析与实现【附PPT与视频资料】

基于深度学习的目标检测算法剖析与实现【附PPT与视频资料】

人工智能前沿讲习班

12+阅读 · 2018年12月25日

基于深度学习的目标检测算法综述

基于深度学习的目标检测算法综述

AI研习社

15+阅读 · 2018年4月25日

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

专知

12+阅读 · 2018年1月12日

基于共性视觉特征与反馈机制的SAR图像目标检测方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于视觉特性的目标检测算法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于空域联合时频分解的海面慢速小目标检测新方法

国家自然科学基金

3+阅读 · 2015年12月31日

基于语义模型的高分辨率卫星遥感图像人造目标检测方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向无人机基于在线场景建模的室外目标检测与跟踪方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

无人机视频快速4-D重建及时空自适应索引方法研究

国家自然科学基金

8+阅读 · 2015年12月31日

无人机自主导航中LiDAR点云与图像特征提取与配准方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于自学习对比度视觉注意模型和自适应深度特征的无分类目标检测

国家自然科学基金

2+阅读 · 2015年12月31日

融合目标感知与对比度的图像和视频显著性检测技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于字典学习的小样本高光谱遥感图像稀疏表示分类精度研究与应用

国家自然科学基金

3+阅读 · 2014年12月31日

Efficient Test-Time Scaling for Small Vision-Language Models

Arxiv

0+阅读 · 2月16日

MDAFNet: Multiscale Differential Edge and Adaptive Frequency Guided Network for Infrared Small Target Detection

Arxiv

0+阅读 · 2月13日

Adaptive Image Zoom-in with Bounding Box Transformation for UAV Object Detection

Arxiv

0+阅读 · 2月7日

Enhanced Detection of Tiny Objects in Aerial Images

Arxiv

0+阅读 · 2月2日

SPIRIT: Adapting Vision Foundation Models for Unified Single- and Multi-Frame Infrared Small Target Detection

Arxiv

0+阅读 · 2月2日

UPLiFT: Efficient Pixel-Dense Feature Upsampling with Local Attenders

Arxiv

0+阅读 · 1月25日

DCCS-Det: Directional Context and Cross-Scale-Aware Detector for Infrared Small Target

Arxiv

0+阅读 · 1月23日

FeedbackSTS-Det: Sparse Frames-Based Spatio-Temporal Semantic Feedback Network for Infrared Small Target Detection

Arxiv

0+阅读 · 1月21日

DFIR-DETR: Frequency Domain Enhancement and Dynamic Feature Aggregation for Cross-Scene Small Object Detection

Arxiv

0+阅读 · 1月15日

EfficientFSL: Enhancing Few-Shot Classification via Query-Only Tuning in Vision Transformers

Arxiv

0+阅读 · 1月13日

VIP会员

文章信息

相关主题

小目标检测

相关VIP内容

面向无人机视角的多源信息融合目标检测

面向无人机视角的多源信息融合目标检测

专知会员服务

21+阅读 · 2025年2月2日

基于深度学习的小目标检测基准研究进展

基于深度学习的小目标检测基准研究进展

专知会员服务

29+阅读 · 2024年4月30日

《面向大范围实时目标检测的蜂群侦察无人机系统》

《面向大范围实时目标检测的蜂群侦察无人机系统》

专知会员服务

74+阅读 · 2024年2月20日

遥感影像小目标检测研究进展

遥感影像小目标检测研究进展

专知会员服务

54+阅读 · 2023年3月17日

小目标如何检测？西工大韩军伟等发布《大规模小目标检测》综述，20页pdf全面阐述小目标检测方法和自动驾驶与空中场景基准数据集

小目标如何检测？西工大韩军伟等发布《大规模小目标检测》综述，20页pdf全面阐述小目标检测方法和自动驾驶与空中场景基准数据集

专知会员服务

94+阅读 · 2022年7月29日

北理工最新《基于深度学习的无人机UAV目标检测与跟踪》研究综述论文，24页pdf227篇文献概述深度无人机目标检测进展

北理工最新《基于深度学习的无人机UAV目标检测与跟踪》研究综述论文，24页pdf227篇文献概述深度无人机目标检测进展

专知会员服务

163+阅读 · 2021年10月28日

小目标检测研究进展

专知会员服务

91+阅读 · 2021年8月8日

基于深度学习的小目标检测方法综述

专知会员服务

125+阅读 · 2021年4月29日

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

专知会员服务

33+阅读 · 2020年10月11日

【Google AI新论文EfficientDet】规模化高效化的物体检测，EfficientDet: Scalable and Efficient Object Detection(附pdf)

【Google AI新论文EfficientDet】规模化高效化的物体检测，EfficientDet: Scalable and Efficient Object Detection(附pdf)

专知会员服务

27+阅读 · 2019年11月24日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人机与战争：被忽视的环境影响及无人机保护潜力》

俄罗斯规划未来无人机驱动军队

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

《人工智能、武器与影响力：前沿模型在模拟核危机中展现复杂推理》2026最新46页报告

相关资讯

编辑推荐 | 红外弱小目标检测算法综述

编辑推荐 | 红外弱小目标检测算法综述

中国图象图形学报

21+阅读 · 2020年10月12日

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

专知

18+阅读 · 2020年10月11日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

【泡泡图灵智库】Detect-SLAM：目标检测和SLAM相互收益

泡泡机器人SLAM

14+阅读 · 2019年6月28日

密歇根大学40页《20年目标检测综述》最新论文，带你全面了解目标检测方法

密歇根大学40页《20年目标检测综述》最新论文，带你全面了解目标检测方法

专知

70+阅读 · 2019年5月14日

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

全球人工智能

13+阅读 · 2019年4月30日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

基于深度学习的目标检测算法剖析与实现【附PPT与视频资料】

基于深度学习的目标检测算法剖析与实现【附PPT与视频资料】

人工智能前沿讲习班

12+阅读 · 2018年12月25日

基于深度学习的目标检测算法综述

基于深度学习的目标检测算法综述

AI研习社

15+阅读 · 2018年4月25日

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

专知

12+阅读 · 2018年1月12日

相关论文

Efficient Test-Time Scaling for Small Vision-Language Models

Arxiv

0+阅读 · 2月16日

MDAFNet: Multiscale Differential Edge and Adaptive Frequency Guided Network for Infrared Small Target Detection

Arxiv

0+阅读 · 2月13日

Adaptive Image Zoom-in with Bounding Box Transformation for UAV Object Detection

Arxiv

0+阅读 · 2月7日

Enhanced Detection of Tiny Objects in Aerial Images

Arxiv

0+阅读 · 2月2日

SPIRIT: Adapting Vision Foundation Models for Unified Single- and Multi-Frame Infrared Small Target Detection

Arxiv

0+阅读 · 2月2日

UPLiFT: Efficient Pixel-Dense Feature Upsampling with Local Attenders

Arxiv

0+阅读 · 1月25日

DCCS-Det: Directional Context and Cross-Scale-Aware Detector for Infrared Small Target

Arxiv

0+阅读 · 1月23日

FeedbackSTS-Det: Sparse Frames-Based Spatio-Temporal Semantic Feedback Network for Infrared Small Target Detection

Arxiv

0+阅读 · 1月21日

DFIR-DETR: Frequency Domain Enhancement and Dynamic Feature Aggregation for Cross-Scene Small Object Detection

Arxiv

0+阅读 · 1月15日

EfficientFSL: Enhancing Few-Shot Classification via Query-Only Tuning in Vision Transformers

Arxiv

0+阅读 · 1月13日

相关基金

基于共性视觉特征与反馈机制的SAR图像目标检测方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于视觉特性的目标检测算法研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于空域联合时频分解的海面慢速小目标检测新方法

国家自然科学基金

3+阅读 · 2015年12月31日

基于语义模型的高分辨率卫星遥感图像人造目标检测方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向无人机基于在线场景建模的室外目标检测与跟踪方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

无人机视频快速4-D重建及时空自适应索引方法研究

国家自然科学基金

8+阅读 · 2015年12月31日

无人机自主导航中LiDAR点云与图像特征提取与配准方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于自学习对比度视觉注意模型和自适应深度特征的无分类目标检测

国家自然科学基金

2+阅读 · 2015年12月31日

融合目标感知与对比度的图像和视频显著性检测技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于字典学习的小样本高光谱遥感图像稀疏表示分类精度研究与应用

国家自然科学基金

3+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员