Object detection in unmanned aerial vehicle (UAV) images remains a highly challenging task, primarily caused by the complexity of background noise and the imbalance of target scales. Traditional methods easily struggle to effectively separate objects from intricate backgrounds and fail to fully leverage the rich multi-scale information contained within images. To address these issues, we have developed a synergistic feature fusion network (SFFNet) with dual-domain edge enhancement specifically tailored for object detection in UAV images. Firstly, the multi-scale dynamic dual-domain coupling (MDDC) module is designed. This component introduces a dual-driven edge extraction architecture that operates in both the frequency and spatial domains, enabling effective decoupling of multi-scale object edges from background noise. Secondly, to further enhance the representation capability of the model's neck in terms of both geometric and semantic information, a synergistic feature pyramid network (SFPN) is proposed. SFPN leverages linear deformable convolutions to adaptively capture irregular object shapes and establishes long-range contextual associations around targets through the designed wide-area perception module (WPM). Moreover, to adapt to the various applications or resource-constrained scenarios, six detectors of different scales (N/S/M/B/L/X) are designed. Experiments on two challenging aerial datasets (VisDrone and UAVDT) demonstrate the outstanding performance of SFFNet-X, achieving 36.8 AP and 20.6 AP, respectively. The lightweight models (N/S) also maintain a balance between detection accuracy and parameter efficiency. The code will be available at https://github.com/CQNU-ZhangLab/SFFNet.


翻译:无人机图像中的目标检测仍是一项极具挑战性的任务,主要源于背景噪声的复杂性和目标尺度的不平衡性。传统方法难以有效分离复杂背景中的目标,且无法充分利用图像中包含的丰富多尺度信息。为解决上述问题,我们开发了一种面向无人机图像目标检测的双域边缘增强协同特征融合网络(SFFNet)。首先,设计了多尺度动态双域耦合(MDDC)模块,该组件引入了一种在频域和空间域协同工作的双驱动边缘提取架构,能够有效从背景噪声中解耦多尺度目标边缘。其次,为进一步增强模型颈部在几何和语义信息方面的表征能力,提出了协同特征金字塔网络(SFPN)。SFPN利用线性可变形卷积自适应捕捉不规则目标形状,并通过所设计的大范围感知模块(WPM)建立目标周围的远距离上下文关联。此外,为适配不同应用场景或资源受限环境,我们设计了六种不同规模的检测器(N/S/M/B/L/X)。在两个具有挑战性的航拍数据集(VisDrone和UAVDT)上的实验表明,SFFNet-X分别取得了36.8 AP和20.6 AP的优异性能。轻量级模型(N/S)在检测精度与参数量效率之间也保持了良好平衡。代码将于https://github.com/CQNU-ZhangLab/SFFNet开源。

0
下载
关闭预览

相关内容

基于声学的无人机检测技术综述
专知会员服务
17+阅读 · 5月30日
面向无人机视角的多源信息融合目标检测
专知会员服务
22+阅读 · 2025年2月2日
基于四旋翼无人机的协同跟踪系统
专知会员服务
19+阅读 · 2024年9月25日
无人机集群协同搜索研究综述
专知会员服务
80+阅读 · 2024年3月4日
基于深度学习的无人机目标检测研究综述
专知会员服务
108+阅读 · 2023年6月22日
面向无人机的视觉目标跟踪算法:综述与展望
专知会员服务
81+阅读 · 2023年2月28日
无人机视角下的目标检测研究进展
专知会员服务
127+阅读 · 2023年1月22日
一文读懂目标检测:R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD
七月在线实验室
11+阅读 · 2018年7月18日
基于深度学习的目标检测算法综述
AI研习社
15+阅读 · 2018年4月25日
综述:深度学习时代的目标检测算法
极市平台
27+阅读 · 2018年3月17日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
29+阅读 · 2011年12月31日
VIP会员
最新内容
21世纪的无人机战争
专知会员服务
0+阅读 · 22分钟前
《量子技术的军事任务技术适配与利用》
专知会员服务
0+阅读 · 36分钟前
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关VIP内容
基于声学的无人机检测技术综述
专知会员服务
17+阅读 · 5月30日
面向无人机视角的多源信息融合目标检测
专知会员服务
22+阅读 · 2025年2月2日
基于四旋翼无人机的协同跟踪系统
专知会员服务
19+阅读 · 2024年9月25日
无人机集群协同搜索研究综述
专知会员服务
80+阅读 · 2024年3月4日
基于深度学习的无人机目标检测研究综述
专知会员服务
108+阅读 · 2023年6月22日
面向无人机的视觉目标跟踪算法:综述与展望
专知会员服务
81+阅读 · 2023年2月28日
无人机视角下的目标检测研究进展
专知会员服务
127+阅读 · 2023年1月22日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
17+阅读 · 2012年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
29+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员