Unmanned Aerial Vehicle (UAV) applications have become increasingly prevalent in aerial photography and object recognition. However, there are major challenges to accurately capturing small targets in object detection due to the imbalanced scale and the blurred edges. To address these issues, boundary and position information mining (BPIM) framework is proposed for capturing object edge and location cues. The proposed BPIM includes position information guidance (PIG) module for obtaining location information, boundary information guidance (BIG) module for extracting object edge, cross scale fusion (CSF) module for gradually assembling the shallow layer image feature, three feature fusion (TFF) module for progressively combining position and boundary information, and adaptive weight fusion (AWF) module for flexibly merging the deep layer semantic feature. Therefore, BPIM can integrate boundary, position, and scale information in image for small object detection using attention mechanisms and cross-scale feature fusion strategies. Furthermore, BPIM not only improves the discrimination of the contextual feature by adaptive weight fusion with boundary, but also enhances small object perceptions by cross-scale position fusion. On the VisDrone2021, DOTA1.0, and WiderPerson datasets, experimental results show the better performances of BPIM compared to the baseline Yolov5-P2, and obtains the promising performance in the state-of-the-art methods with comparable computation load.


翻译:无人机应用在航拍摄影与目标识别领域日益普及。然而,由于目标尺度不平衡与边缘模糊,在目标检测中精准捕捉小目标仍面临重大挑战。为解决这些问题,本文提出边界与位置信息挖掘框架,用于捕获目标边缘与位置线索。所提出的BPIM框架包含:用于获取位置信息的位置信息引导模块、用于提取目标边缘的边界信息引导模块、用于逐层整合浅层图像特征的跨尺度融合模块、用于渐进融合位置与边界信息的三特征融合模块,以及用于灵活融合深层语义特征的自适应权重融合模块。因此,BPIM能够通过注意力机制与跨尺度特征融合策略,整合图像中的边界、位置与尺度信息以实现小目标检测。此外,BPIM不仅通过边界信息的自适应权重融合提升了上下文特征的判别力,还通过跨尺度位置融合增强了对小目标的感知能力。在VisDrone2021、DOTA1.0和WiderPerson数据集上的实验结果表明,BPIM相较于基线模型Yolov5-P2具有更优性能,并在计算负载相当的情况下取得了与前沿方法相媲美的优异表现。

0
下载
关闭预览

相关内容

面向无人机视角的多源信息融合目标检测
专知会员服务
21+阅读 · 2025年2月2日
利用人工智能提升战术级目标定位能力
专知会员服务
33+阅读 · 2024年12月4日
基于深度学习的小目标检测基准研究进展
专知会员服务
29+阅读 · 2024年4月30日
基于深度学习的无人机目标检测研究综述
专知会员服务
106+阅读 · 2023年6月22日
遥感影像小目标检测研究进展
专知会员服务
54+阅读 · 2023年3月17日
面向无人机的视觉目标跟踪算法:综述与展望
专知会员服务
81+阅读 · 2023年2月28日
无人机视角下的目标检测研究进展
专知会员服务
126+阅读 · 2023年1月22日
小目标检测研究综述
专知会员服务
150+阅读 · 2022年8月27日
专知会员服务
125+阅读 · 2021年4月29日
编辑推荐 | 红外弱小目标检测算法综述
中国图象图形学报
21+阅读 · 2020年10月12日
基于深度学习的目标检测算法剖析与实现【附PPT与视频资料】
人工智能前沿讲习班
12+阅读 · 2018年12月25日
基于深度学习的目标检测算法综述
AI研习社
15+阅读 · 2018年4月25日
实战|手把手教你实现图象边缘检测!
全球人工智能
10+阅读 · 2018年1月19日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2011年12月31日
VIP会员
相关VIP内容
面向无人机视角的多源信息融合目标检测
专知会员服务
21+阅读 · 2025年2月2日
利用人工智能提升战术级目标定位能力
专知会员服务
33+阅读 · 2024年12月4日
基于深度学习的小目标检测基准研究进展
专知会员服务
29+阅读 · 2024年4月30日
基于深度学习的无人机目标检测研究综述
专知会员服务
106+阅读 · 2023年6月22日
遥感影像小目标检测研究进展
专知会员服务
54+阅读 · 2023年3月17日
面向无人机的视觉目标跟踪算法:综述与展望
专知会员服务
81+阅读 · 2023年2月28日
无人机视角下的目标检测研究进展
专知会员服务
126+阅读 · 2023年1月22日
小目标检测研究综述
专知会员服务
150+阅读 · 2022年8月27日
专知会员服务
125+阅读 · 2021年4月29日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员