Fine-grained aerial object detection, driven by the intrinsic granularity of real-world object categories, is crucial for advanced scene understanding in remote sensing. Existing methods largely inherit the paradigm of coarse-grained object detection, relying solely on single-label supervision and thus struggling to distinguish model-level categories with subtle structural differences. However, for each specific model (e.g., Boeing 787), structured prior knowledge such as attributes and hierarchies offers discriminative semantics across multiple granularities. Motivated by this, we present ExpertDet, a scheme that incorporates expert-informed cues to enhance fine-grained aerial object detection. Specifically, we design Vision-aware Masked Attribute Modeling (VMAM), which aligns attribute semantics with visual structures by reconstructing randomly masked attributes from visual cues, enabling the detector to capture subtle structural distinctions. We further propose Hierarchical Visual Instance Promotion (HierVIP), which builds a visual prototype tree based on hierarchical relations and imposes taxonomy-aware constraints to preserve cross-level semantic continuity while enhancing category discrimination. Moreover, we curate a new fine-grained object detection benchmark for Precise recognition of model-specific Ships and Planes from aerial imagery, PSP, covering 106 ship classes and 30 airplane models, respectively, featuring the most extensive collection of model-specific categories among existing aerial object detection datasets to date. We benchmark state-of-the-art object detection algorithms on the PSP benchmark. Extensive evaluation demonstrates that ExpertDet consistently outperforms other fine-grained competitors across hierarchy levels. The dataset, benchmark, and code are available at https://nnnnerd.github.io/PSP-Benchmark/.


翻译:细粒度航空目标检测由真实世界目标类别固有的粒度驱动,对于遥感领域的深度场景理解至关重要。现有方法大多继承了粗粒度目标检测的范式,仅依赖单标签监督,因此难以区分具有细微结构差异的型号级类别。然而,针对每个具体型号(如波音787),属性和层级等结构化先验知识提供了跨多粒度的判别性语义。受此启发,我们提出ExpertDet,一种融合专家先验知识以增强细粒度航空目标检测的方案。具体而言,我们设计了视觉感知掩码属性建模(VMAM),通过从视觉线索中重建随机掩码属性,使属性语义与视觉结构对齐,从而使检测器能够捕获细微的结构差异。我们进一步提出层次视觉实例增强(HierVIP),该方法基于层级关系构建视觉原型树,并施加分类学感知约束,以在增强类别判别性的同时保持跨层级语义连续性。此外,我们构建了一个新的细粒度目标检测基准——PSP(精确识别航空影像中特定型号舰船与飞机),涵盖106个舰船类别和30个飞机型号,是现有航空目标检测数据集中型号级类别最为丰富的数据集。我们在PSP基准上评估了最先进的目标检测算法。大量实验表明,ExpertDet在层级结构各层次上均一致优于其他细粒度竞争方法。数据集、基准测试及代码已开源:https://nnnnerd.github.io/PSP-Benchmark/。

0
下载
关闭预览

相关内容

基于深度学习模型的图像军事目标检测
专知会员服务
27+阅读 · 2025年10月18日
基于深度学习的无人机目标检测研究综述
专知会员服务
108+阅读 · 2023年6月22日
遥感影像小目标检测研究进展
专知会员服务
54+阅读 · 2023年3月17日
无人机视角下的目标检测研究进展
专知会员服务
127+阅读 · 2023年1月22日
细粒度图像分类的深度学习方法
专知会员服务
43+阅读 · 2021年10月18日
深度学习目标检测方法综述
专知会员服务
280+阅读 · 2020年8月1日
专知会员服务
164+阅读 · 2020年4月21日
一文读懂目标检测:R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD
七月在线实验室
11+阅读 · 2018年7月18日
基于深度学习的目标检测算法综述
AI研习社
15+阅读 · 2018年4月25日
深度学习时代的目标检测算法
炼数成金订阅号
40+阅读 · 2018年3月19日
基于区域的目标检测——细粒度
计算机视觉战队
14+阅读 · 2018年2月1日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
VIP会员
最新内容
ICML 2026 | CFPO:用反事实策略优化提升多模态推理
专知会员服务
1+阅读 · 今天14:45
综述 | 世界动作模型:少做梦,多行动
专知会员服务
1+阅读 · 今天14:43
美以伊冲突:无人机与人工智能的运用
专知会员服务
3+阅读 · 今天14:31
《特种部队在透明战场中的生存力》最新报告
专知会员服务
2+阅读 · 今天14:11
《人工智能生成的零日漏洞:对未来作战的影响》
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关VIP内容
基于深度学习模型的图像军事目标检测
专知会员服务
27+阅读 · 2025年10月18日
基于深度学习的无人机目标检测研究综述
专知会员服务
108+阅读 · 2023年6月22日
遥感影像小目标检测研究进展
专知会员服务
54+阅读 · 2023年3月17日
无人机视角下的目标检测研究进展
专知会员服务
127+阅读 · 2023年1月22日
细粒度图像分类的深度学习方法
专知会员服务
43+阅读 · 2021年10月18日
深度学习目标检测方法综述
专知会员服务
280+阅读 · 2020年8月1日
专知会员服务
164+阅读 · 2020年4月21日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员