Real-time object detection has advanced rapidly in recent years. The YOLO series of detectors is among the most well-known CNN-based object detection models and cannot be overlooked. The latest version, YOLOv26, was recently released, while YOLOv12 achieved state-of-the-art (SOTA) performance with 55.2 mAP on the COCO val2017 dataset. Meanwhile, transformer-based object detection models, also known as DEtection TRansformer (DETR), have demonstrated impressive performance. RT-DETR is an outstanding model that outperformed the YOLO series in both speed and accuracy when it was released. Its successor, RT-DETRv2, achieved 53.4 mAP on the COCO val2017 dataset. However, despite their remarkable performance, all these models let information to slip away. They primarily focus on the features of foreground objects while neglecting the contextual information provided by the background. We believe that background information can significantly aid object detection tasks. For example, cars are more likely to appear on roads rather than in offices, while wild animals are more likely to be found in forests or remote areas rather than on busy streets. To address this gap, we propose an object detection model called Association DETR, which achieves state-of-the-art results compared to other object detection models on the COCO val2017 dataset.


翻译:近年来,实时目标检测技术发展迅速。YOLO系列检测器作为最著名的基于CNN的目标检测模型之一,其地位不容忽视。最新版本YOLOv26近期发布,而YOLOv12在COCO val2017数据集上以55.2 mAP取得了最先进的性能表现。与此同时,基于Transformer的目标检测模型(亦称DEtection TRansformer,DETR)也展现出卓越性能。RT-DETR作为杰出代表,在发布时即在速度与精度上全面超越YOLO系列。其继任者RT-DETRv2在COCO val2017数据集上实现了53.4 mAP。然而,尽管这些模型性能卓越,却都存在信息流失的问题。它们主要关注前景目标的特征,而忽视了背景提供的上下文信息。我们认为背景信息能显著提升目标检测任务的性能。例如,汽车更可能出现在道路而非办公室环境中,野生动物更可能出现在森林或偏远地区而非繁华街道。为弥补这一缺陷,我们提出名为Association DETR的目标检测模型,该模型在COCO val2017数据集上相较于其他目标检测模型取得了最先进的性能。

0
下载
关闭预览

相关内容

目标检测,也叫目标提取,是一种与计算机视觉和图像处理有关的计算机技术,用于检测数字图像和视频中特定类别的语义对象(例如人,建筑物或汽车)的实例。深入研究的对象检测领域包括面部检测和行人检测。 对象检测在计算机视觉的许多领域都有应用,包括图像检索和视频监视。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
基于深度学习模型的图像军事目标检测
专知会员服务
25+阅读 · 2025年10月18日
《基于深度学习模型的图像军事目标检测》
专知会员服务
29+阅读 · 2025年6月28日
YOLOv1 到 YOLOv10:最快且最准确的实时目标检测系统
专知会员服务
42+阅读 · 2024年8月22日
《Transformer小目标检测》最新综述
专知会员服务
60+阅读 · 2023年9月13日
从锚点到关键点:目标检测方法最新进展(2019)
GAN生成式对抗网络
14+阅读 · 2019年8月22日
从锚点到关键点,最新的目标检测方法发展趋势
计算机视觉life
17+阅读 · 2019年8月20日
【下载】PyTorch 实现的YOLO v2目标检测算法
专知
15+阅读 · 2017年12月27日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2月5日
VIP会员
最新内容
最新“指挥控制”领域出版物合集(16份)
专知会员服务
6+阅读 · 4月12日
面向军事作战需求开发的人工智能(RAIMOND)
专知会员服务
12+阅读 · 4月12日
远程空中优势:新一代超视距导弹的兴起
专知会员服务
2+阅读 · 4月12日
大语言模型溯因推理的统一分类学与综述
专知会员服务
2+阅读 · 4月12日
相关VIP内容
基于深度学习模型的图像军事目标检测
专知会员服务
25+阅读 · 2025年10月18日
《基于深度学习模型的图像军事目标检测》
专知会员服务
29+阅读 · 2025年6月28日
YOLOv1 到 YOLOv10:最快且最准确的实时目标检测系统
专知会员服务
42+阅读 · 2024年8月22日
《Transformer小目标检测》最新综述
专知会员服务
60+阅读 · 2023年9月13日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员