Fine-grained visual categorization (FGVC) is a challenging but significant task in computer vision, which aims to recognize different sub-categories of birds, cars, airplanes, etc. Among them, recognizing models of different cars has significant application value in autonomous driving, traffic surveillance and scene understanding, which has received considerable attention in the past few years. However, Stanford-Car, the most widely used fine-grained dataset for car recognition, only has 196 different categories and only includes vehicle models produced earlier than 2013. Due to the rapid advancements in the automotive industry during recent years, the appearances of various car models have become increasingly intricate and sophisticated. Consequently, the previous Stanford-Car dataset fails to capture this evolving landscape and cannot satisfy the requirements of automotive industry. To address these challenges, in our paper, we introduce Car-1000, a large-scale dataset designed specifically for fine-grained visual categorization of diverse car models. Car-1000 encompasses vehicles from 166 different automakers, spanning a wide range of 1000 distinct car models. Additionally, we have reproduced several state-of-the-art FGVC methods on the Car-1000 dataset, establishing a new benchmark for research in this field. We hope that our work will offer a fresh perspective for future FGVC researchers. Our dataset is available at https://github.com/toggle1995/Car-1000.


翻译:细粒度视觉分类(FGVC)是计算机视觉领域一项具有挑战性且意义重大的任务,其目标在于识别鸟类、汽车、飞机等不同对象的精细子类别。其中,对不同车型的识别在自动驾驶、交通监控和场景理解中具有重要的应用价值,在过去几年中受到了广泛关注。然而,目前最广泛使用的汽车细粒度识别数据集Stanford-Car仅包含196个不同类别,且仅收录了2013年之前生产的车型。由于近年来汽车工业的快速发展,各类车型的外观设计日趋复杂与精细。因此,原有的Stanford-Car数据集已无法反映这一发展现状,难以满足汽车行业的需求。为应对这些挑战,本文提出了Car-1000,这是一个专门为多样化车型的细粒度视觉分类而设计的大规模数据集。Car-1000涵盖了来自166家不同汽车制造商的车辆,包含多达1000种不同的车型。此外,我们在Car-1000数据集上复现了多种先进的FGVC方法,为该领域的研究建立了新的基准。我们希望这项工作能为未来的FGVC研究者提供新的视角。我们的数据集发布于 https://github.com/toggle1995/Car-1000。

0
下载
关闭预览

相关内容

数据集,又称为资料集、数据集合或资料集合,是一种由数据所组成的集合。
Data set(或dataset)是一个数据的集合,通常以表格形式出现。每一列代表一个特定变量。每一行都对应于某一成员的数据集的问题。它列出的价值观为每一个变量,如身高和体重的一个物体或价值的随机数。每个数值被称为数据资料。对应于行数,该数据集的数据可能包括一个或多个成员。
《基于传感器的机器学习车辆分类》最新170页
专知会员服务
25+阅读 · 2025年3月17日
用于识别任务的视觉 Transformer 综述
专知会员服务
75+阅读 · 2023年2月25日
细粒度图像分类的深度学习方法
专知会员服务
43+阅读 · 2021年10月18日
基于深度神经网络的高效视觉识别研究进展与新方向
专知会员服务
40+阅读 · 2021年8月31日
【CVPR2021】深度学习细粒度视觉分析
专知会员服务
36+阅读 · 2021年6月23日
【旷视出品】细粒度图像分析综述
专知
15+阅读 · 2019年7月11日
基于深度学习的图像超分辨率最新进展与趋势【附PDF】
人工智能前沿讲习班
15+阅读 · 2019年2月27日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员