Understanding road scenes is essential for autonomous driving, as it enables systems to interpret visual surroundings to aid in effective decision-making. We present Roadscapes, a multitask multimodal dataset consisting of upto 9,000 images captured in diverse Indian driving environments, accompanied by manually verified bounding boxes. To facilitate scalable scene understanding, we employ rule-based heuristics to infer various scene attributes, which are subsequently used to generate question-answer (QA) pairs for tasks such as object grounding, reasoning, and scene understanding. The dataset includes a variety of scenes from urban and rural India, encompassing highways, service roads, village paths, and congested city streets, captured in both daytime and nighttime settings. Roadscapes has been curated to advance research on visual scene understanding in unstructured environments. In this paper, we describe the data collection and annotation process, present key dataset statistics, and provide initial baselines for image QA tasks using vision-language models.


翻译:理解道路场景对于自动驾驶至关重要,它使系统能够解释视觉环境以辅助有效决策。本文提出Roadscapes数据集,这是一个多任务多模态数据集,包含在多样化印度驾驶环境中采集的约9,000张图像,并配有经人工验证的边界框。为促进可扩展的场景理解,我们采用基于规则的启发式方法推断各类场景属性,并利用这些属性生成面向目标定位、推理和场景理解等任务的问答对。数据集涵盖印度城乡多种场景,包括高速公路、辅路、乡村道路和拥堵的城市街道,并包含日间与夜间拍摄条件。Roadscapes数据集旨在推动非结构化环境中视觉场景理解的研究。本文详细描述了数据采集与标注流程,展示了关键数据集统计信息,并利用视觉-语言模型为图像问答任务提供了初步基线结果。

0
下载
关闭预览

相关内容

数据集,又称为资料集、数据集合或资料集合,是一种由数据所组成的集合。
Data set(或dataset)是一个数据的集合,通常以表格形式出现。每一列代表一个特定变量。每一行都对应于某一成员的数据集的问题。它列出的价值观为每一个变量,如身高和体重的一个物体或价值的随机数。每个数值被称为数据资料。对应于行数,该数据集的数据可能包括一个或多个成员。
深度多模态数据融合
专知会员服务
55+阅读 · 2024年11月9日
自动驾驶开源数据体系:现状与未来
专知会员服务
41+阅读 · 2024年1月28日
《多模态3D场景理解》最新综述
专知会员服务
191+阅读 · 2023年10月28日
数据受限条件下的多模态处理技术综述
专知
22+阅读 · 2022年7月16日
基于车路协同的群体智能协同
智能交通技术
10+阅读 · 2019年1月23日
智能交通大数据最新论文综述-附PDF下载
专知
22+阅读 · 2019年1月21日
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
VIP会员
相关VIP内容
深度多模态数据融合
专知会员服务
55+阅读 · 2024年11月9日
自动驾驶开源数据体系:现状与未来
专知会员服务
41+阅读 · 2024年1月28日
《多模态3D场景理解》最新综述
专知会员服务
191+阅读 · 2023年10月28日
相关基金
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员