In automotive sensor fusion systems, smart sensors and Vehicle-to-Everything (V2X) modules are commonly utilized. Sensor data from these systems are typically available only as processed object lists rather than raw sensor data from traditional sensors. Instead of processing other raw data separately and then fusing them at the object level, we propose an end-to-end cross-level fusion concept with Transformer, which integrates highly abstract object list information with raw camera images for 3D object detection. Object lists are fed into a Transformer as denoising queries and propagated together with learnable queries through the latter feature aggregation process. Additionally, a deformable Gaussian mask, derived from the positional and size dimensional priors from the object lists, is explicitly integrated into the Transformer decoder. This directs attention toward the target area of interest and accelerates model training convergence. Furthermore, as there is no public dataset containing object lists as a standalone modality, we propose an approach to generate pseudo object lists from ground-truth bounding boxes by simulating state noise and false positives and negatives. As the first work to conduct cross-level fusion, our approach shows substantial performance improvements over the vision-based baseline on the nuScenes dataset. It demonstrates its generalization capability over diverse noise levels of simulated object lists and real detectors.


翻译:在汽车传感器融合系统中,智能传感器与车联网(V2X)模块被广泛采用。此类系统提供的传感器数据通常仅以处理后对象列表的形式存在,而非传统传感器的原始数据。不同于分别处理其他原始数据再在对象层级进行融合的传统方法,我们提出了一种基于Transformer的端到端跨层级融合方案,将高度抽象的对象列表信息与原始相机图像相结合,以实现三维目标检测。对象列表以去噪查询的形式输入Transformer,并与可学习查询共同在后续特征聚合过程中传播。此外,我们基于对象列表中的位置与尺寸维度先验,构建了可变形高斯掩码,并将其显式集成到Transformer解码器中。该设计能够将注意力引导至目标感兴趣区域,并加速模型训练收敛。进一步地,由于目前缺乏包含对象列表作为独立模态的公开数据集,我们提出一种从真实标注边界框生成伪对象列表的方法,通过模拟状态噪声及误检、漏检来实现。作为首个开展跨层级融合的研究,我们的方法在nuScenes数据集上相比基于视觉的基线模型取得了显著的性能提升,并在模拟对象列表的不同噪声水平及真实检测器上展现了良好的泛化能力。

0
下载
关闭预览

相关内容

自动驾驶中的3D目标检测研究进展
专知会员服务
11+阅读 · 2025年7月20日
《Transformer小目标检测》最新综述
专知会员服务
60+阅读 · 2023年9月13日
《边界监视多传感器融合系统中的目标跟踪》
专知会员服务
52+阅读 · 2023年6月11日
【Google】高效Transformer综述,Efficient Transformers: A Survey
专知会员服务
66+阅读 · 2022年3月17日
【Tutorial】计算机视觉中的Transformer,98页ppt
专知
21+阅读 · 2021年10月25日
基于深度学习的数据融合方法研究综述
专知
37+阅读 · 2020年12月10日
多图带你读懂 Transformers 的工作原理
AI研习社
10+阅读 · 2019年3月18日
国家自然科学基金
9+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
VIP会员
最新内容
美陆军设想无人系统司令部
专知会员服务
2+阅读 · 4月15日
【博士论文】已对齐人工智能系统的持久脆弱性
扭曲还是编造?视频大语言模型幻觉研究综述
专知会员服务
0+阅读 · 4月15日
《采用系统思维应对混合战争》125页
专知会员服务
3+阅读 · 4月15日
战争机器学习:数据生态系统构建(155页)
专知会员服务
7+阅读 · 4月15日
内省扩散语言模型
专知会员服务
6+阅读 · 4月14日
国外反无人机系统与技术动态
专知会员服务
4+阅读 · 4月14日
相关基金
国家自然科学基金
9+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员