Robust Fusion of Object-Level V2X for Learned 3D Object Detection - 专知论文

会员服务 ·

0

Robust Fusion of Object-Level V2X for Learned 3D Object Detection

翻译：面向所学3D目标检测的鲁棒对象级V2X融合

Lukas Ostendorf,Lennart Reiher,Onn Haran,Lutz Eckstein

from arxiv, Accepted at IEEE VTC 2026-Spring, 7 pages

Perception for automated driving is largely based on onboard environmental sensors, such as cameras and radar, which are cost-effective but limited by line-of-sight and field-of-view constraints. These inherent limitations may cause onboard perception to fail under occlusions or poor visibility conditions. In parallel, cooperative awareness via vehicle-to-everything (V2X) communication is becoming increasingly available, enabling vehicles and infrastructure to share their own state as object-level information that complements onboard perception. In this work, we study how such V2X information can be integrated into 3D object detection and how robust the resulting system is to realistic V2X imperfections. Using the nuScenes dataset, we emulate object-level cooperative awareness messages from ground truth, injecting controlled noise and object dropout to mimic real-world conditions such as latency, localization errors, and low V2X penetration rates. We convert these messages into a dedicated bird's-eye view (BEV) input and fuse them into a BEVFusion-style detector. Our results demonstrate that while object-level cooperative information can substantially improve detection performance, achieving an NDS of 0.80 under favorable conditions, models trained on idealized data become fragile and over-reliant on V2X. Conversely, our proposed noise-aware training strategy, coupled with explicit confidence encoding, enhances robustness, maintaining performance gains even under severe noise and reduced V2X penetration.

翻译：自动驾驶的感知主要依赖于车载环境传感器（如摄像头和雷达），这些传感器成本低廉，但受限于视距和视野范围约束。这些固有缺陷可能导致车载感知在遮挡或低能见度条件下失效。与此同时，通过车联网（V2X）通信实现的协同感知正日益普及，使车辆与基础设施能够以对象级信息的形式共享自身状态，从而补充车载感知。本研究探讨如何将此类V2X信息整合至三维目标检测中，并评估该系统对实际V2X非理想特性的鲁棒性。我们基于nuScenes数据集，利用真实标注生成对象级协同感知信息，通过注入可控噪声和对象丢失来模拟现实场景中的时延、定位误差及低V2X渗透率。我们将这些信息转化为专用鸟瞰图（BEV）输入，并融合至BEVFusion风格检测器中。结果表明：对象级协同信息在理想条件下可显著提升检测性能（NDS达0.80），但基于理想化数据训练的模型会变得脆弱且过度依赖V2X。相反，我们提出的噪声感知训练策略结合显式置信度编码，增强了鲁棒性，即便在严重噪声和低V2X渗透率下仍能保持性能增益。

0

相关内容

自动驾驶中的3D目标检测研究进展

自动驾驶中的3D目标检测研究进展

专知会员服务

12+阅读 · 2025年7月20日

【HKUST博士论文】可扩展的基于视觉的 3D 物体检测与单目深度估计用于自动驾驶

【HKUST博士论文】可扩展的基于视觉的 3D 物体检测与单目深度估计用于自动驾驶

专知会员服务

19+阅读 · 2025年1月20日

【伯克利博士论文】高效的自动驾驶3D视觉，108页pdf

【伯克利博士论文】高效的自动驾驶3D视觉，108页pdf

专知会员服务

24+阅读 · 2024年9月1日

【博士论文】鲁棒深度学习自动驾驶，160页pdf

【博士论文】鲁棒深度学习自动驾驶，160页pdf

专知会员服务

40+阅读 · 2022年11月17日

港中文发布最新《自动驾驶三维物体检测》综述论文，32页pdf涵盖367篇文献全面概述基于激光雷达、基于相机和多模态的物体检测进展

港中文发布最新《自动驾驶三维物体检测》综述论文，32页pdf涵盖367篇文献全面概述基于激光雷达、基于相机和多模态的物体检测进展

专知会员服务

45+阅读 · 2022年6月23日

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

专知会员服务

18+阅读 · 2022年3月19日

【华中科技大学白翔教授】基于多模态融合的三维目标检测

【华中科技大学白翔教授】基于多模态融合的三维目标检测

专知会员服务

41+阅读 · 2022年3月17日

悉尼大学发布首篇《基于图像的自动驾驶三维目标检测》研究进展，阐述3D检测数据、方法与挑战

悉尼大学发布首篇《基于图像的自动驾驶三维目标检测》研究进展，阐述3D检测数据、方法与挑战

专知会员服务

27+阅读 · 2022年2月8日

【NeurIPS2021】多模态虚拟点三维检测

【NeurIPS2021】多模态虚拟点三维检测

专知会员服务

19+阅读 · 2021年11月16日

【CIKM2019 Tutorial】Realtime object detection via deep learning-based pipelines(通过基于深度学习的管道实现实时对象检测)，附教程PDF免费下载

【CIKM2019 Tutorial】Realtime object detection via deep learning-based pipelines(通过基于深度学习的管道实现实时对象检测)，附教程PDF免费下载

专知会员服务

19+阅读 · 2019年11月3日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

自动驾驶汽车技术路线简介

自动驾驶汽车技术路线简介

智能交通技术

15+阅读 · 2019年4月25日

何恺明团队最新研究：3D目标检测新框架VoteNet，两大数据集刷新最高精度

何恺明团队最新研究：3D目标检测新框架VoteNet，两大数据集刷新最高精度

极市平台

29+阅读 · 2019年4月25日

车路协同应用场景分析

车路协同应用场景分析

智能交通技术

24+阅读 · 2019年4月13日

基于深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

基于深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

36大数据

14+阅读 · 2019年3月16日

【浅析】自动驾驶汽车传感器融合系统及多传感器数据融合算法浅析

【浅析】自动驾驶汽车传感器融合系统及多传感器数据融合算法浅析

中国自动化学会

15+阅读 · 2018年7月5日

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

商汤科技

14+阅读 · 2018年6月2日

【深度学习】增加检测类别？这是一份目标检测的一般指南

【深度学习】增加检测类别？这是一份目标检测的一般指南

产业智能官

13+阅读 · 2018年5月27日

车辆目标检测

车辆目标检测

数据挖掘入门与实战

30+阅读 · 2018年3月30日

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

炼数成金订阅号

11+阅读 · 2017年9月20日

无人驾驶中4D场景实时解析算法研究

国家自然科学基金

12+阅读 · 2017年12月31日

复合型移动群智感知关键技术研究

国家自然科学基金

9+阅读 · 2017年12月31日

面向传感网的软件定义测量技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

混合车载网络环境下的节点部署及协同内容分发研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于机器类型通信的车联网群组安全协议研究

国家自然科学基金

2+阅读 · 2015年12月31日

场景深度关系下的视频遮挡目标检测

国家自然科学基金

1+阅读 · 2015年12月31日

基于框架提升变换的多源图像融合研究

国家自然科学基金

2+阅读 · 2015年12月31日

融合目标感知与对比度的图像和视频显著性检测技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

多特征融合与集成学习的城市高分辨率遥感影像变化检测

国家自然科学基金

4+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

Leveraging Previous-Traversal Point Cloud Map Priors for Camera-Based 3D Object Detection and Tracking

Arxiv

0+阅读 · 4月28日

Cross-Modal Phantom: Coordinated Camera-LiDAR Spoofing Against Multi-Sensor Fusion in Autonomous Vehicles

Arxiv

0+阅读 · 4月23日

Robust Real-Time Coordination of CAVs: A Distributed Optimization Framework under Uncertainty

Arxiv

0+阅读 · 4月17日

AD4AD: Benchmarking Visual Anomaly Detection Models for Safer Autonomous Driving

Arxiv

0+阅读 · 4月16日

CADENCE: Context-Adaptive Depth Estimation for Navigation and Computational Efficiency

Arxiv

0+阅读 · 4月8日

DriveTok: 3D Driving Scene Tokenization for Unified Multi-View Reconstruction and Understanding

Arxiv

0+阅读 · 3月19日

Reconstruction Matters: Learning Geometry-Aligned BEV Representation through 3D Gaussian Splatting

Arxiv

0+阅读 · 3月19日

FOMO-3D: Using Vision Foundation Models for Long-Tailed 3D Object Detection

Arxiv

0+阅读 · 3月9日

Wild-Drive: Off-Road Scene Captioning and Path Planning via Robust Multi-modal Routing and Efficient Large Language Model

Arxiv

0+阅读 · 2月28日

RADE-Net: Robust Attention Network for Radar-Only Object Detection in Adverse Weather

Arxiv

0+阅读 · 2月23日

VIP会员

文章信息

相关主题

最新内容

《反无人机蜂群：有人-无人协同防御场景下的编队重构分析》

《反无人机蜂群：有人-无人协同防御场景下的编队重构分析》

专知会员服务

4+阅读 · 今天12:53

《史诗怒火/咆哮雄狮行动：针对伊朗空中战役的战略分析》68页智库报告

《史诗怒火/咆哮雄狮行动：针对伊朗空中战役的战略分析》68页智库报告

专知会员服务

3+阅读 · 今天12:39

“愈演愈烈的欺骗与干扰博弈”：无人机与人工智能背景下俄乌强化以无人机为核心的电子战

“愈演愈烈的欺骗与干扰博弈”：无人机与人工智能背景下俄乌强化以无人机为核心的电子战

专知会员服务

2+阅读 · 今天12:32

乌克兰纵深打击如何重塑俄罗斯的战略选择

乌克兰纵深打击如何重塑俄罗斯的战略选择

专知会员服务

1+阅读 · 今天12:25

《分布式太空任务对比分析与综合建模及仿真环境》120页

《分布式太空任务对比分析与综合建模及仿真环境》120页

专知会员服务

1+阅读 · 今天12:14

俄乌战争中关于中程打击无人机部署的经验启示

俄乌战争中关于中程打击无人机部署的经验启示

专知会员服务

0+阅读 · 今天12:08

《远程自主系统可扩展态势感知的解决方案》32页2026最新报告

《远程自主系统可扩展态势感知的解决方案》32页2026最新报告

专知会员服务

5+阅读 · 7月23日

《基于强化学习的自动化红队测试》

《基于强化学习的自动化红队测试》

专知会员服务

4+阅读 · 7月23日

《下一代无人机-卫星通信：人工智能创新与未来展望》32页长综述

《下一代无人机-卫星通信：人工智能创新与未来展望》32页长综述

专知会员服务

6+阅读 · 7月23日

“天降毒雾”：无人机如何使化学战重返乌克兰战场

“天降毒雾”：无人机如何使化学战重返乌克兰战场

专知会员服务

2+阅读 · 7月23日

伊朗不对称防空战略的演进

伊朗不对称防空战略的演进

专知会员服务

4+阅读 · 7月23日

对抗环境下超视距目标打击的情报支援

对抗环境下超视距目标打击的情报支援

专知会员服务

10+阅读 · 7月22日

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

专知会员服务

4+阅读 · 7月22日

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

专知会员服务

8+阅读 · 7月22日

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

专知会员服务

11+阅读 · 7月22日

相关VIP内容

自动驾驶中的3D目标检测研究进展

自动驾驶中的3D目标检测研究进展

专知会员服务

12+阅读 · 2025年7月20日

【HKUST博士论文】可扩展的基于视觉的 3D 物体检测与单目深度估计用于自动驾驶

【HKUST博士论文】可扩展的基于视觉的 3D 物体检测与单目深度估计用于自动驾驶

专知会员服务

19+阅读 · 2025年1月20日

【伯克利博士论文】高效的自动驾驶3D视觉，108页pdf

【伯克利博士论文】高效的自动驾驶3D视觉，108页pdf

专知会员服务

24+阅读 · 2024年9月1日

【博士论文】鲁棒深度学习自动驾驶，160页pdf

【博士论文】鲁棒深度学习自动驾驶，160页pdf

专知会员服务

40+阅读 · 2022年11月17日

港中文发布最新《自动驾驶三维物体检测》综述论文，32页pdf涵盖367篇文献全面概述基于激光雷达、基于相机和多模态的物体检测进展

港中文发布最新《自动驾驶三维物体检测》综述论文，32页pdf涵盖367篇文献全面概述基于激光雷达、基于相机和多模态的物体检测进展

专知会员服务

45+阅读 · 2022年6月23日

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

专知会员服务

18+阅读 · 2022年3月19日

【华中科技大学白翔教授】基于多模态融合的三维目标检测

【华中科技大学白翔教授】基于多模态融合的三维目标检测

专知会员服务

41+阅读 · 2022年3月17日

悉尼大学发布首篇《基于图像的自动驾驶三维目标检测》研究进展，阐述3D检测数据、方法与挑战

悉尼大学发布首篇《基于图像的自动驾驶三维目标检测》研究进展，阐述3D检测数据、方法与挑战

专知会员服务

27+阅读 · 2022年2月8日

【NeurIPS2021】多模态虚拟点三维检测

【NeurIPS2021】多模态虚拟点三维检测

专知会员服务

19+阅读 · 2021年11月16日

【CIKM2019 Tutorial】Realtime object detection via deep learning-based pipelines(通过基于深度学习的管道实现实时对象检测)，附教程PDF免费下载

【CIKM2019 Tutorial】Realtime object detection via deep learning-based pipelines(通过基于深度学习的管道实现实时对象检测)，附教程PDF免费下载

专知会员服务

19+阅读 · 2019年11月3日

热门VIP内容

开通专知VIP会员享更多权益服务

《史诗怒火/咆哮雄狮行动：针对伊朗空中战役的战略分析》68页智库报告

乌克兰纵深打击如何重塑俄罗斯的战略选择

《反无人机蜂群：有人-无人协同防御场景下的编队重构分析》

“愈演愈烈的欺骗与干扰博弈”：无人机与人工智能背景下俄乌强化以无人机为核心的电子战

相关资讯

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

自动驾驶汽车技术路线简介

自动驾驶汽车技术路线简介

智能交通技术

15+阅读 · 2019年4月25日

何恺明团队最新研究：3D目标检测新框架VoteNet，两大数据集刷新最高精度

何恺明团队最新研究：3D目标检测新框架VoteNet，两大数据集刷新最高精度

极市平台

29+阅读 · 2019年4月25日

车路协同应用场景分析

车路协同应用场景分析

智能交通技术

24+阅读 · 2019年4月13日

基于深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

基于深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

36大数据

14+阅读 · 2019年3月16日

【浅析】自动驾驶汽车传感器融合系统及多传感器数据融合算法浅析

【浅析】自动驾驶汽车传感器融合系统及多传感器数据融合算法浅析

中国自动化学会

15+阅读 · 2018年7月5日

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

商汤科技

14+阅读 · 2018年6月2日

【深度学习】增加检测类别？这是一份目标检测的一般指南

【深度学习】增加检测类别？这是一份目标检测的一般指南

产业智能官

13+阅读 · 2018年5月27日

车辆目标检测

车辆目标检测

数据挖掘入门与实战

30+阅读 · 2018年3月30日

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

图像分类、目标检测、图像分割……一文「计算机视觉」全分析

炼数成金订阅号

11+阅读 · 2017年9月20日

相关论文

Leveraging Previous-Traversal Point Cloud Map Priors for Camera-Based 3D Object Detection and Tracking

Arxiv

0+阅读 · 4月28日

Cross-Modal Phantom: Coordinated Camera-LiDAR Spoofing Against Multi-Sensor Fusion in Autonomous Vehicles

Arxiv

0+阅读 · 4月23日

Robust Real-Time Coordination of CAVs: A Distributed Optimization Framework under Uncertainty

Arxiv

0+阅读 · 4月17日

AD4AD: Benchmarking Visual Anomaly Detection Models for Safer Autonomous Driving

Arxiv

0+阅读 · 4月16日

CADENCE: Context-Adaptive Depth Estimation for Navigation and Computational Efficiency

Arxiv

0+阅读 · 4月8日

DriveTok: 3D Driving Scene Tokenization for Unified Multi-View Reconstruction and Understanding

Arxiv

0+阅读 · 3月19日

Reconstruction Matters: Learning Geometry-Aligned BEV Representation through 3D Gaussian Splatting

Arxiv

0+阅读 · 3月19日

FOMO-3D: Using Vision Foundation Models for Long-Tailed 3D Object Detection

Arxiv

0+阅读 · 3月9日

Wild-Drive: Off-Road Scene Captioning and Path Planning via Robust Multi-modal Routing and Efficient Large Language Model

Arxiv

0+阅读 · 2月28日

RADE-Net: Robust Attention Network for Radar-Only Object Detection in Adverse Weather

Arxiv

0+阅读 · 2月23日

相关基金

无人驾驶中4D场景实时解析算法研究

国家自然科学基金

12+阅读 · 2017年12月31日

复合型移动群智感知关键技术研究

国家自然科学基金

9+阅读 · 2017年12月31日

面向传感网的软件定义测量技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

混合车载网络环境下的节点部署及协同内容分发研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于机器类型通信的车联网群组安全协议研究

国家自然科学基金

2+阅读 · 2015年12月31日

场景深度关系下的视频遮挡目标检测

国家自然科学基金

1+阅读 · 2015年12月31日

基于框架提升变换的多源图像融合研究

国家自然科学基金

2+阅读 · 2015年12月31日

融合目标感知与对比度的图像和视频显著性检测技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

多特征融合与集成学习的城市高分辨率遥感影像变化检测

国家自然科学基金

4+阅读 · 2014年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员