可学习性驱动的子模优化用于主动路边三维检测 (Learnability-Driven Submodular Optimization for Active Roadside 3D Detection) - 专知论文

会员服务 ·

0

标注 · 样本 · 不确定 · 数据集 · 主动学习 ·

Learnability-Driven Submodular Optimization for Active Roadside 3D Detection

翻译：可学习性驱动的子模优化用于主动路边三维检测

Ruiyu Mao,Baoming Zhang,Nicholas Ruozzi,Yunhui Guo

from arxiv, 10 pages, 7 figures. Submitted to CVPR 2026

Roadside perception datasets are typically constructed via cooperative labeling between synchronized vehicle and roadside frame pairs. However, real deployment often requires annotation of roadside-only data due to hardware and privacy constraints. Even human experts struggle to produce accurate labels without vehicle-side data (image, LIDAR), which not only increases annotation difficulty and cost, but also reveals a fundamental learnability problem: many roadside-only scenes contain distant, blurred, or occluded objects whose 3D properties are ambiguous from a single view and can only be reliably annotated by cross-checking paired vehicle--roadside frames. We refer to such cases as inherently ambiguous samples. To reduce wasted annotation effort on inherently ambiguous samples while still obtaining high-performing models, we turn to active learning. This work focuses on active learning for roadside monocular 3D object detection and proposes a learnability-driven framework that selects scenes which are both informative and reliably labelable, suppressing inherently ambiguous samples while ensuring coverage. Experiments demonstrate that our method, LH3D, achieves 86.06%, 67.32%, and 78.67% of full-performance for vehicles, pedestrians, and cyclists respectively, using only 25% of the annotation budget on DAIR-V2X-I, significantly outperforming uncertainty-based baselines. This confirms that learnability, not uncertainty, matters for roadside 3D perception.

翻译：路边感知数据集通常通过同步车辆与路边帧对之间的协同标注构建。然而，由于硬件和隐私限制，实际部署常需对仅含路边视角的数据进行标注。即使人类专家在缺乏车辆端数据（图像、激光雷达）的情况下也难以生成准确标签，这不仅增加了标注难度与成本，更揭示了一个根本性的可学习性问题：许多仅含路边视角的场景中存在遥远、模糊或被遮挡的物体，其三维属性在单视角下具有歧义，仅能通过交叉比对配对的车辆-路边帧进行可靠标注。我们将此类样本称为本质模糊样本。为减少在本质模糊样本上浪费标注资源，同时仍能获得高性能模型，我们转向主动学习。本研究聚焦于路边单目三维物体检测的主动学习，提出一种可学习性驱动的框架，该框架选择既信息丰富又可可靠标注的场景，在抑制本质模糊样本的同时确保覆盖度。实验表明，我们的方法LH3D在DAIR-V2X-I数据集上仅使用25%的标注预算，即可分别达到车辆、行人和骑行者全性能的86.06%、67.32%和78.67%，显著优于基于不确定性的基线方法。这证实了对于路边三维感知而言，关键因素是可学习性而非不确定性。

0

相关内容

自动驾驶中的3D目标检测研究进展

自动驾驶中的3D目标检测研究进展

专知会员服务

11+阅读 · 2025年7月20日

【HKUST博士论文】可扩展的基于视觉的 3D 物体检测与单目深度估计用于自动驾驶

【HKUST博士论文】可扩展的基于视觉的 3D 物体检测与单目深度估计用于自动驾驶

专知会员服务

18+阅读 · 2025年1月20日

《视觉Transformers自监督学习机制综述》

《视觉Transformers自监督学习机制综述》

专知会员服务

29+阅读 · 2024年9月2日

《用于军用车辆探测的零样本多模态深度学习模型》

《用于军用车辆探测的零样本多模态深度学习模型》

专知会员服务

34+阅读 · 2024年5月9日

边缘智能如何用于车联网？车联网边缘智能：概念、架构、问题、实施和展望

边缘智能如何用于车联网？车联网边缘智能：概念、架构、问题、实施和展望

专知会员服务

40+阅读 · 2023年1月30日

移动边缘网络中联邦学习效率优化综述

移动边缘网络中联邦学习效率优化综述

专知会员服务

49+阅读 · 2022年7月9日

港中文发布最新《自动驾驶三维物体检测》综述论文，32页pdf涵盖367篇文献全面概述基于激光雷达、基于相机和多模态的物体检测进展

港中文发布最新《自动驾驶三维物体检测》综述论文，32页pdf涵盖367篇文献全面概述基于激光雷达、基于相机和多模态的物体检测进展

专知会员服务

44+阅读 · 2022年6月23日

【CVPR 2022】基于可迁移GNN的自适应轨迹预测，Adaptive Trajectory Prediction via Transferable GNN

【CVPR 2022】基于可迁移GNN的自适应轨迹预测，Adaptive Trajectory Prediction via Transferable GNN

专知会员服务

47+阅读 · 2022年3月11日

面向自动驾驶的边缘计算技术研究综述

专知会员服务

66+阅读 · 2021年5月3日

【Google&Waymo】自动驾驶感知的可扩展性:Waymo开放数据集，23位学者联名出品

【Google&Waymo】自动驾驶感知的可扩展性:Waymo开放数据集，23位学者联名出品

专知会员服务

13+阅读 · 2019年12月18日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

自动驾驶车辆定位技术概述｜厚势汽车

自动驾驶车辆定位技术概述｜厚势汽车

厚势

10+阅读 · 2019年5月16日

车路协同应用场景分析

车路协同应用场景分析

智能交通技术

24+阅读 · 2019年4月13日

深度学习在自动驾驶感知领域的应用

深度学习在自动驾驶感知领域的应用

AI100

11+阅读 · 2019年3月6日

基于车路协同的群体智能协同

基于车路协同的群体智能协同

智能交通技术

10+阅读 · 2019年1月23日

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

专知

13+阅读 · 2018年5月26日

边缘计算应用：传感数据异常实时检测算法

边缘计算应用：传感数据异常实时检测算法

计算机研究与发展

11+阅读 · 2018年4月10日

深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN

深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN

数据挖掘入门与实战

13+阅读 · 2018年4月6日

车辆目标检测

车辆目标检测

数据挖掘入门与实战

30+阅读 · 2018年3月30日

实战｜手把手教你实现图象边缘检测！

实战｜手把手教你实现图象边缘检测！

全球人工智能

10+阅读 · 2018年1月19日

基于主动轮廓模型的海洋航空遥感图像的边缘检测模型和最优化策略研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于子模优化的远程预警传感器管理研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于LiDAR数据的非栅格化道路矢量提取及融合高分影像的路网探测与优化

国家自然科学基金

0+阅读 · 2015年12月31日

车联网环境下基于路段负载链估测与优化的动态交通诱导方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于生物视觉启发特征和遮挡模型的复杂道路环境目标检测方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

MRF模型的车载全景视觉位姿估计最优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

混合交通环境中自动驾驶汽车安全可达性分析与优化控制研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于排队模型的动态车辆路径问题实时优化策略及算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于视觉注意与眼动跟踪的地图认知计算模型与方法研究

国家自然科学基金

6+阅读 · 2014年12月31日

Model Optimization for Multi-Camera 3D Detection and Tracking

Arxiv

0+阅读 · 2月3日

DrivIng: A Large-Scale Multimodal Driving Dataset with Full Digital Twin Integration

Arxiv

0+阅读 · 1月29日

Offline Reinforcement Learning using Human-Aligned Reward Labeling for Autonomous Emergency Braking in Occluded Pedestrian Crossing

Arxiv

0+阅读 · 1月23日

UrbanIng-V2X: A Large-Scale Multi-Vehicle, Multi-Infrastructure Dataset Across Multiple Intersections for Cooperative Perception

Arxiv

0+阅读 · 1月23日

Correcting and Quantifying Systematic Errors in 3D Box Annotations for Autonomous Driving

Arxiv

0+阅读 · 1月20日

Efficient Local-to-Global Collaborative Perception via Joint Communication and Computation Optimization

Arxiv

0+阅读 · 1月19日

V2X-Radar: A Multi-modal Dataset with 4D Radar for Cooperative Perception

Arxiv

0+阅读 · 1月16日

Unleashing the Capabilities of Large Vision-Language Models for Intelligent Perception of Roadside Infrastructure

Arxiv

0+阅读 · 1月15日

LatentVLA: Efficient Vision-Language Models for Autonomous Driving via Latent Action Prediction

Arxiv

0+阅读 · 1月9日

Towards Efficient 3D Object Detection for Vehicle-Infrastructure Collaboration via Risk-Intent Selection

Arxiv

0+阅读 · 1月6日

VIP会员

文章信息

相关主题

相关VIP内容

自动驾驶中的3D目标检测研究进展

自动驾驶中的3D目标检测研究进展

专知会员服务

11+阅读 · 2025年7月20日

【HKUST博士论文】可扩展的基于视觉的 3D 物体检测与单目深度估计用于自动驾驶

【HKUST博士论文】可扩展的基于视觉的 3D 物体检测与单目深度估计用于自动驾驶

专知会员服务

18+阅读 · 2025年1月20日

《视觉Transformers自监督学习机制综述》

《视觉Transformers自监督学习机制综述》

专知会员服务

29+阅读 · 2024年9月2日

《用于军用车辆探测的零样本多模态深度学习模型》

《用于军用车辆探测的零样本多模态深度学习模型》

专知会员服务

34+阅读 · 2024年5月9日

边缘智能如何用于车联网？车联网边缘智能：概念、架构、问题、实施和展望

边缘智能如何用于车联网？车联网边缘智能：概念、架构、问题、实施和展望

专知会员服务

40+阅读 · 2023年1月30日

移动边缘网络中联邦学习效率优化综述

移动边缘网络中联邦学习效率优化综述

专知会员服务

49+阅读 · 2022年7月9日

港中文发布最新《自动驾驶三维物体检测》综述论文，32页pdf涵盖367篇文献全面概述基于激光雷达、基于相机和多模态的物体检测进展

港中文发布最新《自动驾驶三维物体检测》综述论文，32页pdf涵盖367篇文献全面概述基于激光雷达、基于相机和多模态的物体检测进展

专知会员服务

44+阅读 · 2022年6月23日

【CVPR 2022】基于可迁移GNN的自适应轨迹预测，Adaptive Trajectory Prediction via Transferable GNN

【CVPR 2022】基于可迁移GNN的自适应轨迹预测，Adaptive Trajectory Prediction via Transferable GNN

专知会员服务

47+阅读 · 2022年3月11日

面向自动驾驶的边缘计算技术研究综述

专知会员服务

66+阅读 · 2021年5月3日

【Google&Waymo】自动驾驶感知的可扩展性:Waymo开放数据集，23位学者联名出品

【Google&Waymo】自动驾驶感知的可扩展性:Waymo开放数据集，23位学者联名出品

专知会员服务

13+阅读 · 2019年12月18日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人机与战争：被忽视的环境影响及无人机保护潜力》

俄罗斯规划未来无人机驱动军队

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

《人工智能、武器与影响力：前沿模型在模拟核危机中展现复杂推理》2026最新46页报告

相关资讯

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

自动驾驶车辆定位技术概述｜厚势汽车

自动驾驶车辆定位技术概述｜厚势汽车

厚势

10+阅读 · 2019年5月16日

车路协同应用场景分析

车路协同应用场景分析

智能交通技术

24+阅读 · 2019年4月13日

深度学习在自动驾驶感知领域的应用

深度学习在自动驾驶感知领域的应用

AI100

11+阅读 · 2019年3月6日

基于车路协同的群体智能协同

基于车路协同的群体智能协同

智能交通技术

10+阅读 · 2019年1月23日

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

专知

13+阅读 · 2018年5月26日

边缘计算应用：传感数据异常实时检测算法

边缘计算应用：传感数据异常实时检测算法

计算机研究与发展

11+阅读 · 2018年4月10日

深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN

深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN

数据挖掘入门与实战

13+阅读 · 2018年4月6日

车辆目标检测

车辆目标检测

数据挖掘入门与实战

30+阅读 · 2018年3月30日

实战｜手把手教你实现图象边缘检测！

实战｜手把手教你实现图象边缘检测！

全球人工智能

10+阅读 · 2018年1月19日

相关论文

Model Optimization for Multi-Camera 3D Detection and Tracking

Arxiv

0+阅读 · 2月3日

DrivIng: A Large-Scale Multimodal Driving Dataset with Full Digital Twin Integration

Arxiv

0+阅读 · 1月29日

Offline Reinforcement Learning using Human-Aligned Reward Labeling for Autonomous Emergency Braking in Occluded Pedestrian Crossing

Arxiv

0+阅读 · 1月23日

UrbanIng-V2X: A Large-Scale Multi-Vehicle, Multi-Infrastructure Dataset Across Multiple Intersections for Cooperative Perception

Arxiv

0+阅读 · 1月23日

Correcting and Quantifying Systematic Errors in 3D Box Annotations for Autonomous Driving

Arxiv

0+阅读 · 1月20日

Efficient Local-to-Global Collaborative Perception via Joint Communication and Computation Optimization

Arxiv

0+阅读 · 1月19日

V2X-Radar: A Multi-modal Dataset with 4D Radar for Cooperative Perception

Arxiv

0+阅读 · 1月16日

Unleashing the Capabilities of Large Vision-Language Models for Intelligent Perception of Roadside Infrastructure

Arxiv

0+阅读 · 1月15日

LatentVLA: Efficient Vision-Language Models for Autonomous Driving via Latent Action Prediction

Arxiv

0+阅读 · 1月9日

Towards Efficient 3D Object Detection for Vehicle-Infrastructure Collaboration via Risk-Intent Selection

Arxiv

0+阅读 · 1月6日

相关基金

基于主动轮廓模型的海洋航空遥感图像的边缘检测模型和最优化策略研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于子模优化的远程预警传感器管理研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于LiDAR数据的非栅格化道路矢量提取及融合高分影像的路网探测与优化

国家自然科学基金

0+阅读 · 2015年12月31日

车联网环境下基于路段负载链估测与优化的动态交通诱导方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于生物视觉启发特征和遮挡模型的复杂道路环境目标检测方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

MRF模型的车载全景视觉位姿估计最优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

混合交通环境中自动驾驶汽车安全可达性分析与优化控制研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于排队模型的动态车辆路径问题实时优化策略及算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于视觉注意与眼动跟踪的地图认知计算模型与方法研究

国家自然科学基金

6+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员