SuperFusion: Multilevel LiDAR-Camera Fusion for Long-Range HD Map Generation - 专知论文

会员服务 ·

0

LIDAR · 路径 · Networking · 数据集 · state-of-the-art ·

2023 年 3 月 16 日

SuperFusion: Multilevel LiDAR-Camera Fusion for Long-Range HD Map Generation

翻译：SuperFusion: 多层级激光雷达-相机融合用于远距离高清地图生成

Hao Dong,Xianjing Zhang,Jintao Xu,Rui Ai,Weihao Gu,Huimin Lu,Juho Kannala,Xieyuanli Chen

High-definition (HD) semantic map generation of the environment is an essential component of autonomous driving. Existing methods have achieved good performance in this task by fusing different sensor modalities, such as LiDAR and camera. However, current works are based on raw data or network feature-level fusion and only consider short-range HD map generation, limiting their deployment to realistic autonomous driving applications. In this paper, we focus on the task of building the HD maps in both short ranges, i.e., within 30 m, and also predicting long-range HD maps up to 90 m, which is required by downstream path planning and control tasks to improve the smoothness and safety of autonomous driving. To this end, we propose a novel network named SuperFusion, exploiting the fusion of LiDAR and camera data at multiple levels. We use LiDAR depth to improve image depth estimation and use image features to guide long-range LiDAR feature prediction. We benchmark our SuperFusion on the nuScenes dataset and a self-recorded dataset and show that it outperforms the state-of-the-art baseline methods with large margins on all intervals. Additionally, we apply the generated HD map to a downstream path planning task, demonstrating that the long-range HD maps predicted by our method can lead to better path planning for autonomous vehicles. Our code and self-recorded dataset will be available at https://github.com/haomo-ai/SuperFusion.

翻译：环境的高清语义地图生成是自动驾驶的重要组成部分。现有方法通过融合不同传感器模态（如激光雷达和相机）在该任务上取得了良好性能。然而，当前研究基于原始数据或网络特征级融合，仅考虑短距离高清地图生成，限制了其在真实自动驾驶应用中的部署。本文聚焦于构建短距离（30米以内）及预测远距离（最高90米）高清地图任务，后者是下游路径规划与控制任务提升自动驾驶平顺性与安全性的关键。为此，我们提出名为SuperFusion的新型网络，在多个层级利用激光雷达与相机数据的融合。我们采用激光雷达深度改进图像深度估计，并利用图像特征引导远距离激光雷达特征预测。在nuScenes数据集及自记录数据集上对SuperFusion进行基准测试，结果表明该方法在所有距离区间内均大幅超越现有最优基线方法。此外，我们将生成的高清地图应用于下游路径规划任务，验证了所预测的远距离高清地图可优化自动驾驶车辆路径规划。代码及自记录数据集将在https://github.com/haomo-ai/SuperFusion 公开。

0

相关内容

LIDAR

【ACM UMAP 2022 】可复现推荐系统的语义感知内容表示，148页ppt

【ACM UMAP 2022 】可复现推荐系统的语义感知内容表示，148页ppt

专知会员服务

17+阅读 · 2022年7月6日

港中文发布最新《自动驾驶三维物体检测》综述论文，32页pdf涵盖367篇文献全面概述基于激光雷达、基于相机和多模态的物体检测进展

港中文发布最新《自动驾驶三维物体检测》综述论文，32页pdf涵盖367篇文献全面概述基于激光雷达、基于相机和多模态的物体检测进展

专知会员服务

45+阅读 · 2022年6月23日

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

专知会员服务

18+阅读 · 2022年3月19日

【CVPR 2022】【视频检索用多模态融合Transformer】Everything at Once -- Multi-modal Fusion Transformer for Video Retrieval

【CVPR 2022】【视频检索用多模态融合Transformer】Everything at Once -- Multi-modal Fusion Transformer for Video Retrieval

专知会员服务

29+阅读 · 2022年3月6日

【CVPR 2022】单目3D语义场景完成框架，MonoScene: Monocular 3D Semantic Scene Completion

【CVPR 2022】单目3D语义场景完成框架，MonoScene: Monocular 3D Semantic Scene Completion

专知会员服务

16+阅读 · 2022年3月3日

【UC San Diego】最新「三维深度学习(3D DL):过去与未来」教程，156页ppt

【UC San Diego】最新「三维深度学习(3D DL):过去与未来」教程，156页ppt

专知会员服务

52+阅读 · 2020年4月20日

【CVPR2020-Uber】物理上可实现的对抗性的例子，用于激光雷达的目标检测，Physically Realizable Adversarial Examples for LiDAR Object Detection

【CVPR2020-Uber】物理上可实现的对抗性的例子，用于激光雷达的目标检测，Physically Realizable Adversarial Examples for LiDAR Object Detection

专知会员服务

22+阅读 · 2020年4月16日

【CVPR 2019 | tutorial】自主汽车的感知、预测和大规模数据采集：Perception, Prediction, and Large Scale Data Collection for Autonomous Cars

【CVPR 2019 | tutorial】自主汽车的感知、预测和大规模数据采集：Perception, Prediction, and Large Scale Data Collection for Autonomous Cars

专知会员服务

33+阅读 · 2019年11月28日

[综述]深度学习下的场景文本检测与识别

[综述]深度学习下的场景文本检测与识别

专知会员服务

78+阅读 · 2019年10月10日

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

专知会员服务

41+阅读 · 2019年10月9日

GNN 新基准！Long Range Graph Benchmark

GNN 新基准！Long Range Graph Benchmark

图与推荐

0+阅读 · 2022年10月18日

综述 | 激光与视觉融合SLAM

综述 | 激光与视觉融合SLAM

计算机视觉life

18+阅读 · 2020年10月8日

【泡泡一分钟】单目视觉惯性SLAM的重定位，全局优化和地图融合

【泡泡一分钟】单目视觉惯性SLAM的重定位，全局优化和地图融合

泡泡机器人SLAM

59+阅读 · 2019年7月15日

BERT/Transformer/迁移学习NLP资源大列表

BERT/Transformer/迁移学习NLP资源大列表

专知

19+阅读 · 2019年6月9日

【泡泡一分钟】FarSight：从户外图像中实现远距离深度估计

【泡泡一分钟】FarSight：从户外图像中实现远距离深度估计

泡泡机器人SLAM

11+阅读 · 2019年5月22日

CVPR2019 | 03-17日更新6篇论文及代码汇总（图像分类、GAN、图像超分辨等）

CVPR2019 | 03-17日更新6篇论文及代码汇总（图像分类、GAN、图像超分辨等）

极市平台

13+阅读 · 2019年3月17日

【泡泡一分钟】用于RGBD语义分割的三维图神经网络(ICCV2017-546)

【泡泡一分钟】用于RGBD语义分割的三维图神经网络(ICCV2017-546)

泡泡机器人SLAM

22+阅读 · 2018年12月4日

【泡泡一分钟】SSD6D：基于RGB的三维检测和6自由度位姿估计(ICCV2017-159)

【泡泡一分钟】SSD6D：基于RGB的三维检测和6自由度位姿估计(ICCV2017-159)

泡泡机器人SLAM

17+阅读 · 2018年10月12日

【紫冬报告】吴毅红研究员：2017以来的2D到3D

【紫冬报告】吴毅红研究员：2017以来的2D到3D

中国科学院自动化研究所

11+阅读 · 2018年5月8日

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

专知

17+阅读 · 2018年3月3日

多视照片全局约束下的Kinect在线室内三维测图技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

高分辨率3D红外焦平面基础技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于原始仿真的MPSoC软硬件系统架构性能评估技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于导航卫星辐射源的双基前视SAR成像方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于多特征关联的复杂地形高分辨率遥感图像匹配技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

激光扫描视觉提高DGPS/IMU定位定姿可靠性方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

二维失配层状Ca3Co4O9-δ阴极及其纳米复相阴极的电化学性能和氧催化作用机理

国家自然科学基金

0+阅读 · 2012年12月31日

用于增强现实动态虚实遮挡问题的编码孔径图像深度获取方法研究

国家自然科学基金

2+阅读 · 2009年12月31日

增强现实中多目标3D跟踪定位和WH-SIFT特征识别方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

利用GPS与IM/WS干涉测量监测鲜水河断层变形

国家自然科学基金

0+阅读 · 2008年12月31日

Real-World Denoising via Diffusion Model

Arxiv

1+阅读 · 2023年5月8日

Diffusion-SDF: Text-to-Shape via Voxelized Diffusion

Arxiv

0+阅读 · 2023年5月7日

UIT-OpenViIC: A Novel Benchmark for Evaluating Image Captioning in Vietnamese

Arxiv

0+阅读 · 2023年5月7日

Energy-based Models are Zero-Shot Planners for Compositional Scene Rearrangement

Arxiv

0+阅读 · 2023年5月6日

FlowText: Synthesizing Realistic Scene Text Video with Optical Flow Estimation

Arxiv

0+阅读 · 2023年5月5日

Stereological determination of particle size distributions for similar convex bodies

Arxiv

0+阅读 · 2023年5月4日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

43+阅读 · 2023年4月19日

Recovering 3D Human Mesh from Monocular Images: A Survey

Arxiv

12+阅读 · 2022年3月8日

Self-supervised Geometric Perception

Arxiv

24+阅读 · 2021年3月4日

Mobile Video Object Detection with Temporally-Aware Feature Maps

Arxiv

11+阅读 · 2018年3月28日

VIP会员

文章信息

相关主题

state-of-the-art

最新内容

博士论文 | 面向大模型推理的内存高效算法

博士论文 | 面向大模型推理的内存高效算法

专知会员服务

0+阅读 · 今天15:20

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

专知会员服务

0+阅读 · 今天15:18

《无人系统互操作性导论——无人系统联合架构（JAUS）》

《无人系统互操作性导论——无人系统联合架构（JAUS）》

专知会员服务

8+阅读 · 今天5:53

美空军新型反无人机部队初探

美空军新型反无人机部队初探

专知会员服务

4+阅读 · 今天5:45

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

专知会员服务

2+阅读 · 今天5:23

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

专知会员服务

2+阅读 · 今天5:11

《防空交战流程的概率建模研究》

《防空交战流程的概率建模研究》

专知会员服务

6+阅读 · 今天5:04

ICML 2026 教程 | 数值优化理论还重要吗？

ICML 2026 教程 | 数值优化理论还重要吗？

专知会员服务

5+阅读 · 7月26日

ICM 2026 | 陶哲轩：人工智能时代的数学

ICM 2026 | 陶哲轩：人工智能时代的数学

专知会员服务

9+阅读 · 7月26日

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

专知会员服务

8+阅读 · 7月26日

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

专知会员服务

10+阅读 · 7月26日

《先进防空系统选型战略框架：基于巴基斯坦的实证启示》

《先进防空系统选型战略框架：基于巴基斯坦的实证启示》

专知会员服务

8+阅读 · 7月26日

《反无人机交战场景下的战斗归零研究》

《反无人机交战场景下的战斗归零研究》

专知会员服务

7+阅读 · 7月26日

霍尔木兹与不对称作战时代：水雷、无人系统与海军力量的重新定义

霍尔木兹与不对称作战时代：水雷、无人系统与海军力量的重新定义

专知会员服务

4+阅读 · 7月26日

博士论文 | 用代码结构感知方法推进代码大模型

博士论文 | 用代码结构感知方法推进代码大模型

专知会员服务

5+阅读 · 7月25日

相关VIP内容

【ACM UMAP 2022 】可复现推荐系统的语义感知内容表示，148页ppt

【ACM UMAP 2022 】可复现推荐系统的语义感知内容表示，148页ppt

专知会员服务

17+阅读 · 2022年7月6日

港中文发布最新《自动驾驶三维物体检测》综述论文，32页pdf涵盖367篇文献全面概述基于激光雷达、基于相机和多模态的物体检测进展

港中文发布最新《自动驾驶三维物体检测》综述论文，32页pdf涵盖367篇文献全面概述基于激光雷达、基于相机和多模态的物体检测进展

专知会员服务

45+阅读 · 2022年6月23日

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

【CVPR2022】自动驾驶中的伪双目三维目标检测，Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving

专知会员服务

18+阅读 · 2022年3月19日

【CVPR 2022】【视频检索用多模态融合Transformer】Everything at Once -- Multi-modal Fusion Transformer for Video Retrieval

【CVPR 2022】【视频检索用多模态融合Transformer】Everything at Once -- Multi-modal Fusion Transformer for Video Retrieval

专知会员服务

29+阅读 · 2022年3月6日

【CVPR 2022】单目3D语义场景完成框架，MonoScene: Monocular 3D Semantic Scene Completion

【CVPR 2022】单目3D语义场景完成框架，MonoScene: Monocular 3D Semantic Scene Completion

专知会员服务

16+阅读 · 2022年3月3日

【UC San Diego】最新「三维深度学习(3D DL):过去与未来」教程，156页ppt

【UC San Diego】最新「三维深度学习(3D DL):过去与未来」教程，156页ppt

专知会员服务

52+阅读 · 2020年4月20日

【CVPR2020-Uber】物理上可实现的对抗性的例子，用于激光雷达的目标检测，Physically Realizable Adversarial Examples for LiDAR Object Detection

【CVPR2020-Uber】物理上可实现的对抗性的例子，用于激光雷达的目标检测，Physically Realizable Adversarial Examples for LiDAR Object Detection

专知会员服务

22+阅读 · 2020年4月16日

【CVPR 2019 | tutorial】自主汽车的感知、预测和大规模数据采集：Perception, Prediction, and Large Scale Data Collection for Autonomous Cars

【CVPR 2019 | tutorial】自主汽车的感知、预测和大规模数据采集：Perception, Prediction, and Large Scale Data Collection for Autonomous Cars

专知会员服务

33+阅读 · 2019年11月28日

[综述]深度学习下的场景文本检测与识别

[综述]深度学习下的场景文本检测与识别

专知会员服务

78+阅读 · 2019年10月10日

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

专知会员服务

41+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

美空军新型反无人机部队初探

博士论文 | 面向大模型推理的内存高效算法

《无人系统互操作性导论——无人系统联合架构（JAUS）》

相关资讯

GNN 新基准！Long Range Graph Benchmark

GNN 新基准！Long Range Graph Benchmark

图与推荐

0+阅读 · 2022年10月18日

综述 | 激光与视觉融合SLAM

综述 | 激光与视觉融合SLAM

计算机视觉life

18+阅读 · 2020年10月8日

【泡泡一分钟】单目视觉惯性SLAM的重定位，全局优化和地图融合

【泡泡一分钟】单目视觉惯性SLAM的重定位，全局优化和地图融合

泡泡机器人SLAM

59+阅读 · 2019年7月15日

BERT/Transformer/迁移学习NLP资源大列表

BERT/Transformer/迁移学习NLP资源大列表

专知

19+阅读 · 2019年6月9日

【泡泡一分钟】FarSight：从户外图像中实现远距离深度估计

【泡泡一分钟】FarSight：从户外图像中实现远距离深度估计

泡泡机器人SLAM

11+阅读 · 2019年5月22日

CVPR2019 | 03-17日更新6篇论文及代码汇总（图像分类、GAN、图像超分辨等）

CVPR2019 | 03-17日更新6篇论文及代码汇总（图像分类、GAN、图像超分辨等）

极市平台

13+阅读 · 2019年3月17日

【泡泡一分钟】用于RGBD语义分割的三维图神经网络(ICCV2017-546)

【泡泡一分钟】用于RGBD语义分割的三维图神经网络(ICCV2017-546)

泡泡机器人SLAM

22+阅读 · 2018年12月4日

【泡泡一分钟】SSD6D：基于RGB的三维检测和6自由度位姿估计(ICCV2017-159)

【泡泡一分钟】SSD6D：基于RGB的三维检测和6自由度位姿估计(ICCV2017-159)

泡泡机器人SLAM

17+阅读 · 2018年10月12日

【紫冬报告】吴毅红研究员：2017以来的2D到3D

【紫冬报告】吴毅红研究员：2017以来的2D到3D

中国科学院自动化研究所

11+阅读 · 2018年5月8日

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

专知

17+阅读 · 2018年3月3日

相关论文

Real-World Denoising via Diffusion Model

Arxiv

1+阅读 · 2023年5月8日

Diffusion-SDF: Text-to-Shape via Voxelized Diffusion

Arxiv

0+阅读 · 2023年5月7日

UIT-OpenViIC: A Novel Benchmark for Evaluating Image Captioning in Vietnamese

Arxiv

0+阅读 · 2023年5月7日

Energy-based Models are Zero-Shot Planners for Compositional Scene Rearrangement

Arxiv

0+阅读 · 2023年5月6日

FlowText: Synthesizing Realistic Scene Text Video with Optical Flow Estimation

Arxiv

0+阅读 · 2023年5月5日

Stereological determination of particle size distributions for similar convex bodies

Arxiv

0+阅读 · 2023年5月4日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

43+阅读 · 2023年4月19日

Recovering 3D Human Mesh from Monocular Images: A Survey

Arxiv

12+阅读 · 2022年3月8日

Self-supervised Geometric Perception

Arxiv

24+阅读 · 2021年3月4日

Mobile Video Object Detection with Temporally-Aware Feature Maps

Arxiv

11+阅读 · 2018年3月28日

相关基金

多视照片全局约束下的Kinect在线室内三维测图技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

高分辨率3D红外焦平面基础技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于原始仿真的MPSoC软硬件系统架构性能评估技术研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于导航卫星辐射源的双基前视SAR成像方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于多特征关联的复杂地形高分辨率遥感图像匹配技术研究

国家自然科学基金

0+阅读 · 2012年12月31日

激光扫描视觉提高DGPS/IMU定位定姿可靠性方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

二维失配层状Ca3Co4O9-δ阴极及其纳米复相阴极的电化学性能和氧催化作用机理

国家自然科学基金

0+阅读 · 2012年12月31日

用于增强现实动态虚实遮挡问题的编码孔径图像深度获取方法研究

国家自然科学基金

2+阅读 · 2009年12月31日

增强现实中多目标3D跟踪定位和WH-SIFT特征识别方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

利用GPS与IM/WS干涉测量监测鲜水河断层变形

国家自然科学基金

0+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员