DGFusion：基于深度引导的传感器融合用于鲁棒语义感知 (DGFusion: Depth-Guided Sensor Fusion for Robust Semantic Perception) - 专知论文

会员服务 ·

0

传感 · 融合 · 传感器 · 鲁棒 · 模态 ·

DGFusion: Depth-Guided Sensor Fusion for Robust Semantic Perception

翻译：DGFusion：基于深度引导的传感器融合用于鲁棒语义感知

Tim Broedermannn,Christos Sakaridis,Luigi Piccinelli,Wim Abbeloos,Luc Van Gool

from arxiv, Code and models are available at https://github.com/timbroed/DGFusion

Robust semantic perception for autonomous vehicles relies on effectively combining multiple sensors with complementary strengths and weaknesses. State-of-the-art sensor fusion approaches to semantic perception often treat sensor data uniformly across the spatial extent of the input, which hinders performance when faced with challenging conditions. By contrast, we propose a novel depth-guided multimodal fusion method that upgrades condition-aware fusion by integrating depth information. Our network, DGFusion, poses multimodal segmentation as a multi-task problem, utilizing the lidar measurements, which are typically available in outdoor sensor suites, both as one of the model's inputs and as ground truth for learning depth. Our corresponding auxiliary depth head helps to learn depth-aware features, which are encoded into spatially varying local depth tokens that condition our attentive cross-modal fusion. Together with a global condition token, these local depth tokens dynamically adapt sensor fusion to the spatially varying reliability of each sensor across the scene, which largely depends on depth. In addition, we propose a robust loss for our depth, which is essential for learning from lidar inputs that are typically sparse and noisy in adverse conditions. Our method achieves state-of-the-art panoptic and semantic segmentation performance on the challenging MUSES and DeLiVER datasets. Code and models are available at https://github.com/timbroed/DGFusion

翻译：自动驾驶的鲁棒语义感知依赖于有效结合具有互补优势与不足的多种传感器。当前最先进的语义感知传感器融合方法通常在输入的空间范围内统一处理传感器数据，这在面对挑战性条件时会限制性能表现。相比之下，我们提出了一种新颖的深度引导多模态融合方法，该方法通过整合深度信息来升级条件感知融合。我们的网络DGFusion将多模态分割构建为一个多任务问题，利用通常存在于户外传感器套件中的激光雷达测量数据，既作为模型的输入之一，也作为学习深度的真实标签。我们对应的辅助深度头部有助于学习深度感知特征，这些特征被编码为空间变化的局部深度标记，用于调节我们的注意力跨模态融合。这些局部深度标记与一个全局条件标记共同作用，能够根据场景中随空间位置变化的各传感器可靠性（这在很大程度上取决于深度）动态调整传感器融合策略。此外，我们为深度预测提出了一种鲁棒损失函数，这对于从通常在恶劣条件下稀疏且含噪的激光雷达输入中学习至关重要。我们的方法在具有挑战性的MUSES和DeLiVER数据集上实现了最先进的全景与语义分割性能。代码与模型已发布于 https://github.com/timbroed/DGFusion

0

相关内容

【NTU博士论文】端到端鲁棒自动语音识别的最新进展

【NTU博士论文】端到端鲁棒自动语音识别的最新进展

专知会员服务

12+阅读 · 2025年10月15日

【博士论文】对抗鲁棒性深度学习算法

【博士论文】对抗鲁棒性深度学习算法

专知会员服务

16+阅读 · 2025年9月29日

面向具身智能的多传感器融合感知综述：背景、方法、挑战与前景

面向具身智能的多传感器融合感知综述：背景、方法、挑战与前景

专知会员服务

18+阅读 · 2025年6月29日

【伯克利博士论文】用于机器人操作的多模态感知：融合视觉、语言与触觉

【伯克利博士论文】用于机器人操作的多模态感知：融合视觉、语言与触觉

专知会员服务

22+阅读 · 2025年5月30日

《空基机器人系统的传感器融合技术》美陆军最新58页

《空基机器人系统的传感器融合技术》美陆军最新58页

专知会员服务

30+阅读 · 2025年4月20日

【HKUST博士论文】可扩展的基于视觉的 3D 物体检测与单目深度估计用于自动驾驶

【HKUST博士论文】可扩展的基于视觉的 3D 物体检测与单目深度估计用于自动驾驶

专知会员服务

18+阅读 · 2025年1月20日

《多模态传感器融合与深度学习》美海军研究实验室19页报告

《多模态传感器融合与深度学习》美海军研究实验室19页报告

专知会员服务

116+阅读 · 2023年4月1日

【CVPR2023】MSeg3D:面向自动驾驶的多模态3D语义分割

【CVPR2023】MSeg3D:面向自动驾驶的多模态3D语义分割

专知会员服务

16+阅读 · 2023年3月17日

译文 |《陆地战车的传感器融合》

译文 |《陆地战车的传感器融合》

专知会员服务

86+阅读 · 2023年2月28日

【UFPE大学博士论文】基于熵损失的鲁棒深度学习

【UFPE大学博士论文】基于熵损失的鲁棒深度学习

专知会员服务

43+阅读 · 2022年11月11日

基于深度学习的数据融合方法研究综述

基于深度学习的数据融合方法研究综述

专知

37+阅读 · 2020年12月10日

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

专知

53+阅读 · 2019年12月1日

深度学习技术在自动驾驶中的应用

深度学习技术在自动驾驶中的应用

智能交通技术

26+阅读 · 2019年10月27日

专家报告|深度学习+图像多模态融合

专家报告|深度学习+图像多模态融合

中国图象图形学报

12+阅读 · 2019年10月23日

深度学习在自动驾驶感知领域的应用

深度学习在自动驾驶感知领域的应用

AI100

11+阅读 · 2019年3月6日

ICLR 2019论文解读：深度学习应用于复杂系统控制

ICLR 2019论文解读：深度学习应用于复杂系统控制

机器之心

11+阅读 · 2019年1月10日

【浅析】自动驾驶汽车传感器融合系统及多传感器数据融合算法浅析

【浅析】自动驾驶汽车传感器融合系统及多传感器数据融合算法浅析

中国自动化学会

15+阅读 · 2018年7月5日

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

商汤科技

14+阅读 · 2018年6月2日

【推荐系统论文笔记】DKN: 基于深度知识感知的新闻推荐网络（WWW2018 ）

【推荐系统论文笔记】DKN: 基于深度知识感知的新闻推荐网络（WWW2018 ）

专知

18+阅读 · 2018年4月2日

一文看懂深度学习在语音合成&增强上的应用

一文看懂深度学习在语音合成&增强上的应用

数盟

11+阅读 · 2017年9月13日

基于随机不可靠量测的事件触发多传感器系统融合估计方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

复合型移动群智感知关键技术研究

国家自然科学基金

9+阅读 · 2017年12月31日

基于深度卷积神经网络的多源遥感图像时空融合方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于MEMS加速度传感器的智能终端手势识别及三维交互模型

国家自然科学基金

6+阅读 · 2015年12月31日

移动增强现实中基于视觉—惯性传感器的混合跟踪方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于框架提升变换的多源图像融合研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于势场法的多智能体系统鲁棒自适应刚性编队控制

国家自然科学基金

3+阅读 · 2015年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于融合先验知识的机器学习的多传感器融合研究

国家自然科学基金

16+阅读 · 2013年12月31日

无人机协同组网感知融合与传感器管理关键技术研究

国家自然科学基金

27+阅读 · 2011年12月31日

Hierarchical Audio-Visual-Proprioceptive Fusion for Precise Robotic Manipulation

Arxiv

0+阅读 · 2月14日

ReSPEC: A Framework for Online Multispectral Sensor Reconfiguration in Dynamic Environments

Arxiv

0+阅读 · 2月11日

GaussianCaR: Gaussian Splatting for Efficient Camera-Radar Fusion

Arxiv

0+阅读 · 2月9日

GeoLanG: Geometry-Aware Language-Guided Grasping with Unified RGB-D Multimodal Learning

Arxiv

0+阅读 · 2月4日

DeepUrban: Interaction-Aware Trajectory Prediction and Planning for Automated Driving by Aerial Imagery

Arxiv

0+阅读 · 2月3日

Synesthesia of Vehicles: Tactile Data Synthesis from Visual Inputs

Arxiv

0+阅读 · 2月2日

SW-ASR: A Context-Aware Hybrid ASR Pipeline for Robust Single Word Speech Recognition

Arxiv

0+阅读 · 1月28日

AGSP-DSA: An Adaptive Graph Signal Processing Framework for Robust Multimodal Fusion with Dynamic Semantic Alignment

Arxiv

0+阅读 · 1月26日

Integrating Fine-Grained Audio-Visual Evidence for Robust Multimodal Emotion Reasoning

Arxiv

0+阅读 · 1月26日

DriveRX: A Vision-Language Reasoning Model for Cross-Task Autonomous Driving

Arxiv

0+阅读 · 1月13日

VIP会员

文章信息

相关主题

相关VIP内容

【NTU博士论文】端到端鲁棒自动语音识别的最新进展

【NTU博士论文】端到端鲁棒自动语音识别的最新进展

专知会员服务

12+阅读 · 2025年10月15日

【博士论文】对抗鲁棒性深度学习算法

【博士论文】对抗鲁棒性深度学习算法

专知会员服务

16+阅读 · 2025年9月29日

面向具身智能的多传感器融合感知综述：背景、方法、挑战与前景

面向具身智能的多传感器融合感知综述：背景、方法、挑战与前景

专知会员服务

18+阅读 · 2025年6月29日

【伯克利博士论文】用于机器人操作的多模态感知：融合视觉、语言与触觉

【伯克利博士论文】用于机器人操作的多模态感知：融合视觉、语言与触觉

专知会员服务

22+阅读 · 2025年5月30日

《空基机器人系统的传感器融合技术》美陆军最新58页

《空基机器人系统的传感器融合技术》美陆军最新58页

专知会员服务

30+阅读 · 2025年4月20日

【HKUST博士论文】可扩展的基于视觉的 3D 物体检测与单目深度估计用于自动驾驶

【HKUST博士论文】可扩展的基于视觉的 3D 物体检测与单目深度估计用于自动驾驶

专知会员服务

18+阅读 · 2025年1月20日

《多模态传感器融合与深度学习》美海军研究实验室19页报告

《多模态传感器融合与深度学习》美海军研究实验室19页报告

专知会员服务

116+阅读 · 2023年4月1日

【CVPR2023】MSeg3D:面向自动驾驶的多模态3D语义分割

【CVPR2023】MSeg3D:面向自动驾驶的多模态3D语义分割

专知会员服务

16+阅读 · 2023年3月17日

译文 |《陆地战车的传感器融合》

译文 |《陆地战车的传感器融合》

专知会员服务

86+阅读 · 2023年2月28日

【UFPE大学博士论文】基于熵损失的鲁棒深度学习

【UFPE大学博士论文】基于熵损失的鲁棒深度学习

专知会员服务

43+阅读 · 2022年11月11日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

基于深度学习的数据融合方法研究综述

基于深度学习的数据融合方法研究综述

专知

37+阅读 · 2020年12月10日

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

专知

53+阅读 · 2019年12月1日

深度学习技术在自动驾驶中的应用

深度学习技术在自动驾驶中的应用

智能交通技术

26+阅读 · 2019年10月27日

专家报告|深度学习+图像多模态融合

专家报告|深度学习+图像多模态融合

中国图象图形学报

12+阅读 · 2019年10月23日

深度学习在自动驾驶感知领域的应用

深度学习在自动驾驶感知领域的应用

AI100

11+阅读 · 2019年3月6日

ICLR 2019论文解读：深度学习应用于复杂系统控制

ICLR 2019论文解读：深度学习应用于复杂系统控制

机器之心

11+阅读 · 2019年1月10日

【浅析】自动驾驶汽车传感器融合系统及多传感器数据融合算法浅析

【浅析】自动驾驶汽车传感器融合系统及多传感器数据融合算法浅析

中国自动化学会

15+阅读 · 2018年7月5日

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

商汤科技

14+阅读 · 2018年6月2日

【推荐系统论文笔记】DKN: 基于深度知识感知的新闻推荐网络（WWW2018 ）

【推荐系统论文笔记】DKN: 基于深度知识感知的新闻推荐网络（WWW2018 ）

专知

18+阅读 · 2018年4月2日

一文看懂深度学习在语音合成&增强上的应用

一文看懂深度学习在语音合成&增强上的应用

数盟

11+阅读 · 2017年9月13日

相关论文

Hierarchical Audio-Visual-Proprioceptive Fusion for Precise Robotic Manipulation

Arxiv

0+阅读 · 2月14日

ReSPEC: A Framework for Online Multispectral Sensor Reconfiguration in Dynamic Environments

Arxiv

0+阅读 · 2月11日

GaussianCaR: Gaussian Splatting for Efficient Camera-Radar Fusion

Arxiv

0+阅读 · 2月9日

GeoLanG: Geometry-Aware Language-Guided Grasping with Unified RGB-D Multimodal Learning

Arxiv

0+阅读 · 2月4日

DeepUrban: Interaction-Aware Trajectory Prediction and Planning for Automated Driving by Aerial Imagery

Arxiv

0+阅读 · 2月3日

Synesthesia of Vehicles: Tactile Data Synthesis from Visual Inputs

Arxiv

0+阅读 · 2月2日

SW-ASR: A Context-Aware Hybrid ASR Pipeline for Robust Single Word Speech Recognition

Arxiv

0+阅读 · 1月28日

AGSP-DSA: An Adaptive Graph Signal Processing Framework for Robust Multimodal Fusion with Dynamic Semantic Alignment

Arxiv

0+阅读 · 1月26日

Integrating Fine-Grained Audio-Visual Evidence for Robust Multimodal Emotion Reasoning

Arxiv

0+阅读 · 1月26日

DriveRX: A Vision-Language Reasoning Model for Cross-Task Autonomous Driving

Arxiv

0+阅读 · 1月13日

相关基金

基于随机不可靠量测的事件触发多传感器系统融合估计方法研究

国家自然科学基金

3+阅读 · 2017年12月31日

复合型移动群智感知关键技术研究

国家自然科学基金

9+阅读 · 2017年12月31日

基于深度卷积神经网络的多源遥感图像时空融合方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于MEMS加速度传感器的智能终端手势识别及三维交互模型

国家自然科学基金

6+阅读 · 2015年12月31日

移动增强现实中基于视觉—惯性传感器的混合跟踪方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于框架提升变换的多源图像融合研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于势场法的多智能体系统鲁棒自适应刚性编队控制

国家自然科学基金

3+阅读 · 2015年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于融合先验知识的机器学习的多传感器融合研究

国家自然科学基金

16+阅读 · 2013年12月31日

无人机协同组网感知融合与传感器管理关键技术研究

国家自然科学基金

27+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员