Poses as Queries: Image-to-LiDAR Map Localization with Transformers - 专知论文

会员服务 ·

0

估计/估计量 · Networking · LIDAR · Performer · 变换 ·

2023 年 5 月 7 日

Poses as Queries: Image-to-LiDAR Map Localization with Transformers

翻译：姿态即查询：基于Transformer的图像到激光雷达地图定位

Jinyu Miao,Kun Jiang,Yunlong Wang,Tuopu Wen,Zhongyang Xiao,Zheng Fu,Mengmeng Yang,Maolin Liu,Diange Yang

from arxiv, 8 pages, 3 figures, 4 tables

High-precision vehicle localization with commercial setups is a crucial technique for high-level autonomous driving tasks. Localization with a monocular camera in LiDAR map is a newly emerged approach that achieves promising balance between cost and accuracy, but estimating pose by finding correspondences between such cross-modal sensor data is challenging, thereby damaging the localization accuracy. In this paper, we address the problem by proposing a novel Transformer-based neural network to register 2D images into 3D LiDAR map in an end-to-end manner. Poses are implicitly represented as high-dimensional feature vectors called pose queries and can be iteratively updated by interacting with the retrieved relevant information from cross-model features using attention mechanism in a proposed POse Estimator Transformer (POET) module. Moreover, we apply a multiple hypotheses aggregation method that estimates the final poses by performing parallel optimization on multiple randomly initialized pose queries to reduce the network uncertainty. Comprehensive analysis and experimental results on public benchmark conclude that the proposed image-to-LiDAR map localization network could achieve state-of-the-art performances in challenging cross-modal localization tasks.

翻译：高精度车辆定位是高级自动驾驶任务的关键技术。使用单目相机在激光雷达地图中进行定位是一种新兴方法，在成本与精度之间实现了有前景的平衡，但通过寻找此类跨模态传感器数据间的对应关系来估计姿态颇具挑战性，从而损害了定位精度。本文针对该问题，提出一种新型基于Transformer的神经网络，以端到端方式将2D图像配准到3D激光雷达地图。姿态被隐式表示为称为姿态查询的高维特征向量，并能在所提出的姿态估计Transformer模块中，通过注意力机制与从跨模态特征中检索的相关信息交互，实现迭代更新。此外，我们应用多假设聚合方法，通过对多个随机初始化的姿态查询执行并行优化来估计最终姿态，以降低网络不确定性。在公开基准上的全面分析与实验结果证明，所提出的图像到激光雷达地图定位网络能在具有挑战性的跨模态定位任务中达到最先进性能。

0

相关内容

估计/估计量

估计/估计量

CVPR 2023开会了！谷歌等最新《视觉上理解和解释注意力》教程，附152页ppt

CVPR 2023开会了！谷歌等最新《视觉上理解和解释注意力》教程，附152页ppt

专知会员服务

86+阅读 · 2023年6月19日

迁移学习简明教程，11页ppt

迁移学习简明教程，11页ppt

专知会员服务

109+阅读 · 2020年8月4日

【新书】数字图像(影像)处理手第二版，2176pdf，Mathematical Methods in Imaging

【新书】数字图像(影像)处理手第二版，2176pdf，Mathematical Methods in Imaging

专知会员服务

93+阅读 · 2020年2月12日

Deep Learning Based Detection and Correction of Cardiac MR Motion Artefacts During Reconstruction for High-Quality Segmentation

Deep Learning Based Detection and Correction of Cardiac MR Motion Artefacts During Reconstruction for High-Quality Segmentation

专知会员服务

59+阅读 · 2019年10月17日

《DeepGCNs: Making GCNs Go as Deep as CNNs》

《DeepGCNs: Making GCNs Go as Deep as CNNs》

专知会员服务

32+阅读 · 2019年10月17日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

[综述]深度学习下的场景文本检测与识别

[综述]深度学习下的场景文本检测与识别

专知会员服务

78+阅读 · 2019年10月10日

机器学习入门的经验与建议

机器学习入门的经验与建议

专知会员服务

94+阅读 · 2019年10月10日

【哈佛大学商学院课程Fall 2019】机器学习可解释性

【哈佛大学商学院课程Fall 2019】机器学习可解释性

专知会员服务

105+阅读 · 2019年10月9日

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

专知会员服务

41+阅读 · 2019年10月9日

“CVPR 2020 接受论文列表 1470篇论文都在这了

“CVPR 2020 接受论文列表 1470篇论文都在这了

专知

71+阅读 · 2020年6月10日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

ICLR2019最佳论文出炉

ICLR2019最佳论文出炉

专知

12+阅读 · 2019年5月6日

深度自进化聚类：Deep Self-Evolution Clustering

深度自进化聚类：Deep Self-Evolution Clustering

我爱读PAMI

15+阅读 · 2019年4月13日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

44+阅读 · 2019年1月3日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

【推荐】深度学习目标检测全面综述

【推荐】深度学习目标检测全面综述

机器学习研究会

21+阅读 · 2017年9月13日

【推荐】深度学习目标检测概览

【推荐】深度学习目标检测概览

机器学习研究会

10+阅读 · 2017年9月1日

基于Ag纳米结构阵列对N2H4的痕量检测及其SERS增强机制研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于DSM的建筑密集区域InSAR地形去除和相位解缠

国家自然科学基金

1+阅读 · 2015年12月31日

基于量子点增强金纳米孔洞阵列表面等离子共振的高灵敏度生物检测

国家自然科学基金

0+阅读 · 2013年12月31日

基于高光谱“图谱”全尺度信息的海上溢油检测与油种识别

国家自然科学基金

0+阅读 · 2012年12月31日

非线性发展方程解的性质和图像处理中的应用

国家自然科学基金

0+阅读 · 2012年12月31日

量子点输运电流的含频噪声谱的研究

国家自然科学基金

0+阅读 · 2012年12月31日

干旱诱导表达的苹果AsA转运蛋白功能和在抗逆中的作用分析

国家自然科学基金

0+阅读 · 2011年12月31日

城市地区形变测量中的多源传感器四维SAR层析成像

国家自然科学基金

0+阅读 · 2011年12月31日

孔隙岩石三维重构与应力波作用下变形破坏机制研究

国家自然科学基金

0+阅读 · 2009年12月31日

磁性Pickering乳液界面流变学研究

国家自然科学基金

0+阅读 · 2008年12月31日

What to Learn: Features, Image Transformations, or Both?

What to Learn: Features, Image Transformations, or Both?

Arxiv

0+阅读 · 2023年6月22日

Toward Automated Detection of Microbleeds with Anatomical Scale Localization: A Complete Clinical Diagnosis Support Using Deep Learning

Arxiv

0+阅读 · 2023年6月22日

Minimalist and High-Quality Panoramic Imaging with PSF-aware Transformers

Arxiv

0+阅读 · 2023年6月22日

HDPV-SLAM: Hybrid Depth-augmented Panoramic Visual SLAM for Mobile Mapping System with Tilted LiDAR and Panoramic Visual Camera

Arxiv

0+阅读 · 2023年6月22日

VMLoc: Variational Fusion For Learning-Based Multimodal Camera Localization

Arxiv

0+阅读 · 2023年6月22日

Local 3D Editing via 3D Distillation of CLIP Knowledge

Arxiv

0+阅读 · 2023年6月21日

LPFormer: LiDAR Pose Estimation Transformer with Multi-Task Network

Arxiv

0+阅读 · 2023年6月21日

HDVIO: Improving Localization and Disturbance Estimation with Hybrid Dynamics VIO

Arxiv

0+阅读 · 2023年6月20日

End-to-end 2D-3D Registration between Image and LiDAR Point Cloud for Vehicle Localization

Arxiv

0+阅读 · 2023年6月20日

Real-Time Simultaneous Localization and Mapping with LiDAR intensity

Arxiv

0+阅读 · 2023年6月19日

VIP会员

文章信息

相关主题

估计/估计量

最新内容

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

5+阅读 · 今天8:00

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

3+阅读 · 今天7:44

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

3+阅读 · 今天7:28

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

4+阅读 · 今天7:18

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

专知会员服务

5+阅读 · 今天7:07

军事欺骗：供作战战术指挥官使用的工具

军事欺骗：供作战战术指挥官使用的工具

专知会员服务

4+阅读 · 今天7:03

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

4+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

5+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

10+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

4+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

5+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

8+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

7+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

4+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

相关VIP内容

CVPR 2023开会了！谷歌等最新《视觉上理解和解释注意力》教程，附152页ppt

CVPR 2023开会了！谷歌等最新《视觉上理解和解释注意力》教程，附152页ppt

专知会员服务

86+阅读 · 2023年6月19日

迁移学习简明教程，11页ppt

迁移学习简明教程，11页ppt

专知会员服务

109+阅读 · 2020年8月4日

【新书】数字图像(影像)处理手第二版，2176pdf，Mathematical Methods in Imaging

【新书】数字图像(影像)处理手第二版，2176pdf，Mathematical Methods in Imaging

专知会员服务

93+阅读 · 2020年2月12日

Deep Learning Based Detection and Correction of Cardiac MR Motion Artefacts During Reconstruction for High-Quality Segmentation

Deep Learning Based Detection and Correction of Cardiac MR Motion Artefacts During Reconstruction for High-Quality Segmentation

专知会员服务

59+阅读 · 2019年10月17日

《DeepGCNs: Making GCNs Go as Deep as CNNs》

《DeepGCNs: Making GCNs Go as Deep as CNNs》

专知会员服务

32+阅读 · 2019年10月17日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

[综述]深度学习下的场景文本检测与识别

[综述]深度学习下的场景文本检测与识别

专知会员服务

78+阅读 · 2019年10月10日

机器学习入门的经验与建议

机器学习入门的经验与建议

专知会员服务

94+阅读 · 2019年10月10日

【哈佛大学商学院课程Fall 2019】机器学习可解释性

【哈佛大学商学院课程Fall 2019】机器学习可解释性

专知会员服务

105+阅读 · 2019年10月9日

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用

专知会员服务

41+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

重新思考无人机时代的生存能力

在人工智能加速决策环境中拓展OODA循环

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

装甲突击旅：现代战争思考、战斗与组织

相关资讯

“CVPR 2020 接受论文列表 1470篇论文都在这了

“CVPR 2020 接受论文列表 1470篇论文都在这了

专知

71+阅读 · 2020年6月10日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

ICLR2019最佳论文出炉

ICLR2019最佳论文出炉

专知

12+阅读 · 2019年5月6日

深度自进化聚类：Deep Self-Evolution Clustering

深度自进化聚类：Deep Self-Evolution Clustering

我爱读PAMI

15+阅读 · 2019年4月13日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

44+阅读 · 2019年1月3日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

【推荐】深度学习目标检测全面综述

【推荐】深度学习目标检测全面综述

机器学习研究会

21+阅读 · 2017年9月13日

【推荐】深度学习目标检测概览

【推荐】深度学习目标检测概览

机器学习研究会

10+阅读 · 2017年9月1日

相关论文

What to Learn: Features, Image Transformations, or Both?

What to Learn: Features, Image Transformations, or Both?

Arxiv

0+阅读 · 2023年6月22日

Toward Automated Detection of Microbleeds with Anatomical Scale Localization: A Complete Clinical Diagnosis Support Using Deep Learning

Arxiv

0+阅读 · 2023年6月22日

Minimalist and High-Quality Panoramic Imaging with PSF-aware Transformers

Arxiv

0+阅读 · 2023年6月22日

HDPV-SLAM: Hybrid Depth-augmented Panoramic Visual SLAM for Mobile Mapping System with Tilted LiDAR and Panoramic Visual Camera

Arxiv

0+阅读 · 2023年6月22日

VMLoc: Variational Fusion For Learning-Based Multimodal Camera Localization

Arxiv

0+阅读 · 2023年6月22日

Local 3D Editing via 3D Distillation of CLIP Knowledge

Arxiv

0+阅读 · 2023年6月21日

LPFormer: LiDAR Pose Estimation Transformer with Multi-Task Network

Arxiv

0+阅读 · 2023年6月21日

HDVIO: Improving Localization and Disturbance Estimation with Hybrid Dynamics VIO

Arxiv

0+阅读 · 2023年6月20日

End-to-end 2D-3D Registration between Image and LiDAR Point Cloud for Vehicle Localization

Arxiv

0+阅读 · 2023年6月20日

Real-Time Simultaneous Localization and Mapping with LiDAR intensity

Arxiv

0+阅读 · 2023年6月19日

相关基金

基于Ag纳米结构阵列对N2H4的痕量检测及其SERS增强机制研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于DSM的建筑密集区域InSAR地形去除和相位解缠

国家自然科学基金

1+阅读 · 2015年12月31日

基于量子点增强金纳米孔洞阵列表面等离子共振的高灵敏度生物检测

国家自然科学基金

0+阅读 · 2013年12月31日

基于高光谱“图谱”全尺度信息的海上溢油检测与油种识别

国家自然科学基金

0+阅读 · 2012年12月31日

非线性发展方程解的性质和图像处理中的应用

国家自然科学基金

0+阅读 · 2012年12月31日

量子点输运电流的含频噪声谱的研究

国家自然科学基金

0+阅读 · 2012年12月31日

干旱诱导表达的苹果AsA转运蛋白功能和在抗逆中的作用分析

国家自然科学基金

0+阅读 · 2011年12月31日

城市地区形变测量中的多源传感器四维SAR层析成像

国家自然科学基金

0+阅读 · 2011年12月31日

孔隙岩石三维重构与应力波作用下变形破坏机制研究

国家自然科学基金

0+阅读 · 2009年12月31日

磁性Pickering乳液界面流变学研究

国家自然科学基金

0+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员