6D Pose Estimation via Keypoint Heatmap Regression with RGB-D Residual Neural Networks - 专知论文

会员服务 ·

0

RGB-D · 姿态估计 · 残差神经网络 · 精度 · 融合 ·

6D Pose Estimation via Keypoint Heatmap Regression with RGB-D Residual Neural Networks

翻译：基于RGB-D残差神经网络的关键点热力图回归的6D姿态估计

Ismail Aljosevic,Amir Masoud Almasi,Ana Parovic,Ashkan Shafiei

from arxiv, Source code available at: https://github.com/ameermasood/HeatNet

In this paper, we propose a modular framework for 6D pose estimation based on keypoint heatmap regression. Our approach combines YOLOv10m for object detection with a ResNet18-based network that predicts 2D heatmaps from RGB images. Keypoints extracted from these heatmaps are used to estimate the 6D object pose via the PnP RANSAC algorithm. We compare different keypoint selection strategies to assess their impact on pose accuracy. Additionally, we extend the baseline by incorporating depth data using a cross-fusion architecture, which enables interaction between RGB and depth features at multiple stages. We further explore general training improvements, such as experimenting with activation functions and learning rate scheduling strategies to improve model performance. Our best RGB-only model achieved a mean ADD-based accuracy of 84.50%, while the RGB-D fusion model reached 92.41% on the LINEMOD dataset. The code is available at https://github.com/ameermasood/HeatNet.

翻译：本文提出了一种基于关键点热力图回归的模块化6D姿态估计框架。我们的方法结合了用于目标检测的YOLOv10m与基于ResNet18的网络，该网络可从RGB图像预测2D热力图。从这些热力图中提取的关键点通过PnP RANSAC算法用于估计物体的6D姿态。我们比较了不同的关键点选择策略，以评估它们对姿态精度的影响。此外，我们通过使用交叉融合架构引入深度数据来扩展基线模型，该架构能够在多个阶段实现RGB特征与深度特征的交互。我们进一步探索了通用的训练改进方法，例如尝试不同的激活函数和学习率调度策略以提升模型性能。我们最优的纯RGB模型在LINEMOD数据集上达到了84.50%的平均ADD精度，而RGB-D融合模型则达到了92.41%。代码开源于https://github.com/ameermasood/HeatNet。

0

相关内容

RGB-D

基于深度学习的物体姿态估计综述

基于深度学习的物体姿态估计综述

专知会员服务

26+阅读 · 2024年5月15日

《利用深度学习进行目标姿态估计》2023最新63页论文

《利用深度学习进行目标姿态估计》2023最新63页论文

专知会员服务

48+阅读 · 2023年8月29日

《红外点源目标的高精度中心估计》20页报告，美国陆军研究实验室

《红外点源目标的高精度中心估计》20页报告，美国陆军研究实验室

专知会员服务

32+阅读 · 2023年6月13日

【KDD2022】弱监督图神经网络：标签结构联合预测解决数据缺失问题

【KDD2022】弱监督图神经网络：标签结构联合预测解决数据缺失问题

专知会员服务

29+阅读 · 2022年8月28日

最新《深度学习人体姿态估计》综述论文，26页pdf

最新《深度学习人体姿态估计》综述论文，26页pdf

专知会员服务

40+阅读 · 2020年12月29日

KDD20 | 面向时态交互网络的数据驱动图生成模型

专知会员服务

24+阅读 · 2020年9月25日

【论文推荐】Stochastic Graph Neural Networks，随机图神经网络

【论文推荐】Stochastic Graph Neural Networks，随机图神经网络

专知会员服务

69+阅读 · 2020年6月6日

【CGAN论文笔记强烈推荐】基于CGAN的人脸深度图估计： Face Depth Estimation With Conditional Generative Adversarial Networks

专知会员服务

24+阅读 · 2020年1月8日

【论文】图神经网络有多强大？（How Powerful are Graph Neural Networks?），麻省理工学院研究生| Keyulu Xu，哈尔滨工业大学（深圳）助理教授| WeiHua Hu

【论文】图神经网络有多强大？（How Powerful are Graph Neural Networks?），麻省理工学院研究生| Keyulu Xu，哈尔滨工业大学（深圳）助理教授| WeiHua Hu

专知会员服务

65+阅读 · 2019年12月12日

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

19+阅读 · 2019年10月22日

(KDD'21) 异构图神经网络到底哪家强？清华、微软、阿里、中科院等推出HGB基准！

(KDD'21) 异构图神经网络到底哪家强？清华、微软、阿里、中科院等推出HGB基准！

学术头条

13+阅读 · 2021年11月9日

【泡泡点云时空】基于分割方法的物体六维姿态估计

【泡泡点云时空】基于分割方法的物体六维姿态估计

泡泡机器人SLAM

18+阅读 · 2019年9月15日

【泡泡图灵智库】DenseFusion:基于迭代密集融合的6D目标姿态估计

【泡泡图灵智库】DenseFusion:基于迭代密集融合的6D目标姿态估计

泡泡机器人SLAM

16+阅读 · 2019年9月3日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

计算机视觉方向简介 | 人体姿态估计

计算机视觉方向简介 | 人体姿态估计

计算机视觉life

28+阅读 · 2019年6月6日

深度学习人体姿态估计算法综述

深度学习人体姿态估计算法综述

AI前线

25+阅读 · 2019年5月19日

刷新三项COCO纪录！姿态估计模型HRNet开源了，中科大微软出品 | CVPR

刷新三项COCO纪录！姿态估计模型HRNet开源了，中科大微软出品 | CVPR

量子位

11+阅读 · 2019年2月28日

【泡泡图灵智库】基于CPU的实时6D物体姿态估计（arXiv）

【泡泡图灵智库】基于CPU的实时6D物体姿态估计（arXiv）

泡泡机器人SLAM

12+阅读 · 2019年1月26日

【泡泡一分钟】SSD6D：基于RGB的三维检测和6自由度位姿估计(ICCV2017-159)

【泡泡一分钟】SSD6D：基于RGB的三维检测和6自由度位姿估计(ICCV2017-159)

泡泡机器人SLAM

17+阅读 · 2018年10月12日

六种人体姿态估计的深度学习模型和代码总结

六种人体姿态估计的深度学习模型和代码总结

论智

19+阅读 · 2018年6月27日

基于时变回声状态网的光伏发电在线短期预测方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于在轨测量误差补偿的卫星高精度姿态确定方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向估计性能优化的网络化控制系统传感器调度

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

三维空间中基于图结构的人体姿态估计算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

热红外遥感图像模拟中异质异构地表像元辐射计算方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于稀疏表达理论和RGBD图像的人脸表情识别

国家自然科学基金

0+阅读 · 2015年12月31日

复杂纵向数据的分位回归建模及其在生物医学大数据中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

自组织递归二型小波模糊神经网络的研究及在微型飞行器姿态控制中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

带噪声 Radon 逆问题的点态估计

国家自然科学基金

0+阅读 · 2014年12月31日

PoseGAM: Robust Unseen Object Pose Estimation via Geometry-Aware Multi-View Reasoning

Arxiv

0+阅读 · 6月15日

Rotational Symmetry based Object Pose Estimation from Point Clouds in the Absence of Known 3D Models

Arxiv

0+阅读 · 6月15日

Generative Modeling on Metric Graphs via Neural Optimal Transport

Arxiv

0+阅读 · 6月15日

Debiased Inference for High-Dimensional Regression Models Based on Profile M-Estimation

Arxiv

0+阅读 · 6月15日

Spectrum Aware Illumination Estimation Using Multispectral Image

Arxiv

0+阅读 · 6月12日

Multi-Variable Stellar Parameter Estimation Using Residual Multitask Neural Networks

Arxiv

0+阅读 · 6月11日

G2G: Exploiting Intra-Group Geometry for Inter-Group Pose Estimation

Arxiv

0+阅读 · 6月6日

Unsupervised Monocular 3D Keypoint Discovery from Multi-View Diffusion Priors

Arxiv

0+阅读 · 6月4日

Bagged Polynomial Regression and Neural Networks

Arxiv

0+阅读 · 6月3日

Exploring 6D Object Pose Estimation with Deformation

Arxiv

0+阅读 · 5月11日

VIP会员

文章信息

相关主题

残差神经网络

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

3+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

4+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

9+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

8+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

5+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

7+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

6+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

10+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

4+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

6+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

7+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

6+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

5+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

相关VIP内容

基于深度学习的物体姿态估计综述

基于深度学习的物体姿态估计综述

专知会员服务

26+阅读 · 2024年5月15日

《利用深度学习进行目标姿态估计》2023最新63页论文

《利用深度学习进行目标姿态估计》2023最新63页论文

专知会员服务

48+阅读 · 2023年8月29日

《红外点源目标的高精度中心估计》20页报告，美国陆军研究实验室

《红外点源目标的高精度中心估计》20页报告，美国陆军研究实验室

专知会员服务

32+阅读 · 2023年6月13日

【KDD2022】弱监督图神经网络：标签结构联合预测解决数据缺失问题

【KDD2022】弱监督图神经网络：标签结构联合预测解决数据缺失问题

专知会员服务

29+阅读 · 2022年8月28日

最新《深度学习人体姿态估计》综述论文，26页pdf

最新《深度学习人体姿态估计》综述论文，26页pdf

专知会员服务

40+阅读 · 2020年12月29日

KDD20 | 面向时态交互网络的数据驱动图生成模型

专知会员服务

24+阅读 · 2020年9月25日

【论文推荐】Stochastic Graph Neural Networks，随机图神经网络

【论文推荐】Stochastic Graph Neural Networks，随机图神经网络

专知会员服务

69+阅读 · 2020年6月6日

【CGAN论文笔记强烈推荐】基于CGAN的人脸深度图估计： Face Depth Estimation With Conditional Generative Adversarial Networks

专知会员服务

24+阅读 · 2020年1月8日

【论文】图神经网络有多强大？（How Powerful are Graph Neural Networks?），麻省理工学院研究生| Keyulu Xu，哈尔滨工业大学（深圳）助理教授| WeiHua Hu

【论文】图神经网络有多强大？（How Powerful are Graph Neural Networks?），麻省理工学院研究生| Keyulu Xu，哈尔滨工业大学（深圳）助理教授| WeiHua Hu

专知会员服务

65+阅读 · 2019年12月12日

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

19+阅读 · 2019年10月22日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

(KDD'21) 异构图神经网络到底哪家强？清华、微软、阿里、中科院等推出HGB基准！

(KDD'21) 异构图神经网络到底哪家强？清华、微软、阿里、中科院等推出HGB基准！

学术头条

13+阅读 · 2021年11月9日

【泡泡点云时空】基于分割方法的物体六维姿态估计

【泡泡点云时空】基于分割方法的物体六维姿态估计

泡泡机器人SLAM

18+阅读 · 2019年9月15日

【泡泡图灵智库】DenseFusion:基于迭代密集融合的6D目标姿态估计

【泡泡图灵智库】DenseFusion:基于迭代密集融合的6D目标姿态估计

泡泡机器人SLAM

16+阅读 · 2019年9月3日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

计算机视觉方向简介 | 人体姿态估计

计算机视觉方向简介 | 人体姿态估计

计算机视觉life

28+阅读 · 2019年6月6日

深度学习人体姿态估计算法综述

深度学习人体姿态估计算法综述

AI前线

25+阅读 · 2019年5月19日

刷新三项COCO纪录！姿态估计模型HRNet开源了，中科大微软出品 | CVPR

刷新三项COCO纪录！姿态估计模型HRNet开源了，中科大微软出品 | CVPR

量子位

11+阅读 · 2019年2月28日

【泡泡图灵智库】基于CPU的实时6D物体姿态估计（arXiv）

【泡泡图灵智库】基于CPU的实时6D物体姿态估计（arXiv）

泡泡机器人SLAM

12+阅读 · 2019年1月26日

【泡泡一分钟】SSD6D：基于RGB的三维检测和6自由度位姿估计(ICCV2017-159)

【泡泡一分钟】SSD6D：基于RGB的三维检测和6自由度位姿估计(ICCV2017-159)

泡泡机器人SLAM

17+阅读 · 2018年10月12日

六种人体姿态估计的深度学习模型和代码总结

六种人体姿态估计的深度学习模型和代码总结

论智

19+阅读 · 2018年6月27日

相关论文

PoseGAM: Robust Unseen Object Pose Estimation via Geometry-Aware Multi-View Reasoning

Arxiv

0+阅读 · 6月15日

Rotational Symmetry based Object Pose Estimation from Point Clouds in the Absence of Known 3D Models

Arxiv

0+阅读 · 6月15日

Generative Modeling on Metric Graphs via Neural Optimal Transport

Arxiv

0+阅读 · 6月15日

Debiased Inference for High-Dimensional Regression Models Based on Profile M-Estimation

Arxiv

0+阅读 · 6月15日

Spectrum Aware Illumination Estimation Using Multispectral Image

Arxiv

0+阅读 · 6月12日

Multi-Variable Stellar Parameter Estimation Using Residual Multitask Neural Networks

Arxiv

0+阅读 · 6月11日

G2G: Exploiting Intra-Group Geometry for Inter-Group Pose Estimation

Arxiv

0+阅读 · 6月6日

Unsupervised Monocular 3D Keypoint Discovery from Multi-View Diffusion Priors

Arxiv

0+阅读 · 6月4日

Bagged Polynomial Regression and Neural Networks

Arxiv

0+阅读 · 6月3日

Exploring 6D Object Pose Estimation with Deformation

Arxiv

0+阅读 · 5月11日

相关基金

基于时变回声状态网的光伏发电在线短期预测方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于在轨测量误差补偿的卫星高精度姿态确定方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向估计性能优化的网络化控制系统传感器调度

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的复杂退化模糊图像恢复

国家自然科学基金

5+阅读 · 2015年12月31日

三维空间中基于图结构的人体姿态估计算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

热红外遥感图像模拟中异质异构地表像元辐射计算方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于稀疏表达理论和RGBD图像的人脸表情识别

国家自然科学基金

0+阅读 · 2015年12月31日

复杂纵向数据的分位回归建模及其在生物医学大数据中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

自组织递归二型小波模糊神经网络的研究及在微型飞行器姿态控制中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

带噪声 Radon 逆问题的点态估计

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员