Cov2Pose: Leveraging Spatial Covariance for Direct Manifold-aware 6-DoF Object Pose Estimation - 专知论文

会员服务 ·

0

方差 · 流形 · 池化 · 表示 · 物体姿态估计 ·

Cov2Pose: Leveraging Spatial Covariance for Direct Manifold-aware 6-DoF Object Pose Estimation

翻译：Cov2Pose：利用空间协方差实现直接且具有流形感知的6-DoF物体姿态估计

Nassim Ali Ousalah,Peyman Rostami,Vincent Gaudillière,Emmanuel Koumandakis,Anis Kacem,Enjie Ghorbel,Djamila Aouada

from arxiv, Accepted to the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) 2026

In this paper, we address the problem of 6-DoF object pose estimation from a single RGB image. Indirect methods that typically predict intermediate 2D keypoints, followed by a Perspective-n-Point solver, have shown great performance. Direct approaches, which regress the pose in an end-to-end manner, are usually computationally more efficient but less accurate. However, direct heads rely on globally pooled features, ignoring spatial second-order statistics despite their informativeness in pose prediction. They also predict, in most cases, discontinuous pose representations that lack robustness. Herein, we therefore propose a covariance-pooled representation that encodes convolutional feature distributions as a symmetric positive definite (SPD) matrix. Moreover, we propose a novel pose encoding in the form of an SPD matrix via its Cholesky decomposition. Pose is then regressed in an end-to-end manner with a manifold-aware network head, taking into account the Riemannian geometry of SPD matrices. Experiments and ablations consistently demonstrate the relevance of second-order pooling and continuous representations for direct pose regression, including under partial occlusion.

翻译：本文研究了从单张RGB图像中估计6-DoF物体姿态的问题。间接方法通常先预测中间2D关键点，再通过Perspective-n-Point求解器处理，已展现出优异性能。直接方法以端到端方式回归姿态，通常计算效率更高但精度较低。然而，直接预测头依赖于全局池化特征，忽略了空间二阶统计量（尽管其对姿态预测具有信息价值）。同时，多数情况下它们预测的离散姿态表示缺乏鲁棒性。为此，本文提出一种协方差池化表示，将卷积特征分布编码为对称正定矩阵。此外，通过其Cholesky分解，我们提出一种新颖的SPD矩阵形式的姿态编码。利用一种考虑SPD矩阵黎曼几何的流形感知网络头，以端到端方式回归姿态。实验和消融研究一致证明了二阶池化与连续表示在直接姿态回归（包括部分遮挡场景）中的有效性。

0

相关内容

基于深度学习的物体姿态估计综述

基于深度学习的物体姿态估计综述

专知会员服务

26+阅读 · 2024年5月15日

《利用深度学习进行目标姿态估计》2023最新63页论文

《利用深度学习进行目标姿态估计》2023最新63页论文

专知会员服务

48+阅读 · 2023年8月29日

《通过深度学习进行军事系统的目标姿态估计》2022美国海军研究生院88页论文

《通过深度学习进行军事系统的目标姿态估计》2022美国海军研究生院88页论文

专知会员服务

40+阅读 · 2022年10月6日

【CVPR 2022】基于实例深度估计的统一深度感知全景分割 PanopticDepth: Per-Instance Depth Estimation for Unified Depth-Aware Panoptic Segmentation

【CVPR 2022】基于实例深度估计的统一深度感知全景分割 PanopticDepth: Per-Instance Depth Estimation for Unified Depth-Aware Panoptic Segmentation

专知会员服务

18+阅读 · 2022年3月19日

【TPAMI2022】基于立体深度估计的深度学习技术综述，A Survey on Deep Learning Techniques for Stereo-based Depth Estimation

【TPAMI2022】基于立体深度估计的深度学习技术综述，A Survey on Deep Learning Techniques for Stereo-based Depth Estimation

专知会员服务

21+阅读 · 2022年3月10日

【博士论文】基于深度学习的单目场景深度估计方法研究

【博士论文】基于深度学习的单目场景深度估计方法研究

专知会员服务

57+阅读 · 2021年12月8日

ICCV 2021 | 半监督二维人体姿态估计中的模型坍塌问题研究（代码已开源）

专知会员服务

12+阅读 · 2021年10月1日

【三维物体和手部姿态估计】综述论文最新进展，Recent Advances in 3D Object and Hand Pose Estimation

【三维物体和手部姿态估计】综述论文最新进展，Recent Advances in 3D Object and Hand Pose Estimation

专知会员服务

21+阅读 · 2020年6月13日

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

专知会员服务

25+阅读 · 2020年4月2日

【深度估计| 2019最新综述】单目深度估计方法综述（Monocular Depth Estimation: A Survey）

专知会员服务

69+阅读 · 2019年11月23日

【泡泡点云时空】基于分割方法的物体六维姿态估计

【泡泡点云时空】基于分割方法的物体六维姿态估计

泡泡机器人SLAM

18+阅读 · 2019年9月15日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

计算机视觉方向简介 | 人体姿态估计

计算机视觉方向简介 | 人体姿态估计

计算机视觉life

28+阅读 · 2019年6月6日

深度学习人体姿态估计算法综述

深度学习人体姿态估计算法综述

AI前线

25+阅读 · 2019年5月19日

使用双目相机进行三维重建第二部分：姿态估计

使用双目相机进行三维重建第二部分：姿态估计

AI研习社

12+阅读 · 2019年5月7日

【泡泡图灵智库】基于CPU的实时6D物体姿态估计（arXiv）

【泡泡图灵智库】基于CPU的实时6D物体姿态估计（arXiv）

泡泡机器人SLAM

12+阅读 · 2019年1月26日

六种人体姿态估计的深度学习模型和代码总结

六种人体姿态估计的深度学习模型和代码总结

论智

19+阅读 · 2018年6月27日

【论文推荐】最新六篇图像检索相关论文—多模态反馈、二值约束深度哈希、绘制草图、对话交互式、多目标图像检索

【论文推荐】最新六篇图像检索相关论文—多模态反馈、二值约束深度哈希、绘制草图、对话交互式、多目标图像检索

专知

14+阅读 · 2018年6月11日

【论文推荐】最新6篇视觉问答（VQA）相关论文—目标推理、深度循环模型、可解释性、数据可视化、Triplet学习、基准

【论文推荐】最新6篇视觉问答（VQA）相关论文—目标推理、深度循环模型、可解释性、数据可视化、Triplet学习、基准

专知

15+阅读 · 2018年2月3日

干货|张锋 2D单人人体姿态估计及其应用（PPT+视频）

干货|张锋 2D单人人体姿态估计及其应用（PPT+视频）

极市平台

12+阅读 · 2018年2月2日

基于改进型视觉注意模型的多模态极相似图像检索方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于特征学习的空间非合作目标单目视觉位姿测量研究

国家自然科学基金

2+阅读 · 2015年12月31日

三维空间中基于图结构的人体姿态估计算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于状态空间的视觉伺服系统参数估计方法研究及应用

国家自然科学基金

1+阅读 · 2015年12月31日

MRF模型的车载全景视觉位姿估计最优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于支撑函数的不规则形态扩展目标建模和估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于光流和运动核估计的航天器姿态运动参数估计方法

国家自然科学基金

0+阅读 · 2015年12月31日

多视环境下基于变分水平集的场景流估计

国家自然科学基金

0+阅读 · 2015年12月31日

非局部总变差正则化图像恢复模型的快速子空间校正算法

国家自然科学基金

0+阅读 · 2014年12月31日

协方差阵的推断及在方向数据分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

Temporally Consistent Object 6D Pose Estimation for Robot Control

Temporally Consistent Object 6D Pose Estimation for Robot Control

Arxiv

0+阅读 · 5月4日

GMGaze: MoE-Based Context-Aware Gaze Estimation with CLIP and Multiscale Transformer

Arxiv

0+阅读 · 5月1日

MAPRPose: Mask-Aware Proposal and Amodal Refinement for Multi-Object 6D Pose Estimation

Arxiv

0+阅读 · 4月22日

Inference on covariance structure in high-dimensional multi-view data

Arxiv

0+阅读 · 4月16日

Complementary Filtering on SO(3) for Attitude Estimation with Scalar Measurements

Arxiv

0+阅读 · 4月9日

Covariance Matrix Estimation for High-Dimensional Interval-Valued Data with Positive Definiteness

Arxiv

0+阅读 · 4月1日

Equivariant symmetry-aware head pose estimation for fetal MRI

Arxiv

0+阅读 · 3月30日

Geometrically Plausible Object Pose Refinement using Differentiable Simulation

Arxiv

0+阅读 · 3月22日

GraphiContact: Pose-aware Human-Scene Robust Contact Perception for Interactive Systems

Arxiv

0+阅读 · 3月19日

Equivariant symmetry-aware head pose estimation for fetal MRI

Arxiv

0+阅读 · 3月18日

VIP会员

文章信息

相关主题

物体姿态估计

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

3+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

2+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

3+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

3+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

3+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

3+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

4+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

21+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

基于深度学习的物体姿态估计综述

基于深度学习的物体姿态估计综述

专知会员服务

26+阅读 · 2024年5月15日

《利用深度学习进行目标姿态估计》2023最新63页论文

《利用深度学习进行目标姿态估计》2023最新63页论文

专知会员服务

48+阅读 · 2023年8月29日

《通过深度学习进行军事系统的目标姿态估计》2022美国海军研究生院88页论文

《通过深度学习进行军事系统的目标姿态估计》2022美国海军研究生院88页论文

专知会员服务

40+阅读 · 2022年10月6日

【CVPR 2022】基于实例深度估计的统一深度感知全景分割 PanopticDepth: Per-Instance Depth Estimation for Unified Depth-Aware Panoptic Segmentation

【CVPR 2022】基于实例深度估计的统一深度感知全景分割 PanopticDepth: Per-Instance Depth Estimation for Unified Depth-Aware Panoptic Segmentation

专知会员服务

18+阅读 · 2022年3月19日

【TPAMI2022】基于立体深度估计的深度学习技术综述，A Survey on Deep Learning Techniques for Stereo-based Depth Estimation

【TPAMI2022】基于立体深度估计的深度学习技术综述，A Survey on Deep Learning Techniques for Stereo-based Depth Estimation

专知会员服务

21+阅读 · 2022年3月10日

【博士论文】基于深度学习的单目场景深度估计方法研究

【博士论文】基于深度学习的单目场景深度估计方法研究

专知会员服务

57+阅读 · 2021年12月8日

ICCV 2021 | 半监督二维人体姿态估计中的模型坍塌问题研究（代码已开源）

专知会员服务

12+阅读 · 2021年10月1日

【三维物体和手部姿态估计】综述论文最新进展，Recent Advances in 3D Object and Hand Pose Estimation

【三维物体和手部姿态估计】综述论文最新进展，Recent Advances in 3D Object and Hand Pose Estimation

专知会员服务

21+阅读 · 2020年6月13日

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

CVPR 2020 | MetaFuse：用于人体姿态估计的预训练信息融合模型

专知会员服务

25+阅读 · 2020年4月2日

【深度估计| 2019最新综述】单目深度估计方法综述（Monocular Depth Estimation: A Survey）

专知会员服务

69+阅读 · 2019年11月23日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

【泡泡点云时空】基于分割方法的物体六维姿态估计

【泡泡点云时空】基于分割方法的物体六维姿态估计

泡泡机器人SLAM

18+阅读 · 2019年9月15日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

计算机视觉方向简介 | 人体姿态估计

计算机视觉方向简介 | 人体姿态估计

计算机视觉life

28+阅读 · 2019年6月6日

深度学习人体姿态估计算法综述

深度学习人体姿态估计算法综述

AI前线

25+阅读 · 2019年5月19日

使用双目相机进行三维重建第二部分：姿态估计

使用双目相机进行三维重建第二部分：姿态估计

AI研习社

12+阅读 · 2019年5月7日

【泡泡图灵智库】基于CPU的实时6D物体姿态估计（arXiv）

【泡泡图灵智库】基于CPU的实时6D物体姿态估计（arXiv）

泡泡机器人SLAM

12+阅读 · 2019年1月26日

六种人体姿态估计的深度学习模型和代码总结

六种人体姿态估计的深度学习模型和代码总结

论智

19+阅读 · 2018年6月27日

【论文推荐】最新六篇图像检索相关论文—多模态反馈、二值约束深度哈希、绘制草图、对话交互式、多目标图像检索

【论文推荐】最新六篇图像检索相关论文—多模态反馈、二值约束深度哈希、绘制草图、对话交互式、多目标图像检索

专知

14+阅读 · 2018年6月11日

【论文推荐】最新6篇视觉问答（VQA）相关论文—目标推理、深度循环模型、可解释性、数据可视化、Triplet学习、基准

【论文推荐】最新6篇视觉问答（VQA）相关论文—目标推理、深度循环模型、可解释性、数据可视化、Triplet学习、基准

专知

15+阅读 · 2018年2月3日

干货|张锋 2D单人人体姿态估计及其应用（PPT+视频）

干货|张锋 2D单人人体姿态估计及其应用（PPT+视频）

极市平台

12+阅读 · 2018年2月2日

相关论文

Temporally Consistent Object 6D Pose Estimation for Robot Control

Temporally Consistent Object 6D Pose Estimation for Robot Control

Arxiv

0+阅读 · 5月4日

GMGaze: MoE-Based Context-Aware Gaze Estimation with CLIP and Multiscale Transformer

Arxiv

0+阅读 · 5月1日

MAPRPose: Mask-Aware Proposal and Amodal Refinement for Multi-Object 6D Pose Estimation

Arxiv

0+阅读 · 4月22日

Inference on covariance structure in high-dimensional multi-view data

Arxiv

0+阅读 · 4月16日

Complementary Filtering on SO(3) for Attitude Estimation with Scalar Measurements

Arxiv

0+阅读 · 4月9日

Covariance Matrix Estimation for High-Dimensional Interval-Valued Data with Positive Definiteness

Arxiv

0+阅读 · 4月1日

Equivariant symmetry-aware head pose estimation for fetal MRI

Arxiv

0+阅读 · 3月30日

Geometrically Plausible Object Pose Refinement using Differentiable Simulation

Arxiv

0+阅读 · 3月22日

GraphiContact: Pose-aware Human-Scene Robust Contact Perception for Interactive Systems

Arxiv

0+阅读 · 3月19日

Equivariant symmetry-aware head pose estimation for fetal MRI

Arxiv

0+阅读 · 3月18日

相关基金

基于改进型视觉注意模型的多模态极相似图像检索方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于特征学习的空间非合作目标单目视觉位姿测量研究

国家自然科学基金

2+阅读 · 2015年12月31日

三维空间中基于图结构的人体姿态估计算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于状态空间的视觉伺服系统参数估计方法研究及应用

国家自然科学基金

1+阅读 · 2015年12月31日

MRF模型的车载全景视觉位姿估计最优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于支撑函数的不规则形态扩展目标建模和估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于光流和运动核估计的航天器姿态运动参数估计方法

国家自然科学基金

0+阅读 · 2015年12月31日

多视环境下基于变分水平集的场景流估计

国家自然科学基金

0+阅读 · 2015年12月31日

非局部总变差正则化图像恢复模型的快速子空间校正算法

国家自然科学基金

0+阅读 · 2014年12月31日

协方差阵的推断及在方向数据分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员