Precision-Aware Illumination-Disentangled Vision Transformer for Spacecraft 6D Pose Estimation - 专知论文

会员服务 ·

0

位姿估计 · 解耦 · 精度 · 视觉Transformer · 鲁棒 ·

Precision-Aware Illumination-Disentangled Vision Transformer for Spacecraft 6D Pose Estimation

翻译：面向精度的光照解耦视觉Transformer用于航天器6D位姿估计

Zongwu Xie,Yifan Yang,Yonglong Zhang,Guanghu Xie,Yang Liu,Shuo Zhang

from arxiv, 11 pages, 7 figures

Vision sensors provide a lightweight solution for spacecraft proximity operations, but monocular spacecraft 6D pose estimation remains difficult under illumination variation, specular reflection, shadowing, weak texture, and background interference. These factors make local visual evidence spatially unreliable and can destabilize pose regression. This article proposes a Precision-Aware Illumination-Disentangled Vision Transformer (PAID-ViT) for robust spacecraft pose estimation.The proposed model separates pose-relevant structure tokens from illumination-sensitive appearance tokens, estimates patch reliability before pose aggregation, and uses foreground mask supervision to preserve silhouette cues. A parameter-free geometric recovery module converts normalized crop coordinates, log-depth, and a continuous 6D rotation representation into camera-frame rotation and translation. Experiments on SPEED+ V2, the SPEED+ validation/lightbox/sunlamp evaluation configuration used in this study, suggest that PAID-ViT reduces translation error and improves robustness in the challenging sunlamp domain, while ablation studies support the complementary roles of illumination disentanglement, reliability-aware token aggregation, mask supervision, and training-side regularization.

翻译：视觉传感器为航天器近距离操作提供了轻量级解决方案，但单目航天器6D位姿估计在光照变化、镜面反射、阴影、弱纹理和背景干扰等条件下仍面临困难。这些因素使得局部视觉证据在空间上不可靠，并可能破坏位姿回归的稳定性。本文提出了一种面向精度的光照解耦视觉Transformer（PAID-ViT），用于鲁棒的航天器位姿估计。所提出模型将位姿相关结构标记与光照敏感外观标记分离，在位姿聚合前估计图像块可靠性，并利用前景掩码监督以保留轮廓线索。一个无参数的几何恢复模块将归一化裁剪坐标、对数深度和连续6D旋转表示转换为相机坐标系下的旋转与平移。在SPEED+ V2（本研究使用的SPEED+验证/日光灯/太阳灯评估配置）上的实验表明，PAID-ViT在具有挑战性的太阳灯域中降低了平移误差并提升了鲁棒性，而消融研究则支撑了光照解耦、可靠性感知标记聚合、掩码监督与训练侧正则化的互补作用。

0

相关内容

位姿估计

基于Transformer的视觉分割技术进展

基于Transformer的视觉分割技术进展

专知会员服务

20+阅读 · 2025年2月10日

视觉如何模型统一？牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

视觉如何模型统一？牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

专知会员服务

47+阅读 · 2024年8月11日

【TPAMI2023】PSLT：一种带有梯形自注意力和逐步位移的轻量级视觉Transformer

【TPAMI2023】PSLT：一种带有梯形自注意力和逐步位移的轻量级视觉Transformer

专知会员服务

26+阅读 · 2023年9月4日

用于识别任务的视觉 Transformer 综述

用于识别任务的视觉 Transformer 综述

专知会员服务

75+阅读 · 2023年2月25日

《用于空间态势感知的长基线双基地雷达》北约STO 2022最新论文（含slides）

《用于空间态势感知的长基线双基地雷达》北约STO 2022最新论文（含slides）

专知会员服务

41+阅读 · 2022年11月22日

Transformers如何用于遥感？阿联酋MBZUAI最新《Transformers遥感处理》综述，涵盖60+种ViT遥感方法

Transformers如何用于遥感？阿联酋MBZUAI最新《Transformers遥感处理》综述，涵盖60+种ViT遥感方法

专知会员服务

58+阅读 · 2022年9月6日

Transformer如何用于3D视觉？阿联酋MBZUAI最新《3D视觉Transformers处理》综述，涵盖100+种方法

Transformer如何用于3D视觉？阿联酋MBZUAI最新《3D视觉Transformers处理》综述，涵盖100+种方法

专知会员服务

39+阅读 · 2022年8月9日

《视觉Transformer》最新简明综述，概述视觉Transformers 的不同架构设计和训练技巧

《视觉Transformer》最新简明综述，概述视觉Transformers 的不同架构设计和训练技巧

专知会员服务

67+阅读 · 2022年7月8日

【ICML2022】CtrlFormer: 通过Transformer学习视觉控制的可迁移状态表示

【ICML2022】CtrlFormer: 通过Transformer学习视觉控制的可迁移状态表示

专知会员服务

16+阅读 · 2022年6月21日

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

专知会员服务

52+阅读 · 2020年5月26日

【2023新书】深度学习与计算机视觉在遥感中的应用，572页pdf

【2023新书】深度学习与计算机视觉在遥感中的应用，572页pdf

专知

28+阅读 · 2023年4月6日

【干货书】《Transformers 机器学习:深度探究》，284页pdf

【干货书】《Transformers 机器学习:深度探究》，284页pdf

专知

72+阅读 · 2022年4月21日

【Tutorial】计算机视觉中的Transformer，98页ppt

【Tutorial】计算机视觉中的Transformer，98页ppt

专知

21+阅读 · 2021年10月25日

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

专知

18+阅读 · 2020年10月11日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知

14+阅读 · 2020年8月30日

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

专知

20+阅读 · 2020年3月1日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

【泡泡图灵智库】DenseFusion:基于迭代密集融合的6D目标姿态估计

【泡泡图灵智库】DenseFusion:基于迭代密集融合的6D目标姿态估计

泡泡机器人SLAM

16+阅读 · 2019年9月3日

多图带你读懂 Transformers 的工作原理

多图带你读懂 Transformers 的工作原理

AI研习社

10+阅读 · 2019年3月18日

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

商汤科技

14+阅读 · 2018年6月2日

多源信息融合的地外天体表面巡视定位方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于磁悬浮飞轮转子转轴主动偏转的航天器高稳定度姿态控制方法

国家自然科学基金

1+阅读 · 2016年12月31日

面向新颖成像模式的敏捷卫星姿态滚动优化控制

国家自然科学基金

0+阅读 · 2015年12月31日

基于在轨测量误差补偿的卫星高精度姿态确定方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

北斗IGSO/MEO卫星偏航姿态模式下的光压摄动理论和模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

仿生天空偏振光自主定位导航传感器关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

空间非合作目标基于点云模型的视觉与惯性融合相对导航方法与实验研究

国家自然科学基金

17+阅读 · 2015年12月31日

基于机器视觉的索缆六自由度位移测量方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于光流和运动核估计的航天器姿态运动参数估计方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

Gaussian Light Field Splatting: A Physical Prior-Driven Vision Transformer for Unsupervised Low-Light Image Enhancement

Arxiv

0+阅读 · 6月16日

Segmentation-based Detection for Efficient Multi-Task Spacecraft Perception

Arxiv

0+阅读 · 6月13日

Lightweight and Interpretable Transformer via Mixed Graph Algorithm Unrolling for Traffic Forecast

Arxiv

0+阅读 · 6月11日

Efficient Minimal Solvers for Relative Pose Estimation in Autonomous Driving Applications

Arxiv

0+阅读 · 6月8日

VGP-Nav: Metric-Aware Visual Geometric Perception for Robot Navigation

Arxiv

0+阅读 · 6月8日

Ultra Diffusion Poser: Diffusion-Based Human Motion Tracking From Sparse Inertial Sensors and Ranging-Based Between-Sensor Distances

Arxiv

0+阅读 · 6月1日

Recursive Vision Transformer with Dynamic Depth and Width Adjustment for Resource-Efficient Image Semantic Communication

Arxiv

0+阅读 · 5月27日

Evolving Layer-Specific Scalar Functions for Hardware-Aware Transformer Adaptation

Arxiv

0+阅读 · 5月13日

X-Imitator: Spatial-Aware Imitation Learning via Bidirectional Action-Pose Interaction

Arxiv

0+阅读 · 5月12日

Exploring 6D Object Pose Estimation with Deformation

Arxiv

0+阅读 · 5月11日

VIP会员

文章信息

相关主题

视觉Transformer

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

3+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

4+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

9+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

7+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

4+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

6+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

6+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

8+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

4+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

6+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

7+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

5+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

5+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

相关VIP内容

基于Transformer的视觉分割技术进展

基于Transformer的视觉分割技术进展

专知会员服务

20+阅读 · 2025年2月10日

视觉如何模型统一？牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

视觉如何模型统一？牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

专知会员服务

47+阅读 · 2024年8月11日

【TPAMI2023】PSLT：一种带有梯形自注意力和逐步位移的轻量级视觉Transformer

【TPAMI2023】PSLT：一种带有梯形自注意力和逐步位移的轻量级视觉Transformer

专知会员服务

26+阅读 · 2023年9月4日

用于识别任务的视觉 Transformer 综述

用于识别任务的视觉 Transformer 综述

专知会员服务

75+阅读 · 2023年2月25日

《用于空间态势感知的长基线双基地雷达》北约STO 2022最新论文（含slides）

《用于空间态势感知的长基线双基地雷达》北约STO 2022最新论文（含slides）

专知会员服务

41+阅读 · 2022年11月22日

Transformers如何用于遥感？阿联酋MBZUAI最新《Transformers遥感处理》综述，涵盖60+种ViT遥感方法

Transformers如何用于遥感？阿联酋MBZUAI最新《Transformers遥感处理》综述，涵盖60+种ViT遥感方法

专知会员服务

58+阅读 · 2022年9月6日

Transformer如何用于3D视觉？阿联酋MBZUAI最新《3D视觉Transformers处理》综述，涵盖100+种方法

Transformer如何用于3D视觉？阿联酋MBZUAI最新《3D视觉Transformers处理》综述，涵盖100+种方法

专知会员服务

39+阅读 · 2022年8月9日

《视觉Transformer》最新简明综述，概述视觉Transformers 的不同架构设计和训练技巧

《视觉Transformer》最新简明综述，概述视觉Transformers 的不同架构设计和训练技巧

专知会员服务

67+阅读 · 2022年7月8日

【ICML2022】CtrlFormer: 通过Transformer学习视觉控制的可迁移状态表示

【ICML2022】CtrlFormer: 通过Transformer学习视觉控制的可迁移状态表示

专知会员服务

16+阅读 · 2022年6月21日

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

专知会员服务

52+阅读 · 2020年5月26日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

【2023新书】深度学习与计算机视觉在遥感中的应用，572页pdf

【2023新书】深度学习与计算机视觉在遥感中的应用，572页pdf

专知

28+阅读 · 2023年4月6日

【干货书】《Transformers 机器学习:深度探究》，284页pdf

【干货书】《Transformers 机器学习:深度探究》，284页pdf

专知

72+阅读 · 2022年4月21日

【Tutorial】计算机视觉中的Transformer，98页ppt

【Tutorial】计算机视觉中的Transformer，98页ppt

专知

21+阅读 · 2021年10月25日

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

专知

18+阅读 · 2020年10月11日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知

14+阅读 · 2020年8月30日

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

Transformers就是图神经网络？NTU-Chaitanya Joshi论述: 是GNN的一个特例

专知

20+阅读 · 2020年3月1日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

【泡泡图灵智库】DenseFusion:基于迭代密集融合的6D目标姿态估计

【泡泡图灵智库】DenseFusion:基于迭代密集融合的6D目标姿态估计

泡泡机器人SLAM

16+阅读 · 2019年9月3日

多图带你读懂 Transformers 的工作原理

多图带你读懂 Transformers 的工作原理

AI研习社

10+阅读 · 2019年3月18日

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

CVPR 2018 | 商汤科技Spotlight论文详解：单目深度估计技术

商汤科技

14+阅读 · 2018年6月2日

相关论文

Gaussian Light Field Splatting: A Physical Prior-Driven Vision Transformer for Unsupervised Low-Light Image Enhancement

Arxiv

0+阅读 · 6月16日

Segmentation-based Detection for Efficient Multi-Task Spacecraft Perception

Arxiv

0+阅读 · 6月13日

Lightweight and Interpretable Transformer via Mixed Graph Algorithm Unrolling for Traffic Forecast

Arxiv

0+阅读 · 6月11日

Efficient Minimal Solvers for Relative Pose Estimation in Autonomous Driving Applications

Arxiv

0+阅读 · 6月8日

VGP-Nav: Metric-Aware Visual Geometric Perception for Robot Navigation

Arxiv

0+阅读 · 6月8日

Ultra Diffusion Poser: Diffusion-Based Human Motion Tracking From Sparse Inertial Sensors and Ranging-Based Between-Sensor Distances

Arxiv

0+阅读 · 6月1日

Recursive Vision Transformer with Dynamic Depth and Width Adjustment for Resource-Efficient Image Semantic Communication

Arxiv

0+阅读 · 5月27日

Evolving Layer-Specific Scalar Functions for Hardware-Aware Transformer Adaptation

Arxiv

0+阅读 · 5月13日

X-Imitator: Spatial-Aware Imitation Learning via Bidirectional Action-Pose Interaction

Arxiv

0+阅读 · 5月12日

Exploring 6D Object Pose Estimation with Deformation

Arxiv

0+阅读 · 5月11日

相关基金

多源信息融合的地外天体表面巡视定位方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于磁悬浮飞轮转子转轴主动偏转的航天器高稳定度姿态控制方法

国家自然科学基金

1+阅读 · 2016年12月31日

面向新颖成像模式的敏捷卫星姿态滚动优化控制

国家自然科学基金

0+阅读 · 2015年12月31日

基于在轨测量误差补偿的卫星高精度姿态确定方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

北斗IGSO/MEO卫星偏航姿态模式下的光压摄动理论和模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

仿生天空偏振光自主定位导航传感器关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

空间非合作目标基于点云模型的视觉与惯性融合相对导航方法与实验研究

国家自然科学基金

17+阅读 · 2015年12月31日

基于机器视觉的索缆六自由度位移测量方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于光流和运动核估计的航天器姿态运动参数估计方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的特征融合在移动机器人视觉中的场景理解及研究

国家自然科学基金

12+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员