流形不变性：理解用于地点识别的鲁棒视觉表示 (Invariance on Manifolds: Understanding Robust Visual Representations for Place Recognition) - 专知论文

会员服务 ·

0

流形 · 地点识别 · 识别 · 鲁棒 · 表示 ·

Invariance on Manifolds: Understanding Robust Visual Representations for Place Recognition

翻译：流形不变性：理解用于地点识别的鲁棒视觉表示

Jintao Cheng,Weibin Li,Zhijian He,Jin Wu,Chi Man Vong,Wei Zhang

from arxiv, 14pages, 5 figures

Visual Place Recognition (VPR) demands representations robust to drastic environmental and viewpoint shifts. Current aggregation paradigms, however, either rely on data-hungry supervision or simplistic first-order statistics, often neglecting intrinsic structural correlations. In this work, we propose a Second-Order Geometric Statistics framework that inherently captures geometric stability without training. We conceptualize scenes as covariance descriptors on the Symmetric Positive Definite (SPD) manifold, where perturbations manifest as tractable congruence transformations. By leveraging geometry-aware Riemannian mappings, we project these descriptors into a linearized Euclidean embedding, effectively decoupling signal structure from noise. Our approach introduces a training-free framework built upon fixed, pre-trained backbones, achieving strong zero-shot generalization without parameter updates. Extensive experiments confirm that our method achieves highly competitive performance against state-of-the-art baselines, particularly excelling in challenging zero-shot scenarios.

翻译：视觉地点识别要求表示对剧烈的环境和视角变化具有鲁棒性。然而，当前的聚合范式要么依赖于数据密集型的监督，要么采用简单的一阶统计量，往往忽略了内在的结构相关性。在本工作中，我们提出了一种二阶几何统计框架，该框架无需训练即可固有地捕获几何稳定性。我们将场景概念化为对称正定流形上的协方差描述符，其中扰动表现为可处理的合同变换。通过利用几何感知的黎曼映射，我们将这些描述符投影到线性化的欧几里得嵌入空间中，从而有效地将信号结构与噪声解耦。我们的方法引入了一种基于固定预训练主干网络的免训练框架，无需参数更新即可实现强大的零样本泛化能力。大量实验证实，我们的方法相较于最先进的基线模型取得了极具竞争力的性能，尤其在具有挑战性的零样本场景中表现优异。

0

相关内容

标注受限场景下的视觉表征与理解

标注受限场景下的视觉表征与理解

专知会员服务

14+阅读 · 2025年2月6日

视觉如何模型统一？牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

视觉如何模型统一？牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

专知会员服务

47+阅读 · 2024年8月11日

《面向视觉语言地理基础模型》综述

《面向视觉语言地理基础模型》综述

专知会员服务

47+阅读 · 2024年6月15日

【MIT博士论文】鲁棒几何感知的数据关联算法与表示，176页pdf

【MIT博士论文】鲁棒几何感知的数据关联算法与表示，176页pdf

专知会员服务

31+阅读 · 2024年2月3日

【NeurIPS2023】从视觉-语言基础模型中提取分布外鲁棒性

【NeurIPS2023】从视觉-语言基础模型中提取分布外鲁棒性

专知会员服务

21+阅读 · 2023年11月4日

西安交大等最新《鲁棒视觉问题回答》综述，20页pdf详述RVQA数据集、方法和未来挑战

西安交大等最新《鲁棒视觉问题回答》综述，20页pdf详述RVQA数据集、方法和未来挑战

专知会员服务

21+阅读 · 2023年7月25日

【阿姆斯特丹博士论文】可解释的视觉分类鲁棒性，102页pdf

【阿姆斯特丹博士论文】可解释的视觉分类鲁棒性，102页pdf

专知会员服务

42+阅读 · 2023年3月26日

用于识别任务的视觉 Transformer 综述

用于识别任务的视觉 Transformer 综述

专知会员服务

75+阅读 · 2023年2月25日

【AAAI2022】不确定性感知的多视角表示学习

【AAAI2022】不确定性感知的多视角表示学习

专知会员服务

47+阅读 · 2022年1月25日

鲁棒表示学习简述

专知会员服务

26+阅读 · 2021年4月13日

【DeepMind】CrossTransformers: 空间感知的小样本迁移

【DeepMind】CrossTransformers: 空间感知的小样本迁移

专知

37+阅读 · 2020年7月26日

【ICML2020】对比多视角表示学习

【ICML2020】对比多视角表示学习

专知

19+阅读 · 2020年6月28日

【ICML2020】多视角对比图表示学习，Contrastive Multi-View GRL

【ICML2020】多视角对比图表示学习，Contrastive Multi-View GRL

专知

37+阅读 · 2020年6月11日

【CVPR2020-台大】透视眼：学会透过障碍物看东西，Learning to See Through Obstructions

【CVPR2020-台大】透视眼：学会透过障碍物看东西，Learning to See Through Obstructions

专知

26+阅读 · 2020年4月3日

局部学习的特征选择：Local-Learning-Based Feature Selection

局部学习的特征选择：Local-Learning-Based Feature Selection

我爱读PAMI

14+阅读 · 2019年9月20日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

【论文推荐】最新六篇视觉问答相关论文—鲁棒性分析、虚拟意象、双曲注意力网络、R-VQA、关系推理、双线性注意力网络

【论文推荐】最新六篇视觉问答相关论文—鲁棒性分析、虚拟意象、双曲注意力网络、R-VQA、关系推理、双线性注意力网络

专知

17+阅读 · 2018年6月7日

【论文推荐】最新七篇视觉问答（VQA）相关论文—差别注意力机制、视觉问题推理、视觉对话、数据可视化、记忆增强网络、显式推理

【论文推荐】最新七篇视觉问答（VQA）相关论文—差别注意力机制、视觉问题推理、视觉对话、数据可视化、记忆增强网络、显式推理

专知

17+阅读 · 2018年4月19日

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

新智元

35+阅读 · 2018年1月24日

图上的归纳表示学习

图上的归纳表示学习

科技创新与创业

23+阅读 · 2017年11月9日

视觉识别中的实用鲁棒回归技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

视觉信息的局部特征表示及应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

对地观测传感网结点环境下地学工作流的构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于语义网络的街区场景相似性研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于记忆的不变图像特征学习方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

物体形状部分视觉显著性度量及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

面向生物特征识别的鲁棒判别结构化特征表示方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于空间认知常识的定性地理信息检索研究

国家自然科学基金

2+阅读 · 2014年12月31日

城市知识流的表征及其结构演化的复杂性研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于视觉注意与眼动跟踪的地图认知计算模型与方法研究

国家自然科学基金

6+阅读 · 2014年12月31日

View Invariant Learning for Vision-Language Navigation in Continuous Environments

View Invariant Learning for Vision-Language Navigation in Continuous Environments

Arxiv

0+阅读 · 2月18日

Robust Design in the Presence of Aleatoric and Epistemic Uncertainty

Arxiv

0+阅读 · 2月13日

Robustness Is a Function, Not a Number: A Factorized Comprehensive Study of OOD Robustness in Vision-Based Driving

Arxiv

0+阅读 · 2月9日

Through the Perspective of LiDAR: A Feature-Enriched and Uncertainty-Aware Annotation Pipeline for Terrestrial Point Cloud Segmentation

Arxiv

0+阅读 · 2月9日

CURVE: Learning Causality-Inspired Invariant Representations for Robust Scene Understanding via Uncertainty-Guided Regularization

Arxiv

0+阅读 · 1月28日

Locatability and Locatability Robustness of Visual Variables in Single Target Localization

Arxiv

0+阅读 · 1月27日

Towards Robust Evaluation of Visual Activity Recognition: Resolving Verb Ambiguity with Sense Clustering

Arxiv

0+阅读 · 1月25日

DC-VLAQ: Query-Residual Aggregation for Robust Visual Place Recognition

Arxiv

0+阅读 · 1月19日

Towards Implicit Aggregation: Robust Image Representation for Place Recognition in the Transformer Era

Arxiv

0+阅读 · 1月16日

Ensemble-Based Event Camera Place Recognition Under Varying Illumination

Arxiv

0+阅读 · 1月13日

VIP会员

文章信息

相关主题

相关VIP内容

标注受限场景下的视觉表征与理解

标注受限场景下的视觉表征与理解

专知会员服务

14+阅读 · 2025年2月6日

视觉如何模型统一？牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

视觉如何模型统一？牛津大学Shuyang Sun博士论文《迈向统一视觉感知》全面阐述

专知会员服务

47+阅读 · 2024年8月11日

《面向视觉语言地理基础模型》综述

《面向视觉语言地理基础模型》综述

专知会员服务

47+阅读 · 2024年6月15日

【MIT博士论文】鲁棒几何感知的数据关联算法与表示，176页pdf

【MIT博士论文】鲁棒几何感知的数据关联算法与表示，176页pdf

专知会员服务

31+阅读 · 2024年2月3日

【NeurIPS2023】从视觉-语言基础模型中提取分布外鲁棒性

【NeurIPS2023】从视觉-语言基础模型中提取分布外鲁棒性

专知会员服务

21+阅读 · 2023年11月4日

西安交大等最新《鲁棒视觉问题回答》综述，20页pdf详述RVQA数据集、方法和未来挑战

西安交大等最新《鲁棒视觉问题回答》综述，20页pdf详述RVQA数据集、方法和未来挑战

专知会员服务

21+阅读 · 2023年7月25日

【阿姆斯特丹博士论文】可解释的视觉分类鲁棒性，102页pdf

【阿姆斯特丹博士论文】可解释的视觉分类鲁棒性，102页pdf

专知会员服务

42+阅读 · 2023年3月26日

用于识别任务的视觉 Transformer 综述

用于识别任务的视觉 Transformer 综述

专知会员服务

75+阅读 · 2023年2月25日

【AAAI2022】不确定性感知的多视角表示学习

【AAAI2022】不确定性感知的多视角表示学习

专知会员服务

47+阅读 · 2022年1月25日

鲁棒表示学习简述

专知会员服务

26+阅读 · 2021年4月13日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人机与战争：被忽视的环境影响及无人机保护潜力》

俄罗斯规划未来无人机驱动军队

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

《人工智能、武器与影响力：前沿模型在模拟核危机中展现复杂推理》2026最新46页报告

相关资讯

【DeepMind】CrossTransformers: 空间感知的小样本迁移

【DeepMind】CrossTransformers: 空间感知的小样本迁移

专知

37+阅读 · 2020年7月26日

【ICML2020】对比多视角表示学习

【ICML2020】对比多视角表示学习

专知

19+阅读 · 2020年6月28日

【ICML2020】多视角对比图表示学习，Contrastive Multi-View GRL

【ICML2020】多视角对比图表示学习，Contrastive Multi-View GRL

专知

37+阅读 · 2020年6月11日

【CVPR2020-台大】透视眼：学会透过障碍物看东西，Learning to See Through Obstructions

【CVPR2020-台大】透视眼：学会透过障碍物看东西，Learning to See Through Obstructions

专知

26+阅读 · 2020年4月3日

局部学习的特征选择：Local-Learning-Based Feature Selection

局部学习的特征选择：Local-Learning-Based Feature Selection

我爱读PAMI

14+阅读 · 2019年9月20日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

【论文推荐】最新六篇视觉问答相关论文—鲁棒性分析、虚拟意象、双曲注意力网络、R-VQA、关系推理、双线性注意力网络

【论文推荐】最新六篇视觉问答相关论文—鲁棒性分析、虚拟意象、双曲注意力网络、R-VQA、关系推理、双线性注意力网络

专知

17+阅读 · 2018年6月7日

【论文推荐】最新七篇视觉问答（VQA）相关论文—差别注意力机制、视觉问题推理、视觉对话、数据可视化、记忆增强网络、显式推理

【论文推荐】最新七篇视觉问答（VQA）相关论文—差别注意力机制、视觉问题推理、视觉对话、数据可视化、记忆增强网络、显式推理

专知

17+阅读 · 2018年4月19日

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

新智元

35+阅读 · 2018年1月24日

图上的归纳表示学习

图上的归纳表示学习

科技创新与创业

23+阅读 · 2017年11月9日

相关论文

View Invariant Learning for Vision-Language Navigation in Continuous Environments

View Invariant Learning for Vision-Language Navigation in Continuous Environments

Arxiv

0+阅读 · 2月18日

Robust Design in the Presence of Aleatoric and Epistemic Uncertainty

Arxiv

0+阅读 · 2月13日

Robustness Is a Function, Not a Number: A Factorized Comprehensive Study of OOD Robustness in Vision-Based Driving

Arxiv

0+阅读 · 2月9日

Through the Perspective of LiDAR: A Feature-Enriched and Uncertainty-Aware Annotation Pipeline for Terrestrial Point Cloud Segmentation

Arxiv

0+阅读 · 2月9日

CURVE: Learning Causality-Inspired Invariant Representations for Robust Scene Understanding via Uncertainty-Guided Regularization

Arxiv

0+阅读 · 1月28日

Locatability and Locatability Robustness of Visual Variables in Single Target Localization

Arxiv

0+阅读 · 1月27日

Towards Robust Evaluation of Visual Activity Recognition: Resolving Verb Ambiguity with Sense Clustering

Arxiv

0+阅读 · 1月25日

DC-VLAQ: Query-Residual Aggregation for Robust Visual Place Recognition

Arxiv

0+阅读 · 1月19日

Towards Implicit Aggregation: Robust Image Representation for Place Recognition in the Transformer Era

Arxiv

0+阅读 · 1月16日

Ensemble-Based Event Camera Place Recognition Under Varying Illumination

Arxiv

0+阅读 · 1月13日

相关基金

视觉识别中的实用鲁棒回归技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

视觉信息的局部特征表示及应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

对地观测传感网结点环境下地学工作流的构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于语义网络的街区场景相似性研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于记忆的不变图像特征学习方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

物体形状部分视觉显著性度量及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

面向生物特征识别的鲁棒判别结构化特征表示方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于空间认知常识的定性地理信息检索研究

国家自然科学基金

2+阅读 · 2014年12月31日

城市知识流的表征及其结构演化的复杂性研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于视觉注意与眼动跟踪的地图认知计算模型与方法研究

国家自然科学基金

6+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员