GeoLink: A 3D-Aware Framework Towards Better Generalization in Cross-View Geo-Localization - 专知论文

会员服务 ·

0

泛化 · 三维感知 · 泛化性 · 一致 · 冗余 ·

GeoLink: A 3D-Aware Framework Towards Better Generalization in Cross-View Geo-Localization

翻译：GeoLink：面向跨视角地理定位更好泛化性的三维感知框架

Hongyang Zhang,Yinhao Liu,Haitao Zhang,Zhongyi Wen,Zhenyu Kuang,Shuxian Liang,Xiansheng Hua

Generalizable cross-view geo-localization aims to match the same location across views in unseen regions and conditions without GPS supervision. Its core difficulty lies in severe semantic inconsistency caused by viewpoint variation and poor generalization under domain shift. Existing methods mainly rely on 2D correspondence, but they are easily distracted by redundant shared information across views, leading to less transferable representations. To address this, we propose GeoLink, a 3D-aware semantic-consistent framework for Generalizable cross-view geo-localization. Specifically, we offline reconstruct scene point clouds from multi-view drone images using VGGT, providing stable structural priors. Based on these 3D anchors, we improve 2D representation learning in two complementary ways. A Geometric-aware Semantic Refinement module mitigates potentially redundant and view-biased dependencies in 2D features under 3D guidance. In addition, a Unified View Relation Distillation module transfers 3D structural relations to 2D features, improving cross-view alignment while preserving a 2D-only inference pipeline. Extensive experiments on multiple benchmarks show that GeoLink consistently outperforms state-of-the-art methods and achieves superior generalization across unseen domains and diverse weather environments.

翻译：可泛化跨视角地理定位旨在无GPS监督条件下，在未见区域和不同场景中匹配同一位置的不同视角图像。其核心难点在于视角变化导致的严重语义不一致性，以及域偏移下的泛化能力不足。现有方法主要依赖二维特征对应关系，但容易受跨视角冗余共享信息干扰，导致表征迁移性较弱。为此，我们提出GeoLink——一个面向可泛化跨视角地理定位的三维感知语义一致性框架。具体而言，我们利用VGGT离线从多视角无人机影像中重建场景点云，提供稳定的结构先验。基于这些三维锚点，我们从两个互补方向改进二维表征学习：在三维引导下，几何感知语义精炼模块可缓解二维特征中潜在的冗余和视角偏差依赖；此外，统一视角关系蒸馏模块将三维结构关系迁移至二维特征，在保持仅需二维推理的流水线前提下提升跨视角对齐效果。在多个基准数据集上的大量实验表明，GeoLink持续超越现有最优方法，在未见域和多样化天气环境下均取得优异的泛化性能。

0

相关内容

OpenEarthAgent：一种面向工具增强型地理空间智能体的统一框架

OpenEarthAgent：一种面向工具增强型地理空间智能体的统一框架

专知会员服务

16+阅读 · 2月20日

卫星导航技术发展综述

卫星导航技术发展综述

专知会员服务

8+阅读 · 2025年7月11日

《战场GPS拒止环境下基于地标定位的安全路径导航》

《战场GPS拒止环境下基于地标定位的安全路径导航》

专知会员服务

20+阅读 · 2025年5月22日

27页综述，354篇参考文献！最详尽的视觉定位综述来了

27页综述，354篇参考文献！最详尽的视觉定位综述来了

专知会员服务

21+阅读 · 2025年2月20日

面向天域感知领域的知识图谱构建技术研究

面向天域感知领域的知识图谱构建技术研究

专知会员服务

55+阅读 · 2023年10月15日

《GeoHexViz：用于可视化六边形分类的地理空间数据Python包》

《GeoHexViz：用于可视化六边形分类的地理空间数据Python包》

专知会员服务

30+阅读 · 2023年6月11日

混合增强视觉认知架构及其关键技术进展

混合增强视觉认知架构及其关键技术进展

专知会员服务

46+阅读 · 2021年11月20日

最新「智能车联网」综述论文，170篇文献全面概述智能车联网（VANETs）技术

专知会员服务

26+阅读 · 2021年8月9日

三维视觉前沿进展

专知会员服务

67+阅读 · 2021年5月21日

基于深度学习的视觉多目标跟踪算法综述

专知会员服务

51+阅读 · 2021年4月15日

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

LinkTrack UWB高精度定位系统首发，一套可以随时搭建的"小卫星"定位系统，集定位|导航|授时|通信于一体

LinkTrack UWB高精度定位系统首发，一套可以随时搭建的"小卫星"定位系统，集定位|导航|授时|通信于一体

无人机

10+阅读 · 2019年7月18日

《视觉跟踪最新方法与趋势》，44页最新综述带你全面了解视觉跟踪领域发展方向

《视觉跟踪最新方法与趋势》，44页最新综述带你全面了解视觉跟踪领域发展方向

专知

32+阅读 · 2019年5月22日

自动驾驶车辆定位技术概述｜厚势汽车

自动驾驶车辆定位技术概述｜厚势汽车

厚势

10+阅读 · 2019年5月16日

【泡泡点云时空】GeoNet：基于测地距离的点云分析深度网络

【泡泡点云时空】GeoNet：基于测地距离的点云分析深度网络

泡泡机器人SLAM

11+阅读 · 2019年5月8日

吊打YOLOv3！普林斯顿大学提出：CornerNet-Lite，基于关键点的实时且精度高的目标检测算法，已开源！

吊打YOLOv3！普林斯顿大学提出：CornerNet-Lite，基于关键点的实时且精度高的目标检测算法，已开源！

极市平台

30+阅读 · 2019年4月20日

中科院牛津华为诺亚提出：CenterNet，One-stage目标检测最强算法！可达47mAP，已开源！

中科院牛津华为诺亚提出：CenterNet，One-stage目标检测最强算法！可达47mAP，已开源！

极市平台

19+阅读 · 2019年4月18日

ECCV发布：228页教程全面理解视觉定位技术

ECCV发布：228页教程全面理解视觉定位技术

专知

17+阅读 · 2018年9月12日

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

专知

13+阅读 · 2018年5月26日

GIS最新热点以及未来发展热门

GIS最新热点以及未来发展热门

人工智能学家

10+阅读 · 2018年3月29日

面向隐私保护的地理社交网络个性化推荐方法研究

国家自然科学基金

2+阅读 · 2017年12月31日

仿动物大脑网格细胞神经定位机制的同步定位与地图构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于异构信息网络的地理共享数据个性化检索研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于空间认知常识的定性地理信息检索研究

国家自然科学基金

2+阅读 · 2014年12月31日

多特征融合与集成学习的城市高分辨率遥感影像变化检测

国家自然科学基金

4+阅读 · 2014年12月31日

基于组态地理实体符号的传感器实时监控关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于视觉注意与眼动跟踪的地图认知计算模型与方法研究

国家自然科学基金

6+阅读 · 2014年12月31日

超光谱、全偏振、立体形貌的多模态成像研究

国家自然科学基金

0+阅读 · 2014年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

CrossMaps: Confidence-Aware Open-Vocabulary Semantic Mapping for Rover Navigation

Arxiv

0+阅读 · 6月15日

LOCUS: Local Visual Cue Search for Enhancing Fine-Grained Perception in Multimodal Large Language Models

Arxiv

0+阅读 · 6月15日

Training-Free Open-Vocabulary Visual Grounding for Remote Sensing Images and Videos

Arxiv

0+阅读 · 6月15日

Intelligent Multimodal Retrieval and Reasoning for Geospatial Knowledge Discovery on the I-GUIDE Platform

Arxiv

0+阅读 · 6月14日

InfoGeo: Information-Theoretic Object-Centric Learning for Cross-View Generalizable UAV Geo-Localization

Arxiv

0+阅读 · 6月14日

WAM-Nav: Asymmetric Latent World-Action Modeling for Unified Visual Navigation

Arxiv

0+阅读 · 6月13日

SinGeo: Unlock Single Model's Potential for Robust Cross-View Geo-Localization

Arxiv

0+阅读 · 6月12日

Co-GLANCE: Uncertainty-Aware Active Perception for Heterogeneous Robot Teaming

Arxiv

0+阅读 · 6月7日

FOVI: A biologically-inspired foveated interface for deep vision models

Arxiv

0+阅读 · 5月29日

ScreenParse: Moving Beyond Sparse Grounding with Complete Screen Parsing Supervision

Arxiv

0+阅读 · 5月1日

VIP会员

文章信息

相关主题

最新内容

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

专知会员服务

2+阅读 · 今天7:13

俄乌无人机战争的六大启示

俄乌无人机战争的六大启示

专知会员服务

4+阅读 · 今天7:07

《无人机空中监控：通信实验洞察》

《无人机空中监控：通信实验洞察》

专知会员服务

3+阅读 · 今天7:05

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

专知会员服务

3+阅读 · 今天6:59

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

12+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

5+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

10+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

12+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

6+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

10+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

8+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

9+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

8+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

6+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

13+阅读 · 7月31日

相关VIP内容

OpenEarthAgent：一种面向工具增强型地理空间智能体的统一框架

OpenEarthAgent：一种面向工具增强型地理空间智能体的统一框架

专知会员服务

16+阅读 · 2月20日

卫星导航技术发展综述

卫星导航技术发展综述

专知会员服务

8+阅读 · 2025年7月11日

《战场GPS拒止环境下基于地标定位的安全路径导航》

《战场GPS拒止环境下基于地标定位的安全路径导航》

专知会员服务

20+阅读 · 2025年5月22日

27页综述，354篇参考文献！最详尽的视觉定位综述来了

27页综述，354篇参考文献！最详尽的视觉定位综述来了

专知会员服务

21+阅读 · 2025年2月20日

面向天域感知领域的知识图谱构建技术研究

面向天域感知领域的知识图谱构建技术研究

专知会员服务

55+阅读 · 2023年10月15日

《GeoHexViz：用于可视化六边形分类的地理空间数据Python包》

《GeoHexViz：用于可视化六边形分类的地理空间数据Python包》

专知会员服务

30+阅读 · 2023年6月11日

混合增强视觉认知架构及其关键技术进展

混合增强视觉认知架构及其关键技术进展

专知会员服务

46+阅读 · 2021年11月20日

最新「智能车联网」综述论文，170篇文献全面概述智能车联网（VANETs）技术

专知会员服务

26+阅读 · 2021年8月9日

三维视觉前沿进展

专知会员服务

67+阅读 · 2021年5月21日

基于深度学习的视觉多目标跟踪算法综述

专知会员服务

51+阅读 · 2021年4月15日

热门VIP内容

开通专知VIP会员享更多权益服务

俄乌无人机战争的六大启示

《无全球定位系统及通信拒止环境下用于地面目标防护的分布式无人机蜂群》（含代码）

《曝光下的战争：战场过滤与乌克兰军事选择的窄化》

《无人机空中监控：通信实验洞察》

相关资讯

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

西北工业大学发布最新遥感图像目标检测综述论文和Benchmark，带你全面了解遥感图像检测方法

专知

23+阅读 · 2019年9月5日

LinkTrack UWB高精度定位系统首发，一套可以随时搭建的"小卫星"定位系统，集定位|导航|授时|通信于一体

LinkTrack UWB高精度定位系统首发，一套可以随时搭建的"小卫星"定位系统，集定位|导航|授时|通信于一体

无人机

10+阅读 · 2019年7月18日

《视觉跟踪最新方法与趋势》，44页最新综述带你全面了解视觉跟踪领域发展方向

《视觉跟踪最新方法与趋势》，44页最新综述带你全面了解视觉跟踪领域发展方向

专知

32+阅读 · 2019年5月22日

自动驾驶车辆定位技术概述｜厚势汽车

自动驾驶车辆定位技术概述｜厚势汽车

厚势

10+阅读 · 2019年5月16日

【泡泡点云时空】GeoNet：基于测地距离的点云分析深度网络

【泡泡点云时空】GeoNet：基于测地距离的点云分析深度网络

泡泡机器人SLAM

11+阅读 · 2019年5月8日

吊打YOLOv3！普林斯顿大学提出：CornerNet-Lite，基于关键点的实时且精度高的目标检测算法，已开源！

吊打YOLOv3！普林斯顿大学提出：CornerNet-Lite，基于关键点的实时且精度高的目标检测算法，已开源！

极市平台

30+阅读 · 2019年4月20日

中科院牛津华为诺亚提出：CenterNet，One-stage目标检测最强算法！可达47mAP，已开源！

中科院牛津华为诺亚提出：CenterNet，One-stage目标检测最强算法！可达47mAP，已开源！

极市平台

19+阅读 · 2019年4月18日

ECCV发布：228页教程全面理解视觉定位技术

ECCV发布：228页教程全面理解视觉定位技术

专知

17+阅读 · 2018年9月12日

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

专知

13+阅读 · 2018年5月26日

GIS最新热点以及未来发展热门

GIS最新热点以及未来发展热门

人工智能学家

10+阅读 · 2018年3月29日

相关论文

CrossMaps: Confidence-Aware Open-Vocabulary Semantic Mapping for Rover Navigation

Arxiv

0+阅读 · 6月15日

LOCUS: Local Visual Cue Search for Enhancing Fine-Grained Perception in Multimodal Large Language Models

Arxiv

0+阅读 · 6月15日

Training-Free Open-Vocabulary Visual Grounding for Remote Sensing Images and Videos

Arxiv

0+阅读 · 6月15日

Intelligent Multimodal Retrieval and Reasoning for Geospatial Knowledge Discovery on the I-GUIDE Platform

Arxiv

0+阅读 · 6月14日

InfoGeo: Information-Theoretic Object-Centric Learning for Cross-View Generalizable UAV Geo-Localization

Arxiv

0+阅读 · 6月14日

WAM-Nav: Asymmetric Latent World-Action Modeling for Unified Visual Navigation

Arxiv

0+阅读 · 6月13日

SinGeo: Unlock Single Model's Potential for Robust Cross-View Geo-Localization

Arxiv

0+阅读 · 6月12日

Co-GLANCE: Uncertainty-Aware Active Perception for Heterogeneous Robot Teaming

Arxiv

0+阅读 · 6月7日

FOVI: A biologically-inspired foveated interface for deep vision models

Arxiv

0+阅读 · 5月29日

ScreenParse: Moving Beyond Sparse Grounding with Complete Screen Parsing Supervision

Arxiv

0+阅读 · 5月1日

相关基金

面向隐私保护的地理社交网络个性化推荐方法研究

国家自然科学基金

2+阅读 · 2017年12月31日

仿动物大脑网格细胞神经定位机制的同步定位与地图构建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于异构信息网络的地理共享数据个性化检索研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于空间认知常识的定性地理信息检索研究

国家自然科学基金

2+阅读 · 2014年12月31日

多特征融合与集成学习的城市高分辨率遥感影像变化检测

国家自然科学基金

4+阅读 · 2014年12月31日

基于组态地理实体符号的传感器实时监控关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于视觉注意与眼动跟踪的地图认知计算模型与方法研究

国家自然科学基金

6+阅读 · 2014年12月31日

超光谱、全偏振、立体形貌的多模态成像研究

国家自然科学基金

0+阅读 · 2014年12月31日

网络化环境下面向态势感知的多无人机协同控制与管理方法

国家自然科学基金

24+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员