GSAlign：面向空地行人重识别的几何与语义对齐网络 (GSAlign: Geometric and Semantic Alignment Network for Aerial-Ground Person Re-Identification) - 专知论文

会员服务 ·

0

行人 · 对齐 · 行人重识别 · 识别 · 语义对齐 ·

GSAlign: Geometric and Semantic Alignment Network for Aerial-Ground Person Re-Identification

翻译：GSAlign：面向空地行人重识别的几何与语义对齐网络

Qiao Li,Jie Li,Yukang Zhang,Lei Tan,Jing Chen,Jiayi Ji

from arxiv, Accepted by Neurips 2025

Aerial-Ground person re-identification (AG-ReID) is an emerging yet challenging task that aims to match pedestrian images captured from drastically different viewpoints, typically from unmanned aerial vehicles (UAVs) and ground-based surveillance cameras. The task poses significant challenges due to extreme viewpoint discrepancies, occlusions, and domain gaps between aerial and ground imagery. While prior works have made progress by learning cross-view representations, they remain limited in handling severe pose variations and spatial misalignment. To address these issues, we propose a Geometric and Semantic Alignment Network (GSAlign) tailored for AG-ReID. GSAlign introduces two key components to jointly tackle geometric distortion and semantic misalignment in aerial-ground matching: a Learnable Thin Plate Spline (LTPS) Module and a Dynamic Alignment Module (DAM). The LTPS module adaptively warps pedestrian features based on a set of learned keypoints, effectively compensating for geometric variations caused by extreme viewpoint changes. In parallel, the DAM estimates visibility-aware representation masks that highlight visible body regions at the semantic level, thereby alleviating the negative impact of occlusions and partial observations in cross-view correspondence. A comprehensive evaluation on CARGO with four matching protocols demonstrates the effectiveness of GSAlign, achieving significant improvements of +18.8\% in mAP and +16.8\% in Rank-1 accuracy over previous state-of-the-art methods on the aerial-ground setting.

翻译：空地行人重识别（AG-ReID）是一项新兴且极具挑战性的任务，其目标是在视角差异极大的条件下（通常来自无人机与地面监控摄像头）对行人图像进行匹配。由于极端视角差异、遮挡以及空地图像间的域差异，该任务面临重大挑战。尽管先前的研究通过学习跨视角表征已取得进展，但在处理剧烈姿态变化与空间错位方面仍存在局限。为解决这些问题，我们提出了一种专为AG-ReID设计的几何与语义对齐网络（GSAlign）。GSAlign引入了两个关键组件以共同应对空地匹配中的几何畸变与语义错位：可学习薄板样条（LTPS）模块与动态对齐模块（DAM）。LTPS模块基于一组学习得到的关键点自适应地扭曲行人特征，有效补偿由极端视角变化引起的几何变异。同时，DAM通过估计可见性感知的表征掩码，在语义层面突出可见的身体区域，从而减轻遮挡与局部观测在跨视角对应关系中的负面影响。在CARGO数据集上使用四种匹配协议进行的综合评估验证了GSAlign的有效性，其在空地设定下相比先前最优方法实现了显著提升，mAP提高+18.8%，Rank-1准确率提高+16.8%。

0

相关内容

无监督行人重识别研究综述

无监督行人重识别研究综述

专知会员服务

18+阅读 · 2025年8月3日

「面向复杂场景的行人重识别综述」最新2022研究进展综述

「面向复杂场景的行人重识别综述」最新2022研究进展综述

专知会员服务

38+阅读 · 2022年11月3日

【经典课程】《基于深度学习和行人重识别》，附课件与视频

【经典课程】《基于深度学习和行人重识别》，附课件与视频

专知会员服务

24+阅读 · 2022年9月24日

【CVPR 2022】基于双噪声标签的可见光-红外人再识别学习，Learning with Twin Noisy Labels for Visible-Infrared Person Re-Identification

【CVPR 2022】基于双噪声标签的可见光-红外人再识别学习，Learning with Twin Noisy Labels for Visible-Infrared Person Re-Identification

专知会员服务

14+阅读 · 2022年3月28日

【MM 2021】基于统一中间模态学习的视红外人再识别,Towards a Unified Middle Modality Learning for Visible-Infrared Person Re-Identification

【MM 2021】基于统一中间模态学习的视红外人再识别,Towards a Unified Middle Modality Learning for Visible-Infrared Person Re-Identification

专知会员服务

12+阅读 · 2022年3月22日

面向行人重识别的局部特征研究进展、挑战与展望

面向行人重识别的局部特征研究进展、挑战与展望

专知会员服务

27+阅读 · 2021年10月13日

多源数据行人重识别研究综述

多源数据行人重识别研究综述

专知会员服务

41+阅读 · 2020年11月2日

最新《深度学习行人重识别》综述论文，24页pdf

最新《深度学习行人重识别》综述论文，24页pdf

专知会员服务

81+阅读 · 2020年5月5日

【CVPR2020-杭州电子科技大学】软化相似性学习的无监督行人重识别，Unsupervised Person Re-identification via Softened Similarity Learning

【CVPR2020-杭州电子科技大学】软化相似性学习的无监督行人重识别，Unsupervised Person Re-identification via Softened Similarity Learning

专知会员服务

23+阅读 · 2020年4月8日

基于深度学习的行人重识别研究进展，自动化学报

基于深度学习的行人重识别研究进展，自动化学报

专知会员服务

39+阅读 · 2019年12月5日

【ICCV2019】中科院自动化所：AlignGAN-夜间行人重识别：通过联合像素和特征对齐解决跨模态行人重识别

【ICCV2019】中科院自动化所：AlignGAN-夜间行人重识别：通过联合像素和特征对齐解决跨模态行人重识别

专知

17+阅读 · 2019年10月29日

CVPR 2019 | 基于密集语义对齐的行人重识别模型：有效解决语义不对齐

CVPR 2019 | 基于密集语义对齐的行人重识别模型：有效解决语义不对齐

微软研究院AI头条

10+阅读 · 2019年7月5日

计算机视觉方向简介 | 基于自然语言的跨模态行人re-id的SOTA方法（上）

计算机视觉方向简介 | 基于自然语言的跨模态行人re-id的SOTA方法（上）

计算机视觉life

12+阅读 · 2019年6月29日

【未来黑科技】深度玩转行人重识别与跨境追踪

【未来黑科技】深度玩转行人重识别与跨境追踪

炼数成金订阅号

11+阅读 · 2019年4月18日

【论文推荐】最新5篇行人再识别（ReID）相关论文—迁移学习、特征集成、重排序、多通道金字塔、深层生成模型

【论文推荐】最新5篇行人再识别（ReID）相关论文—迁移学习、特征集成、重排序、多通道金字塔、深层生成模型

专知

12+阅读 · 2018年3月24日

独家 | 基于深度学习的行人重识别研究综述

独家 | 基于深度学习的行人重识别研究综述

AI科技评论

11+阅读 · 2017年12月20日

行人再识别中的迁移学习

行人再识别中的迁移学习

计算机视觉战队

11+阅读 · 2017年12月20日

从人脸识别到行人重识别，下一个风口

从人脸识别到行人重识别，下一个风口

计算机视觉战队

13+阅读 · 2017年11月24日

干货|郑哲东 Deep-ReID:行人重识别的深度学习方法（视频+PPT）

干货|郑哲东 Deep-ReID:行人重识别的深度学习方法（视频+PPT）

极市平台

14+阅读 · 2017年8月2日

线上分享 | 郑哲东 Deep-ReID: 关于行人重识别的深度学习方法

线上分享 | 郑哲东 Deep-ReID: 关于行人重识别的深度学习方法

极市平台

14+阅读 · 2017年7月24日

基于时空模式的复杂行为识别方法研究

国家自然科学基金

2+阅读 · 2017年12月31日

野外环境下四足机器人地形辨识与可通过性评价方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

顾及扫描上下文的预测与判决相结合的点云在线分类方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于深层特征学习的RGB-D人体行为识别方法

国家自然科学基金

4+阅读 · 2015年12月31日

空地机器人网络的同时视觉目标定位与分布式运动规划

国家自然科学基金

4+阅读 · 2015年12月31日

行人重识别目标中心编码外观模型的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂低空飞行中机会信号导航的信号优选及融合定位方法研究

国家自然科学基金

8+阅读 · 2015年12月31日

面向地图综合的多尺度空间聚类理论与方法

国家自然科学基金

1+阅读 · 2014年12月31日

语义关联的地理视频数据自适应组织方法

国家自然科学基金

1+阅读 · 2014年12月31日

Align and Adapt: Multimodal Multiview Human Activity Recognition under Arbitrary View Combinations

Align and Adapt: Multimodal Multiview Human Activity Recognition under Arbitrary View Combinations

Arxiv

0+阅读 · 2月18日

GRAIL: Goal Recognition Alignment through Imitation Learning

Arxiv

0+阅读 · 2月15日

(MGS)$^2$-Net: Unifying Micro-Geometric Scale and Macro-Geometric Structure for Cross-View Geo-Localization

Arxiv

0+阅读 · 2月11日

DiCo: Disentangled Concept Representation for Text-to-image Person Re-identification

Arxiv

0+阅读 · 2月11日

ORCHID: Fairness-Aware Orchestration in Mission-Critical Air-Ground Integrated Networks

Arxiv

0+阅读 · 2月10日

ReText: Text Boosts Generalization in Image-Based Person Re-identification

Arxiv

0+阅读 · 2月5日

DRFormer: A Dual-Regularized Bidirectional Transformer for Person Re-identification

Arxiv

0+阅读 · 2月1日

Person Re-ID in 2025: Supervised, Self-Supervised, and Language-Aligned. What Works?

Arxiv

0+阅读 · 1月28日

QA-ReID: Quality-Aware Query-Adaptive Convolution Leveraging Fused Global and Structural Cues for Clothes-Changing ReID

Arxiv

0+阅读 · 1月27日

Image-Text Knowledge Modeling for Unsupervised Multi-Scenario Person Re-Identification

Arxiv

0+阅读 · 1月16日

VIP会员

文章信息

相关主题

行人重识别

相关VIP内容

无监督行人重识别研究综述

无监督行人重识别研究综述

专知会员服务

18+阅读 · 2025年8月3日

「面向复杂场景的行人重识别综述」最新2022研究进展综述

「面向复杂场景的行人重识别综述」最新2022研究进展综述

专知会员服务

38+阅读 · 2022年11月3日

【经典课程】《基于深度学习和行人重识别》，附课件与视频

【经典课程】《基于深度学习和行人重识别》，附课件与视频

专知会员服务

24+阅读 · 2022年9月24日

【CVPR 2022】基于双噪声标签的可见光-红外人再识别学习，Learning with Twin Noisy Labels for Visible-Infrared Person Re-Identification

【CVPR 2022】基于双噪声标签的可见光-红外人再识别学习，Learning with Twin Noisy Labels for Visible-Infrared Person Re-Identification

专知会员服务

14+阅读 · 2022年3月28日

【MM 2021】基于统一中间模态学习的视红外人再识别,Towards a Unified Middle Modality Learning for Visible-Infrared Person Re-Identification

【MM 2021】基于统一中间模态学习的视红外人再识别,Towards a Unified Middle Modality Learning for Visible-Infrared Person Re-Identification

专知会员服务

12+阅读 · 2022年3月22日

面向行人重识别的局部特征研究进展、挑战与展望

面向行人重识别的局部特征研究进展、挑战与展望

专知会员服务

27+阅读 · 2021年10月13日

多源数据行人重识别研究综述

多源数据行人重识别研究综述

专知会员服务

41+阅读 · 2020年11月2日

最新《深度学习行人重识别》综述论文，24页pdf

最新《深度学习行人重识别》综述论文，24页pdf

专知会员服务

81+阅读 · 2020年5月5日

【CVPR2020-杭州电子科技大学】软化相似性学习的无监督行人重识别，Unsupervised Person Re-identification via Softened Similarity Learning

【CVPR2020-杭州电子科技大学】软化相似性学习的无监督行人重识别，Unsupervised Person Re-identification via Softened Similarity Learning

专知会员服务

23+阅读 · 2020年4月8日

基于深度学习的行人重识别研究进展，自动化学报

基于深度学习的行人重识别研究进展，自动化学报

专知会员服务

39+阅读 · 2019年12月5日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

【ICCV2019】中科院自动化所：AlignGAN-夜间行人重识别：通过联合像素和特征对齐解决跨模态行人重识别

【ICCV2019】中科院自动化所：AlignGAN-夜间行人重识别：通过联合像素和特征对齐解决跨模态行人重识别

专知

17+阅读 · 2019年10月29日

CVPR 2019 | 基于密集语义对齐的行人重识别模型：有效解决语义不对齐

CVPR 2019 | 基于密集语义对齐的行人重识别模型：有效解决语义不对齐

微软研究院AI头条

10+阅读 · 2019年7月5日

计算机视觉方向简介 | 基于自然语言的跨模态行人re-id的SOTA方法（上）

计算机视觉方向简介 | 基于自然语言的跨模态行人re-id的SOTA方法（上）

计算机视觉life

12+阅读 · 2019年6月29日

【未来黑科技】深度玩转行人重识别与跨境追踪

【未来黑科技】深度玩转行人重识别与跨境追踪

炼数成金订阅号

11+阅读 · 2019年4月18日

【论文推荐】最新5篇行人再识别（ReID）相关论文—迁移学习、特征集成、重排序、多通道金字塔、深层生成模型

【论文推荐】最新5篇行人再识别（ReID）相关论文—迁移学习、特征集成、重排序、多通道金字塔、深层生成模型

专知

12+阅读 · 2018年3月24日

独家 | 基于深度学习的行人重识别研究综述

独家 | 基于深度学习的行人重识别研究综述

AI科技评论

11+阅读 · 2017年12月20日

行人再识别中的迁移学习

行人再识别中的迁移学习

计算机视觉战队

11+阅读 · 2017年12月20日

从人脸识别到行人重识别，下一个风口

从人脸识别到行人重识别，下一个风口

计算机视觉战队

13+阅读 · 2017年11月24日

干货|郑哲东 Deep-ReID:行人重识别的深度学习方法（视频+PPT）

干货|郑哲东 Deep-ReID:行人重识别的深度学习方法（视频+PPT）

极市平台

14+阅读 · 2017年8月2日

线上分享 | 郑哲东 Deep-ReID: 关于行人重识别的深度学习方法

线上分享 | 郑哲东 Deep-ReID: 关于行人重识别的深度学习方法

极市平台

14+阅读 · 2017年7月24日

相关论文

Align and Adapt: Multimodal Multiview Human Activity Recognition under Arbitrary View Combinations

Align and Adapt: Multimodal Multiview Human Activity Recognition under Arbitrary View Combinations

Arxiv

0+阅读 · 2月18日

GRAIL: Goal Recognition Alignment through Imitation Learning

Arxiv

0+阅读 · 2月15日

(MGS)$^2$-Net: Unifying Micro-Geometric Scale and Macro-Geometric Structure for Cross-View Geo-Localization

Arxiv

0+阅读 · 2月11日

DiCo: Disentangled Concept Representation for Text-to-image Person Re-identification

Arxiv

0+阅读 · 2月11日

ORCHID: Fairness-Aware Orchestration in Mission-Critical Air-Ground Integrated Networks

Arxiv

0+阅读 · 2月10日

ReText: Text Boosts Generalization in Image-Based Person Re-identification

Arxiv

0+阅读 · 2月5日

DRFormer: A Dual-Regularized Bidirectional Transformer for Person Re-identification

Arxiv

0+阅读 · 2月1日

Person Re-ID in 2025: Supervised, Self-Supervised, and Language-Aligned. What Works?

Arxiv

0+阅读 · 1月28日

QA-ReID: Quality-Aware Query-Adaptive Convolution Leveraging Fused Global and Structural Cues for Clothes-Changing ReID

Arxiv

0+阅读 · 1月27日

Image-Text Knowledge Modeling for Unsupervised Multi-Scenario Person Re-Identification

Arxiv

0+阅读 · 1月16日

相关基金

基于时空模式的复杂行为识别方法研究

国家自然科学基金

2+阅读 · 2017年12月31日

野外环境下四足机器人地形辨识与可通过性评价方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

顾及扫描上下文的预测与判决相结合的点云在线分类方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于深层特征学习的RGB-D人体行为识别方法

国家自然科学基金

4+阅读 · 2015年12月31日

空地机器人网络的同时视觉目标定位与分布式运动规划

国家自然科学基金

4+阅读 · 2015年12月31日

行人重识别目标中心编码外观模型的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂低空飞行中机会信号导航的信号优选及融合定位方法研究

国家自然科学基金

8+阅读 · 2015年12月31日

面向地图综合的多尺度空间聚类理论与方法

国家自然科学基金

1+阅读 · 2014年12月31日

语义关联的地理视频数据自适应组织方法

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员