Image-Text Knowledge Modeling for Unsupervised Multi-Scenario Person Re-Identification - 专知论文

会员服务 ·

0

多场景 · 监督 · 知识 · 行人 · 行人重识别 ·

Image-Text Knowledge Modeling for Unsupervised Multi-Scenario Person Re-Identification

翻译：面向无监督多场景的行人重识别：基于图像-文本知识建模的方法

Zhiqi Pang,Lingling Zhao,Yang Liu,Chunyu Wang,Gaurav Sharma

from arxiv, 12 pages, 10 figures

We propose unsupervised multi-scenario (UMS) person re-identification (ReID) as a new task that expands ReID across diverse scenarios (cross-resolution, clothing change, etc.) within a single coherent framework. To tackle UMS-ReID, we introduce image-text knowledge modeling (ITKM) -- a three-stage framework that effectively exploits the representational power of vision-language models. We start with a pre-trained CLIP model with an image encoder and a text encoder. In Stage I, we introduce a scenario embedding in the image encoder and fine-tune the encoder to adaptively leverage knowledge from multiple scenarios. In Stage II, we optimize a set of learned text embeddings to associate with pseudo-labels from Stage I and introduce a multi-scenario separation loss to increase the divergence between inter-scenario text representations. In Stage III, we first introduce cluster-level and instance-level heterogeneous matching modules to obtain reliable heterogeneous positive pairs (e.g., a visible image and an infrared image of the same person) within each scenario. Next, we propose a dynamic text representation update strategy to maintain consistency between text and image supervision signals. Experimental results across multiple scenarios demonstrate the superiority and generalizability of ITKM; it not only outperforms existing scenario-specific methods but also enhances overall performance by integrating knowledge from multiple scenarios.

翻译：本文提出无监督多场景行人重识别这一新任务，旨在将行人重识别扩展至多样化场景（如跨分辨率、衣物更换等），并构建统一的处理框架。为应对该任务，我们提出图像-文本知识建模框架——一种三阶段方法，能有效利用视觉-语言模型的表征能力。我们以预训练的CLIP模型为基础，该模型包含图像编码器与文本编码器。在第一阶段，我们在图像编码器中引入场景嵌入表示，并通过微调使编码器能自适应地融合多场景知识。第二阶段，我们优化一组可学习的文本嵌入向量，使其与第一阶段生成的伪标签相关联，并设计多场景分离损失以增强场景间文本表征的差异性。第三阶段，我们首先提出簇级与实例级异质匹配模块，以在各场景内获取可靠的异质正样本对（例如同一人的可见光图像与红外图像）。随后，我们提出动态文本表征更新策略，以保持文本监督信号与图像监督信号的一致性。在多场景数据集上的实验结果表明，ITKM方法具有优越性与泛化能力：其不仅超越了现有针对特定场景的方法，还能通过整合多场景知识实现整体性能的提升。

0

相关内容

多场景

无监督行人重识别研究综述

无监督行人重识别研究综述

专知会员服务

18+阅读 · 2025年8月3日

「面向复杂场景的行人重识别综述」最新2022研究进展综述

「面向复杂场景的行人重识别综述」最新2022研究进展综述

专知会员服务

38+阅读 · 2022年11月3日

【经典课程】《基于深度学习和行人重识别》，附课件与视频

【经典课程】《基于深度学习和行人重识别》，附课件与视频

专知会员服务

24+阅读 · 2022年9月24日

【CVPR 2022】基于双噪声标签的可见光-红外人再识别学习，Learning with Twin Noisy Labels for Visible-Infrared Person Re-Identification

【CVPR 2022】基于双噪声标签的可见光-红外人再识别学习，Learning with Twin Noisy Labels for Visible-Infrared Person Re-Identification

专知会员服务

14+阅读 · 2022年3月28日

【MM 2021】基于统一中间模态学习的视红外人再识别,Towards a Unified Middle Modality Learning for Visible-Infrared Person Re-Identification

【MM 2021】基于统一中间模态学习的视红外人再识别,Towards a Unified Middle Modality Learning for Visible-Infrared Person Re-Identification

专知会员服务

12+阅读 · 2022年3月22日

面向行人重识别的局部特征研究进展、挑战与展望

面向行人重识别的局部特征研究进展、挑战与展望

专知会员服务

27+阅读 · 2021年10月13日

多源数据行人重识别研究综述

多源数据行人重识别研究综述

专知会员服务

41+阅读 · 2020年11月2日

深度学习行人再识别研究综述

专知会员服务

38+阅读 · 2020年8月19日

【CVPR2020-杭州电子科技大学】软化相似性学习的无监督行人重识别，Unsupervised Person Re-identification via Softened Similarity Learning

【CVPR2020-杭州电子科技大学】软化相似性学习的无监督行人重识别，Unsupervised Person Re-identification via Softened Similarity Learning

专知会员服务

23+阅读 · 2020年4月8日

基于深度学习的行人重识别研究进展，自动化学报

基于深度学习的行人重识别研究进展，自动化学报

专知会员服务

39+阅读 · 2019年12月5日

CVPR 2019 | 基于密集语义对齐的行人重识别模型：有效解决语义不对齐

CVPR 2019 | 基于密集语义对齐的行人重识别模型：有效解决语义不对齐

微软研究院AI头条

10+阅读 · 2019年7月5日

计算机视觉方向简介 | 基于自然语言的跨模态行人re-id的SOTA方法（上）

计算机视觉方向简介 | 基于自然语言的跨模态行人re-id的SOTA方法（上）

计算机视觉life

12+阅读 · 2019年6月29日

【未来黑科技】深度玩转行人重识别与跨境追踪

【未来黑科技】深度玩转行人重识别与跨境追踪

炼数成金订阅号

11+阅读 · 2019年4月18日

基于人体骨架的行为识别【附PPT与视频资料】

基于人体骨架的行为识别【附PPT与视频资料】

人工智能前沿讲习班

31+阅读 · 2019年1月15日

【论文推荐】最新5篇行人再识别（ReID）相关论文—迁移学习、特征集成、重排序、多通道金字塔、深层生成模型

【论文推荐】最新5篇行人再识别（ReID）相关论文—迁移学习、特征集成、重排序、多通道金字塔、深层生成模型

专知

12+阅读 · 2018年3月24日

独家 | 基于深度学习的行人重识别研究综述

独家 | 基于深度学习的行人重识别研究综述

AI科技评论

11+阅读 · 2017年12月20日

行人再识别中的迁移学习

行人再识别中的迁移学习

计算机视觉战队

11+阅读 · 2017年12月20日

从人脸识别到行人重识别，下一个风口

从人脸识别到行人重识别，下一个风口

计算机视觉战队

13+阅读 · 2017年11月24日

干货|郑哲东 Deep-ReID:行人重识别的深度学习方法（视频+PPT）

干货|郑哲东 Deep-ReID:行人重识别的深度学习方法（视频+PPT）

极市平台

14+阅读 · 2017年8月2日

线上分享 | 郑哲东 Deep-ReID: 关于行人重识别的深度学习方法

线上分享 | 郑哲东 Deep-ReID: 关于行人重识别的深度学习方法

极市平台

14+阅读 · 2017年7月24日

大规模多视角高维图像特征提取

国家自然科学基金

4+阅读 · 2017年12月31日

基于时空模式的复杂行为识别方法研究

国家自然科学基金

2+阅读 · 2017年12月31日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

基于深层特征学习的RGB-D人体行为识别方法

国家自然科学基金

4+阅读 · 2015年12月31日

基于人脸表情、身体姿态和语音的多模态情感识别方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

面向多用户行为的无线识别关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

行人重识别目标中心编码外观模型的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于极限学习单元的多生物特征图像深度学习建模与识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

动态群稀疏约束场景知识建模的感兴趣监控目标超分辨率重建

国家自然科学基金

1+阅读 · 2014年12月31日

DiCo: Disentangled Concept Representation for Text-to-image Person Re-identification

Arxiv

0+阅读 · 2月11日

ReText: Text Boosts Generalization in Image-Based Person Re-identification

Arxiv

0+阅读 · 2月5日

DRFormer: A Dual-Regularized Bidirectional Transformer for Person Re-identification

Arxiv

0+阅读 · 2月1日

bi-modal textual prompt learning for vision-language models in remote sensing

Arxiv

0+阅读 · 1月28日

Person Re-ID in 2025: Supervised, Self-Supervised, and Language-Aligned. What Works?

Arxiv

0+阅读 · 1月28日

Unified Multi-Dataset Training for TBPS

Arxiv

0+阅读 · 1月21日

Language-Based Swarm Perception: Decentralized Person Re-Identification via Natural Language Descriptions

Arxiv

0+阅读 · 1月18日

Prototypical Contrastive Learning-based CLIP Fine-tuning for Object Re-identification

Arxiv

0+阅读 · 1月14日

S3-CLIP: Video Super Resolution for Person-ReID

Arxiv

0+阅读 · 1月13日

GSAlign: Geometric and Semantic Alignment Network for Aerial-Ground Person Re-Identification

Arxiv

0+阅读 · 1月13日

VIP会员

文章信息

相关主题

行人重识别

最新内容

《美陆军条例：陆军指挥政策（2026版）》

《美陆军条例：陆军指挥政策（2026版）》

专知会员服务

5+阅读 · 今天8:10

《提升美军全域城市作战训练最佳实践的案例研究》366页

《提升美军全域城市作战训练最佳实践的案例研究》366页

专知会员服务

6+阅读 · 今天8:06

《军用自主人工智能系统的治理与安全》

《军用自主人工智能系统的治理与安全》

专知会员服务

4+阅读 · 今天8:02

美海军数字作战负责人：如何利用数据快速生成战斗力

美海军数字作战负责人：如何利用数据快速生成战斗力

专知会员服务

3+阅读 · 今天7:32

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

10+阅读 · 4月20日

《系统簇式多域作战规划范畴论框架》

《系统簇式多域作战规划范畴论框架》

专知会员服务

7+阅读 · 4月20日

《美国防部指令6130.03，第2卷服役医疗标准：保留》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

专知会员服务

5+阅读 · 4月20日

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

专知会员服务

3+阅读 · 4月20日

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

专知会员服务

7+阅读 · 4月20日

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

专知会员服务

3+阅读 · 4月20日

高效视频扩散模型：进展与挑战

高效视频扩散模型：进展与挑战

专知会员服务

3+阅读 · 4月20日

乌克兰前线的五项创新

乌克兰前线的五项创新

专知会员服务

7+阅读 · 4月20日

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

6+阅读 · 4月20日

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

11+阅读 · 4月20日

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

5+阅读 · 4月20日

相关VIP内容

无监督行人重识别研究综述

无监督行人重识别研究综述

专知会员服务

18+阅读 · 2025年8月3日

「面向复杂场景的行人重识别综述」最新2022研究进展综述

「面向复杂场景的行人重识别综述」最新2022研究进展综述

专知会员服务

38+阅读 · 2022年11月3日

【经典课程】《基于深度学习和行人重识别》，附课件与视频

【经典课程】《基于深度学习和行人重识别》，附课件与视频

专知会员服务

24+阅读 · 2022年9月24日

【CVPR 2022】基于双噪声标签的可见光-红外人再识别学习，Learning with Twin Noisy Labels for Visible-Infrared Person Re-Identification

【CVPR 2022】基于双噪声标签的可见光-红外人再识别学习，Learning with Twin Noisy Labels for Visible-Infrared Person Re-Identification

专知会员服务

14+阅读 · 2022年3月28日

【MM 2021】基于统一中间模态学习的视红外人再识别,Towards a Unified Middle Modality Learning for Visible-Infrared Person Re-Identification

【MM 2021】基于统一中间模态学习的视红外人再识别,Towards a Unified Middle Modality Learning for Visible-Infrared Person Re-Identification

专知会员服务

12+阅读 · 2022年3月22日

面向行人重识别的局部特征研究进展、挑战与展望

面向行人重识别的局部特征研究进展、挑战与展望

专知会员服务

27+阅读 · 2021年10月13日

多源数据行人重识别研究综述

多源数据行人重识别研究综述

专知会员服务

41+阅读 · 2020年11月2日

深度学习行人再识别研究综述

专知会员服务

38+阅读 · 2020年8月19日

【CVPR2020-杭州电子科技大学】软化相似性学习的无监督行人重识别，Unsupervised Person Re-identification via Softened Similarity Learning

【CVPR2020-杭州电子科技大学】软化相似性学习的无监督行人重识别，Unsupervised Person Re-identification via Softened Similarity Learning

专知会员服务

23+阅读 · 2020年4月8日

基于深度学习的行人重识别研究进展，自动化学报

基于深度学习的行人重识别研究进展，自动化学报

专知会员服务

39+阅读 · 2019年12月5日

热门VIP内容

开通专知VIP会员享更多权益服务

《提升美军全域城市作战训练最佳实践的案例研究》366页

美海军数字作战负责人：如何利用数据快速生成战斗力

《美陆军条例：陆军指挥政策（2026版）》

《军用自主人工智能系统的治理与安全》

相关资讯

CVPR 2019 | 基于密集语义对齐的行人重识别模型：有效解决语义不对齐

CVPR 2019 | 基于密集语义对齐的行人重识别模型：有效解决语义不对齐

微软研究院AI头条

10+阅读 · 2019年7月5日

计算机视觉方向简介 | 基于自然语言的跨模态行人re-id的SOTA方法（上）

计算机视觉方向简介 | 基于自然语言的跨模态行人re-id的SOTA方法（上）

计算机视觉life

12+阅读 · 2019年6月29日

【未来黑科技】深度玩转行人重识别与跨境追踪

【未来黑科技】深度玩转行人重识别与跨境追踪

炼数成金订阅号

11+阅读 · 2019年4月18日

基于人体骨架的行为识别【附PPT与视频资料】

基于人体骨架的行为识别【附PPT与视频资料】

人工智能前沿讲习班

31+阅读 · 2019年1月15日

【论文推荐】最新5篇行人再识别（ReID）相关论文—迁移学习、特征集成、重排序、多通道金字塔、深层生成模型

【论文推荐】最新5篇行人再识别（ReID）相关论文—迁移学习、特征集成、重排序、多通道金字塔、深层生成模型

专知

12+阅读 · 2018年3月24日

独家 | 基于深度学习的行人重识别研究综述

独家 | 基于深度学习的行人重识别研究综述

AI科技评论

11+阅读 · 2017年12月20日

行人再识别中的迁移学习

行人再识别中的迁移学习

计算机视觉战队

11+阅读 · 2017年12月20日

从人脸识别到行人重识别，下一个风口

从人脸识别到行人重识别，下一个风口

计算机视觉战队

13+阅读 · 2017年11月24日

干货|郑哲东 Deep-ReID:行人重识别的深度学习方法（视频+PPT）

干货|郑哲东 Deep-ReID:行人重识别的深度学习方法（视频+PPT）

极市平台

14+阅读 · 2017年8月2日

线上分享 | 郑哲东 Deep-ReID: 关于行人重识别的深度学习方法

线上分享 | 郑哲东 Deep-ReID: 关于行人重识别的深度学习方法

极市平台

14+阅读 · 2017年7月24日

相关论文

DiCo: Disentangled Concept Representation for Text-to-image Person Re-identification

Arxiv

0+阅读 · 2月11日

ReText: Text Boosts Generalization in Image-Based Person Re-identification

Arxiv

0+阅读 · 2月5日

DRFormer: A Dual-Regularized Bidirectional Transformer for Person Re-identification

Arxiv

0+阅读 · 2月1日

bi-modal textual prompt learning for vision-language models in remote sensing

Arxiv

0+阅读 · 1月28日

Person Re-ID in 2025: Supervised, Self-Supervised, and Language-Aligned. What Works?

Arxiv

0+阅读 · 1月28日

Unified Multi-Dataset Training for TBPS

Arxiv

0+阅读 · 1月21日

Language-Based Swarm Perception: Decentralized Person Re-Identification via Natural Language Descriptions

Arxiv

0+阅读 · 1月18日

Prototypical Contrastive Learning-based CLIP Fine-tuning for Object Re-identification

Arxiv

0+阅读 · 1月14日

S3-CLIP: Video Super Resolution for Person-ReID

Arxiv

0+阅读 · 1月13日

GSAlign: Geometric and Semantic Alignment Network for Aerial-Ground Person Re-Identification

Arxiv

0+阅读 · 1月13日

相关基金

大规模多视角高维图像特征提取

国家自然科学基金

4+阅读 · 2017年12月31日

基于时空模式的复杂行为识别方法研究

国家自然科学基金

2+阅读 · 2017年12月31日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

基于深层特征学习的RGB-D人体行为识别方法

国家自然科学基金

4+阅读 · 2015年12月31日

基于人脸表情、身体姿态和语音的多模态情感识别方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

面向多用户行为的无线识别关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

行人重识别目标中心编码外观模型的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于极限学习单元的多生物特征图像深度学习建模与识别研究

国家自然科学基金

2+阅读 · 2015年12月31日

动态群稀疏约束场景知识建模的感兴趣监控目标超分辨率重建

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员