基于注意力特征自适应的对比学习框架在街景图像分类中的应用 (A Contrastive Learning Framework Empowered by Attention-based Feature Adaptation for Street-View Image Classification) - 专知论文

会员服务 ·

0

自适应 · CLIP · 属性 · 图像分类 · APT ·

A Contrastive Learning Framework Empowered by Attention-based Feature Adaptation for Street-View Image Classification

翻译：基于注意力特征自适应的对比学习框架在街景图像分类中的应用

Qi You,Yitai Cheng,Zichao Zeng,James Haworth

Street-view image attribute classification is a vital downstream task of image classification, enabling applications such as autonomous driving, urban analytics, and high-definition map construction. It remains computationally demanding whether training from scratch, initialising from pre-trained weights, or fine-tuning large models. Although pre-trained vision-language models such as CLIP offer rich image representations, existing adaptation or fine-tuning methods often rely on their global image embeddings, limiting their ability to capture fine-grained, localised attributes essential in complex, cluttered street scenes. To address this, we propose CLIP-MHAdapter, a variant of the current lightweight CLIP adaptation paradigm that appends a bottleneck MLP equipped with multi-head self-attention operating on patch tokens to model inter-patch dependencies. With approximately 1.4 million trainable parameters, CLIP-MHAdapter achieves superior or competitive accuracy across eight attribute classification tasks on the Global StreetScapes dataset, attaining new state-of-the-art results while maintaining low computational cost. The code is available at https://github.com/SpaceTimeLab/CLIP-MHAdapter.

翻译：街景图像属性分类是图像分类的重要下游任务，可应用于自动驾驶、城市分析和高精度地图构建等领域。无论是从头训练、基于预训练权重初始化还是微调大型模型，该任务仍具有较高的计算需求。尽管CLIP等预训练视觉语言模型提供了丰富的图像表征，但现有的自适应或微调方法通常依赖其全局图像嵌入，限制了模型在复杂混乱的街景场景中捕获细粒度局部关键属性的能力。为此，我们提出CLIP-MHAdapter——当前轻量级CLIP自适应范式的变体，该模型通过附加配备多头自注意力机制的瓶颈MLP来处理图像块标记，从而建模块间依赖关系。仅包含约140万个可训练参数的CLIP-MHAdapter，在Global StreetScapes数据集的八项属性分类任务中均取得最优或具有竞争力的准确率，在保持低计算成本的同时实现了新的最先进性能。代码已开源：https://github.com/SpaceTimeLab/CLIP-MHAdapter。

0

相关内容

自适应

基于主动学习的图像分类技术：现状与未来

基于主动学习的图像分类技术：现状与未来

专知会员服务

37+阅读 · 2024年1月8日

【深度迁移学习在图像分类中的应用综述】Deep transfer learning for image classification: a survey

【深度迁移学习在图像分类中的应用综述】Deep transfer learning for image classification: a survey

专知会员服务

25+阅读 · 2022年5月24日

图像分类的深度卷积神经网络模型综述

图像分类的深度卷积神经网络模型综述

专知会员服务

57+阅读 · 2021年10月29日

细粒度图像分类的深度学习方法

细粒度图像分类的深度学习方法

专知会员服务

43+阅读 · 2021年10月18日

【CVPR2021】密集对比学习的自监督视觉预训练

专知会员服务

39+阅读 · 2021年5月16日

基于小样本学习的图像分类技术综述

基于小样本学习的图像分类技术综述

专知会员服务

152+阅读 · 2020年5月6日

图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

专知会员服务

185+阅读 · 2020年2月22日

基于破坏和构造学习的细粒度图像识别（Destruction and Construction Learning for Fine-grained Image Recognition）

基于破坏和构造学习的细粒度图像识别（Destruction and Construction Learning for Fine-grained Image Recognition）

专知会员服务

20+阅读 · 2020年1月26日

基于深度网络的自监督视觉特征学习综述，附24页论文下载

基于深度网络的自监督视觉特征学习综述，附24页论文下载

专知会员服务

66+阅读 · 2020年1月15日

【用十亿级半监督学习实现最先进图像与视频分类】《Billion-scale semi-supervised learning for state-of-the-art image and video classification | Facebook》

【用十亿级半监督学习实现最先进图像与视频分类】《Billion-scale semi-supervised learning for state-of-the-art image and video classification | Facebook》

专知会员服务

16+阅读 · 2019年10月21日

深度学习应用在图像匹配的效果如何？

深度学习应用在图像匹配的效果如何？

中国图象图形学报

10+阅读 · 2019年6月11日

如何用机器学习精准辨别“背景”和“目标”

如何用机器学习精准辨别“背景”和“目标”

论智

10+阅读 · 2018年10月22日

关于CNN图像分类的一份综合设计指南

关于CNN图像分类的一份综合设计指南

云栖社区

11+阅读 · 2018年5月15日

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

专知

17+阅读 · 2018年3月3日

【机器视觉】计算机视觉必读：图像分类、定位、检测，语义分割和实例分割方法梳理

【机器视觉】计算机视觉必读：图像分类、定位、检测，语义分割和实例分割方法梳理

产业智能官

29+阅读 · 2018年2月3日

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

新智元

35+阅读 · 2018年1月24日

【论文推荐】最新5篇图像分割相关论文—条件随机场和深度特征学习、移动端网络、长期视觉定位、主动学习、主动轮廓模型、生成对抗性网络

【论文推荐】最新5篇图像分割相关论文—条件随机场和深度特征学习、移动端网络、长期视觉定位、主动学习、主动轮廓模型、生成对抗性网络

专知

13+阅读 · 2018年1月23日

【干货】快速上手图像识别：用TensorFlow API实现图像分类实例

【干货】快速上手图像识别：用TensorFlow API实现图像分类实例

专知

25+阅读 · 2018年1月18日

深度学习在文本分类中的应用

深度学习在文本分类中的应用

AI研习社

13+阅读 · 2018年1月7日

【迁移学习】迁移学习在图像分类中的简单应用策略

【迁移学习】迁移学习在图像分类中的简单应用策略

产业智能官

15+阅读 · 2018年1月5日

视觉信息的局部特征表示及应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于对象模型与多点空间统计的高分辨率遥感影像分类策略

国家自然科学基金

4+阅读 · 2015年12月31日

基于矩阵分解的图像表示方法及其应用研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于语义网络的街区场景相似性研究

国家自然科学基金

4+阅读 · 2015年12月31日

有向图谱理论在图像匹配中应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于记忆的不变图像特征学习方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向光谱-空间特征集合的高光谱遥感影像度量学习与分类研究

国家自然科学基金

0+阅读 · 2015年12月31日

深度学习框架下基于情境线索的视觉注意研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于自学习对比度视觉注意模型和自适应深度特征的无分类目标检测

国家自然科学基金

2+阅读 · 2015年12月31日

Equilibrium contrastive learning for imbalanced image classification

Arxiv

0+阅读 · 2月18日

Scale Contrastive Learning with Selective Attentions for Blind Image Quality Assessment

Arxiv

0+阅读 · 2月12日

Equilibrium contrastive learning for imbalanced image classification

Arxiv

0+阅读 · 2月10日

Feature, Alignment, and Supervision in Category Learning: A Comparative Approach with Children and Neural Networks

Arxiv

0+阅读 · 2月3日

Learning Adaptive Cross-Embodiment Visuomotor Policy with Contrastive Prompt Orchestration

Arxiv

0+阅读 · 2月1日

A Lightweight Medical Image Classification Framework via Self-Supervised Contrastive Learning and Quantum-Enhanced Feature Modeling

Arxiv

0+阅读 · 1月23日

A Classification-Aware Super-Resolution Framework for Ship Targets in SAR Imagery

Arxiv

0+阅读 · 1月16日

Image Complexity-Aware Adaptive Retrieval for Efficient Vision-Language Models

Arxiv

0+阅读 · 1月15日

Prototypical Contrastive Learning-based CLIP Fine-tuning for Object Re-identification

Arxiv

0+阅读 · 1月14日

Hierarchical Fusion of Local and Global Visual Features with Mixture-of-Experts for Remote Sensing Image Scene Classification

Arxiv

0+阅读 · 1月14日

VIP会员

文章信息

相关主题

相关VIP内容

基于主动学习的图像分类技术：现状与未来

基于主动学习的图像分类技术：现状与未来

专知会员服务

37+阅读 · 2024年1月8日

【深度迁移学习在图像分类中的应用综述】Deep transfer learning for image classification: a survey

【深度迁移学习在图像分类中的应用综述】Deep transfer learning for image classification: a survey

专知会员服务

25+阅读 · 2022年5月24日

图像分类的深度卷积神经网络模型综述

图像分类的深度卷积神经网络模型综述

专知会员服务

57+阅读 · 2021年10月29日

细粒度图像分类的深度学习方法

细粒度图像分类的深度学习方法

专知会员服务

43+阅读 · 2021年10月18日

【CVPR2021】密集对比学习的自监督视觉预训练

专知会员服务

39+阅读 · 2021年5月16日

基于小样本学习的图像分类技术综述

基于小样本学习的图像分类技术综述

专知会员服务

152+阅读 · 2020年5月6日

图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

专知会员服务

185+阅读 · 2020年2月22日

基于破坏和构造学习的细粒度图像识别（Destruction and Construction Learning for Fine-grained Image Recognition）

基于破坏和构造学习的细粒度图像识别（Destruction and Construction Learning for Fine-grained Image Recognition）

专知会员服务

20+阅读 · 2020年1月26日

基于深度网络的自监督视觉特征学习综述，附24页论文下载

基于深度网络的自监督视觉特征学习综述，附24页论文下载

专知会员服务

66+阅读 · 2020年1月15日

【用十亿级半监督学习实现最先进图像与视频分类】《Billion-scale semi-supervised learning for state-of-the-art image and video classification | Facebook》

【用十亿级半监督学习实现最先进图像与视频分类】《Billion-scale semi-supervised learning for state-of-the-art image and video classification | Facebook》

专知会员服务

16+阅读 · 2019年10月21日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

深度学习应用在图像匹配的效果如何？

深度学习应用在图像匹配的效果如何？

中国图象图形学报

10+阅读 · 2019年6月11日

如何用机器学习精准辨别“背景”和“目标”

如何用机器学习精准辨别“背景”和“目标”

论智

10+阅读 · 2018年10月22日

关于CNN图像分类的一份综合设计指南

关于CNN图像分类的一份综合设计指南

云栖社区

11+阅读 · 2018年5月15日

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

专知

17+阅读 · 2018年3月3日

【机器视觉】计算机视觉必读：图像分类、定位、检测，语义分割和实例分割方法梳理

【机器视觉】计算机视觉必读：图像分类、定位、检测，语义分割和实例分割方法梳理

产业智能官

29+阅读 · 2018年2月3日

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

新智元

35+阅读 · 2018年1月24日

【论文推荐】最新5篇图像分割相关论文—条件随机场和深度特征学习、移动端网络、长期视觉定位、主动学习、主动轮廓模型、生成对抗性网络

【论文推荐】最新5篇图像分割相关论文—条件随机场和深度特征学习、移动端网络、长期视觉定位、主动学习、主动轮廓模型、生成对抗性网络

专知

13+阅读 · 2018年1月23日

【干货】快速上手图像识别：用TensorFlow API实现图像分类实例

【干货】快速上手图像识别：用TensorFlow API实现图像分类实例

专知

25+阅读 · 2018年1月18日

深度学习在文本分类中的应用

深度学习在文本分类中的应用

AI研习社

13+阅读 · 2018年1月7日

【迁移学习】迁移学习在图像分类中的简单应用策略

【迁移学习】迁移学习在图像分类中的简单应用策略

产业智能官

15+阅读 · 2018年1月5日

相关论文

Equilibrium contrastive learning for imbalanced image classification

Arxiv

0+阅读 · 2月18日

Scale Contrastive Learning with Selective Attentions for Blind Image Quality Assessment

Arxiv

0+阅读 · 2月12日

Equilibrium contrastive learning for imbalanced image classification

Arxiv

0+阅读 · 2月10日

Feature, Alignment, and Supervision in Category Learning: A Comparative Approach with Children and Neural Networks

Arxiv

0+阅读 · 2月3日

Learning Adaptive Cross-Embodiment Visuomotor Policy with Contrastive Prompt Orchestration

Arxiv

0+阅读 · 2月1日

A Lightweight Medical Image Classification Framework via Self-Supervised Contrastive Learning and Quantum-Enhanced Feature Modeling

Arxiv

0+阅读 · 1月23日

A Classification-Aware Super-Resolution Framework for Ship Targets in SAR Imagery

Arxiv

0+阅读 · 1月16日

Image Complexity-Aware Adaptive Retrieval for Efficient Vision-Language Models

Arxiv

0+阅读 · 1月15日

Prototypical Contrastive Learning-based CLIP Fine-tuning for Object Re-identification

Arxiv

0+阅读 · 1月14日

Hierarchical Fusion of Local and Global Visual Features with Mixture-of-Experts for Remote Sensing Image Scene Classification

Arxiv

0+阅读 · 1月14日

相关基金

视觉信息的局部特征表示及应用研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于对象模型与多点空间统计的高分辨率遥感影像分类策略

国家自然科学基金

4+阅读 · 2015年12月31日

基于矩阵分解的图像表示方法及其应用研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于语义网络的街区场景相似性研究

国家自然科学基金

4+阅读 · 2015年12月31日

有向图谱理论在图像匹配中应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于视觉差异特征的跨域图像匹配方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于记忆的不变图像特征学习方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向光谱-空间特征集合的高光谱遥感影像度量学习与分类研究

国家自然科学基金

0+阅读 · 2015年12月31日

深度学习框架下基于情境线索的视觉注意研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于自学习对比度视觉注意模型和自适应深度特征的无分类目标检测

国家自然科学基金

2+阅读 · 2015年12月31日

微信扫码咨询专知VIP会员