【ICCV2021】基于耦合语义注意力的弱监督目标定位 - 专知VIP

会员服务 ·

1

弱监督目标定位 · 卷积神经网络 ·

2021 年 8 月 2 日

【ICCV2021】基于耦合语义注意力的弱监督目标定位

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

基于耦合语义注意力的弱监督目标定位

TS-CAM: Token Semantic Coupled ttention

Map for Weakly Supervised Object Localization

弱监督目标定位是指仅根据图像层面的类别标签学习目标位置的任务。基于卷积神经网络 (CNN)的分类模型往往仅会激活目标的局部判别区域，而忽略完整的目标范围，称为局部激活问题。在这篇文章中，我们认为局部激活问题是由于CNN的内在特性导致。CNN由一系列卷积操作组成，导致模型仅具有局部的感受野，无法获取长距离的特征依赖性。基于此，我们提出我们提出基于Transformer的耦合语义类别激活图（TS-CAM）方法，借助自注意力机制提取长距离特征相似性。TS-CAM 首先将图像分割为一系列子块，通过位置编码学习不同子块间全局的注意力。之后，对每个子块进行重新排列得到得到类别语义图。最后，融合模型学习的全局注意力图与类别语义图得到类别激活图。在 ILSVRC/CUB-200-2011 数据集上的实验表明，TS-CAM 的性能超过其他基于CNN-CAM结构的方法约 7.1%/27.1%，达到SOTA。

https://www.zhuanzhi.ai/paper/4fd09541701bdbaa750df1804f96d58c

成为VIP会员查看完整内容

16

相关内容

弱监督目标定位

弱监督目标定位

【ICCV2021】模态视频表示的跨模态对比学习

专知会员服务

16+阅读 · 2021年10月4日

【ICCV2021】自监督蒸馏的长尾视觉识别

专知会员服务

24+阅读 · 2021年9月16日

【ICCV2021-Oral】重新思考人群中的计数和定位问题：一种完全基于点的全新框架

专知会员服务

12+阅读 · 2021年8月3日

【CVPR2021】基于结构保持的弱监督目标定位

专知会员服务

16+阅读 · 2021年6月6日

（CVPR2021）基于结构保持的弱监督目标定位

专知会员服务

21+阅读 · 2021年5月1日

【CVPR2021】用于行人重识别的无监督多源域自适应

专知会员服务

21+阅读 · 2021年5月1日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知会员服务

38+阅读 · 2021年4月16日

【CVPR2021】动态区域注意卷积

专知会员服务

21+阅读 · 2021年4月2日

【CVPR2021】空间一致性表示学习

专知会员服务

63+阅读 · 2021年3月12日

【AAAI2020】基于属性指导和纯视觉的注意力对齐的小样本识别

【AAAI2020】基于属性指导和纯视觉的注意力对齐的小样本识别

专知会员服务

15+阅读 · 2021年1月14日

【CVPR2020-中科院-腾讯优图】基于注意力卷积二叉神经树的细粒度视觉分类

【CVPR2020-中科院-腾讯优图】基于注意力卷积二叉神经树的细粒度视觉分类

专知

12+阅读 · 2020年3月29日

CVPR 2020 | 化繁为简，弱监督目标定位领域的新SOTA - 伪监督目标定位方法

CVPR 2020 | 化繁为简，弱监督目标定位领域的新SOTA - 伪监督目标定位方法

AI科技评论

4+阅读 · 2020年3月9日

ICCV 2019 | 北邮提出高阶注意力模型，大幅改进行人重识别SOTA精度

ICCV 2019 | 北邮提出高阶注意力模型，大幅改进行人重识别SOTA精度

极市平台

67+阅读 · 2019年8月31日

ICCV 2019 | 解读北大提出的期望最大化注意力网络EMANet

ICCV 2019 | 解读北大提出的期望最大化注意力网络EMANet

机器之心

5+阅读 · 2019年8月29日

双重注意力网络：中科院自动化所提出新的自然场景图像分割框架（附源码）

双重注意力网络：中科院自动化所提出新的自然场景图像分割框架（附源码）

极市平台

7+阅读 · 2018年9月19日

ECCV18 | UC伯克利提出基于自适应相似场的语义分割（附代码）

ECCV18 | UC伯克利提出基于自适应相似场的语义分割（附代码）

极市平台

6+阅读 · 2018年8月31日

CVPR 2018 | 商汤科技论文详解：基于空间特征调制的图像超分辨率

CVPR 2018 | 商汤科技论文详解：基于空间特征调制的图像超分辨率

商汤科技

16+阅读 · 2018年5月27日

类脑信息处理研究取得进展

类脑信息处理研究取得进展

人工智能学家

5+阅读 · 2018年1月29日

基于深度学习的图像目标检测(下)

基于深度学习的图像目标检测(下)

机器学习研究会

12+阅读 · 2018年1月1日

基于注意力机制的图卷积网络

基于注意力机制的图卷积网络

科技创新与创业

74+阅读 · 2017年11月8日

ASOD60K: An Audio-Induced Salient Object Detection Dataset for Panoramic Videos

Arxiv

0+阅读 · 2021年9月30日

Towards Understanding Trends Manipulation in Pakistan Twitter

Arxiv

0+阅读 · 2021年9月30日

TS-CAM: Token Semantic Coupled Attention Map for Weakly Supervised Object Localization

Arxiv

6+阅读 · 2021年6月21日

How Useful is Self-Supervised Pretraining for Visual Tasks?

How Useful is Self-Supervised Pretraining for Visual Tasks?

Arxiv

9+阅读 · 2020年3月31日

3D Point Cloud Generative Adversarial Network Based on Tree Structured Graph Convolutions

3D Point Cloud Generative Adversarial Network Based on Tree Structured Graph Convolutions

Arxiv

5+阅读 · 2019年5月16日

You May Not Need Attention

Arxiv

4+阅读 · 2018年10月31日

Reciprocal Attention Fusion for Visual Question Answering

Reciprocal Attention Fusion for Visual Question Answering

Arxiv

5+阅读 · 2018年7月22日

Self-Attention Generative Adversarial Networks

Arxiv

8+阅读 · 2018年5月21日

Weakly Supervised Instance Segmentation using Class Peak Response

Arxiv

3+阅读 · 2018年4月3日

Weakly Supervised One-Shot Detection with Attention Siamese Networks

Arxiv

14+阅读 · 2018年1月12日

VIP会员

相关主题

弱监督目标定位

卷积神经网络

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

3+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

3+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

3+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

3+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

3+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

4+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

21+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

【ICCV2021】模态视频表示的跨模态对比学习

专知会员服务

16+阅读 · 2021年10月4日

【ICCV2021】自监督蒸馏的长尾视觉识别

专知会员服务

24+阅读 · 2021年9月16日

【ICCV2021-Oral】重新思考人群中的计数和定位问题：一种完全基于点的全新框架

专知会员服务

12+阅读 · 2021年8月3日

【CVPR2021】基于结构保持的弱监督目标定位

专知会员服务

16+阅读 · 2021年6月6日

（CVPR2021）基于结构保持的弱监督目标定位

专知会员服务

21+阅读 · 2021年5月1日

【CVPR2021】用于行人重识别的无监督多源域自适应

专知会员服务

21+阅读 · 2021年5月1日

【CVPR2021】基于Transformer的视频分割领域

【CVPR2021】基于Transformer的视频分割领域

专知会员服务

38+阅读 · 2021年4月16日

【CVPR2021】动态区域注意卷积

专知会员服务

21+阅读 · 2021年4月2日

【CVPR2021】空间一致性表示学习

专知会员服务

63+阅读 · 2021年3月12日

【AAAI2020】基于属性指导和纯视觉的注意力对齐的小样本识别

【AAAI2020】基于属性指导和纯视觉的注意力对齐的小样本识别

专知会员服务

15+阅读 · 2021年1月14日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

【CVPR2020-中科院-腾讯优图】基于注意力卷积二叉神经树的细粒度视觉分类

【CVPR2020-中科院-腾讯优图】基于注意力卷积二叉神经树的细粒度视觉分类

专知

12+阅读 · 2020年3月29日

CVPR 2020 | 化繁为简，弱监督目标定位领域的新SOTA - 伪监督目标定位方法

CVPR 2020 | 化繁为简，弱监督目标定位领域的新SOTA - 伪监督目标定位方法

AI科技评论

4+阅读 · 2020年3月9日

ICCV 2019 | 北邮提出高阶注意力模型，大幅改进行人重识别SOTA精度

ICCV 2019 | 北邮提出高阶注意力模型，大幅改进行人重识别SOTA精度

极市平台

67+阅读 · 2019年8月31日

ICCV 2019 | 解读北大提出的期望最大化注意力网络EMANet

ICCV 2019 | 解读北大提出的期望最大化注意力网络EMANet

机器之心

5+阅读 · 2019年8月29日

双重注意力网络：中科院自动化所提出新的自然场景图像分割框架（附源码）

双重注意力网络：中科院自动化所提出新的自然场景图像分割框架（附源码）

极市平台

7+阅读 · 2018年9月19日

ECCV18 | UC伯克利提出基于自适应相似场的语义分割（附代码）

ECCV18 | UC伯克利提出基于自适应相似场的语义分割（附代码）

极市平台

6+阅读 · 2018年8月31日

CVPR 2018 | 商汤科技论文详解：基于空间特征调制的图像超分辨率

CVPR 2018 | 商汤科技论文详解：基于空间特征调制的图像超分辨率

商汤科技

16+阅读 · 2018年5月27日

类脑信息处理研究取得进展

类脑信息处理研究取得进展

人工智能学家

5+阅读 · 2018年1月29日

基于深度学习的图像目标检测(下)

基于深度学习的图像目标检测(下)

机器学习研究会

12+阅读 · 2018年1月1日

基于注意力机制的图卷积网络

基于注意力机制的图卷积网络

科技创新与创业

74+阅读 · 2017年11月8日

相关论文

ASOD60K: An Audio-Induced Salient Object Detection Dataset for Panoramic Videos

Arxiv

0+阅读 · 2021年9月30日

Towards Understanding Trends Manipulation in Pakistan Twitter

Arxiv

0+阅读 · 2021年9月30日

TS-CAM: Token Semantic Coupled Attention Map for Weakly Supervised Object Localization

Arxiv

6+阅读 · 2021年6月21日

How Useful is Self-Supervised Pretraining for Visual Tasks?

How Useful is Self-Supervised Pretraining for Visual Tasks?

Arxiv

9+阅读 · 2020年3月31日

3D Point Cloud Generative Adversarial Network Based on Tree Structured Graph Convolutions

3D Point Cloud Generative Adversarial Network Based on Tree Structured Graph Convolutions

Arxiv

5+阅读 · 2019年5月16日

You May Not Need Attention

Arxiv

4+阅读 · 2018年10月31日

Reciprocal Attention Fusion for Visual Question Answering

Reciprocal Attention Fusion for Visual Question Answering

Arxiv

5+阅读 · 2018年7月22日

Self-Attention Generative Adversarial Networks

Arxiv

8+阅读 · 2018年5月21日

Weakly Supervised Instance Segmentation using Class Peak Response

Arxiv

3+阅读 · 2018年4月3日

Weakly Supervised One-Shot Detection with Attention Siamese Networks

Arxiv

14+阅读 · 2018年1月12日

微信扫码咨询专知VIP会员