OCCAM：类别无关、无需训练、无需先验且支持多类别的物体计数 (OCCAM: Class-Agnostic, Training-Free, Prior-Free and Multi-Class Object Counting) - 专知论文

会员服务 ·

0

类别 · 数据集 · 合成 · 包含 · 学习模型 ·

OCCAM: Class-Agnostic, Training-Free, Prior-Free and Multi-Class Object Counting

翻译：OCCAM：类别无关、无需训练、无需先验且支持多类别的物体计数

Michail Spanakis,Iason Oikonomidis,Antonis Argyros

Class-Agnostic object Counting (CAC) involves counting instances of objects from arbitrary classes within an image. Due to its practical importance, CAC has received increasing attention in recent years. Most existing methods assume a single object class per image, rely on extensive training of large deep learning models and address the problem by incorporating additional information, such as visual exemplars or text prompts. In this paper, we present OCCAM, the first training-free approach to CAC that operates without the need of any supplementary information. Moreover, our approach addresses the multi-class variant of the problem, as it is capable of counting the object instances in each and every class among arbitrary object classes within an image. We leverage Segment Anything Model 2 (SAM2), a foundation model, and a custom threshold-based variant of the First Integer Neighbor Clustering Hierarchy (FINCH) algorithm to achieve competitive performance on widely used benchmark datasets, FSC-147 and CARPK. We propose a synthetic multi-class dataset and F1 score as a more suitable evaluation metric. The code for our method and the proposed synthetic dataset will be made publicly available at https://mikespanak.github.io/OCCAM_counter.

翻译：类别无关物体计数（CAC）旨在统计图像中任意类别物体的实例数量。由于其实际重要性，CAC近年来受到越来越多的关注。现有方法大多假设每张图像仅包含单一物体类别，依赖大规模深度学习模型的广泛训练，并通过引入视觉示例或文本提示等附加信息来解决该问题。本文提出OCCAM，这是首个无需训练、且无需任何辅助信息的CAC方法。此外，我们的方法解决了该问题的多类别变体，能够对图像中任意物体类别中的每个类别分别统计其实例数量。我们利用基础模型Segment Anything Model 2（SAM2）以及自定义的基于阈值的FINCH算法变体，在广泛使用的基准数据集FSC-147和CARPK上取得了具有竞争力的性能。我们提出了一个合成多类别数据集和F1分数作为更合适的评估指标。本方法的代码及所提出的合成数据集将在https://mikespanak.github.io/OCCAM_counter公开提供。

0

相关内容

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

专知会员服务

27+阅读 · 2022年3月22日

NTU最新《广义分布外OOD检测》综述论文，20页pdf阐述离群/异常/新类/开集/分布外检测的异同

NTU最新《广义分布外OOD检测》综述论文，20页pdf阐述离群/异常/新类/开集/分布外检测的异同

专知会员服务

29+阅读 · 2021年10月26日

【KDD2021-谷歌】面向推荐的学习在不嵌入表的情况下嵌入类别特征

专知会员服务

11+阅读 · 2021年8月17日

零样本图像分类综述

专知会员服务

52+阅读 · 2021年5月15日

20年单类别(One-Class)分类全面综述论文，从2001到2020

20年单类别(One-Class)分类全面综述论文，从2001到2020

专知会员服务

23+阅读 · 2021年1月12日

【Mila】通用表示Transformer少样本图像分类

【Mila】通用表示Transformer少样本图像分类

专知会员服务

33+阅读 · 2020年9月7日

【华南理工大学】无监督多类域自适应:理论、算法和实践，Unsupervised Multi-Class DA

专知会员服务

28+阅读 · 2020年3月2日

图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

专知会员服务

185+阅读 · 2020年2月22日

基于破坏和构造学习的细粒度图像识别（Destruction and Construction Learning for Fine-grained Image Recognition）

基于破坏和构造学习的细粒度图像识别（Destruction and Construction Learning for Fine-grained Image Recognition）

专知会员服务

20+阅读 · 2020年1月26日

【视频中的零样本动作识别：综述】Zero-Shot Action Recognition in Videos: A Survey

【视频中的零样本动作识别：综述】Zero-Shot Action Recognition in Videos: A Survey

专知会员服务

39+阅读 · 2019年10月12日

零样本文本分类，Zero-Shot Learning for Text Classification

零样本文本分类，Zero-Shot Learning for Text Classification

专知

16+阅读 · 2020年5月31日

【CVPR2020-中科院-腾讯优图】基于注意力卷积二叉神经树的细粒度视觉分类

【CVPR2020-中科院-腾讯优图】基于注意力卷积二叉神经树的细粒度视觉分类

专知

12+阅读 · 2020年3月29日

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

专知

11+阅读 · 2020年3月17日

超像素、语义分割、实例分割、全景分割傻傻分不清？

超像素、语义分割、实例分割、全景分割傻傻分不清？

计算机视觉life

19+阅读 · 2018年11月27日

学界 | FAIR提出用聚类方法结合卷积网络，实现无监督端到端图像分类

学界 | FAIR提出用聚类方法结合卷积网络，实现无监督端到端图像分类

机器之心

11+阅读 · 2018年8月6日

【干货】Python无监督学习的4大聚类算法

【干货】Python无监督学习的4大聚类算法

新智元

14+阅读 · 2018年5月26日

报名 | 码隆科技与谷歌研究院合办Kaggle大赛，挑战商品图像分类极限！

报名 | 码隆科技与谷歌研究院合办Kaggle大赛，挑战商品图像分类极限！

机器之心

10+阅读 · 2018年4月19日

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

CreateAMind

12+阅读 · 2018年4月7日

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

专知

17+阅读 · 2018年3月3日

推荐｜caffe-orc主流ocr算法：CNN+BLSTM+CTC架构实现！

推荐｜caffe-orc主流ocr算法：CNN+BLSTM+CTC架构实现！

全球人工智能

19+阅读 · 2017年10月29日

基于分类能力结构度量与类相关性关系保留的特征选取方法研究

国家自然科学基金

1+阅读 · 2017年12月31日

不可忽略缺失机制下的广义矩方法和调整经验似然方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

考虑物品种类有限性的分类存储策略及仓储系统优化研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于对象模型与多点空间统计的高分辨率遥感影像分类策略

国家自然科学基金

4+阅读 · 2015年12月31日

基于概率语义分析的多关系图多类标分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

9+阅读 · 2015年12月31日

基于自学习对比度视觉注意模型和自适应深度特征的无分类目标检测

国家自然科学基金

2+阅读 · 2015年12月31日

结合图像块联合聚类加权和混合分类器的非对齐稀疏表示识别方法

国家自然科学基金

1+阅读 · 2015年12月31日

普适计算对象感知多模态不精确性数据融合算法研究

国家自然科学基金

5+阅读 · 2014年12月31日

函数空间的拓扑分类

国家自然科学基金

1+阅读 · 2014年12月31日

AutoNumerics: An Autonomous, PDE-Agnostic Multi-Agent Pipeline for Scientific Computing

AutoNumerics: An Autonomous, PDE-Agnostic Multi-Agent Pipeline for Scientific Computing

Arxiv

0+阅读 · 2月19日

SpectralGCD: Spectral Concept Selection and Cross-modal Representation Learning for Generalized Category Discovery

Arxiv

0+阅读 · 2月19日

ART: Adaptive Resampling-based Training for Imbalanced Classification

Arxiv

0+阅读 · 2月15日

Universal Transformation of One-Class Classifiers for Unsupervised Anomaly Detection

Arxiv

0+阅读 · 2月13日

Ca-MCF: Category-level Multi-label Causal Feature selection

Arxiv

0+阅读 · 2月13日

Bootstrapping MLLM for Weakly-Supervised Class-Agnostic Object Counting

Arxiv

0+阅读 · 2月13日

A Survey on Class-Agnostic Counting: Advancements from Reference-Based to Open-World Text-Guided Approaches

Arxiv

0+阅读 · 2月9日

LBL: Logarithmic Barrier Loss Function for One-class Classification

Arxiv

0+阅读 · 2月8日

CountZES: Counting via Zero-Shot Exemplar Selection

Arxiv

0+阅读 · 2月3日

UniHash: Unifying Pointwise and Pairwise Hashing Paradigms for Seen and Unseen Category Retrieval

Arxiv

0+阅读 · 1月20日

VIP会员

文章信息

相关主题

相关VIP内容

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

专知会员服务

27+阅读 · 2022年3月22日

NTU最新《广义分布外OOD检测》综述论文，20页pdf阐述离群/异常/新类/开集/分布外检测的异同

NTU最新《广义分布外OOD检测》综述论文，20页pdf阐述离群/异常/新类/开集/分布外检测的异同

专知会员服务

29+阅读 · 2021年10月26日

【KDD2021-谷歌】面向推荐的学习在不嵌入表的情况下嵌入类别特征

专知会员服务

11+阅读 · 2021年8月17日

零样本图像分类综述

专知会员服务

52+阅读 · 2021年5月15日

20年单类别(One-Class)分类全面综述论文，从2001到2020

20年单类别(One-Class)分类全面综述论文，从2001到2020

专知会员服务

23+阅读 · 2021年1月12日

【Mila】通用表示Transformer少样本图像分类

【Mila】通用表示Transformer少样本图像分类

专知会员服务

33+阅读 · 2020年9月7日

【华南理工大学】无监督多类域自适应:理论、算法和实践，Unsupervised Multi-Class DA

专知会员服务

28+阅读 · 2020年3月2日

图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

图像分类最新技术综述论文: 21种半监督、自监督和无监督学习方法一较高低

专知会员服务

185+阅读 · 2020年2月22日

基于破坏和构造学习的细粒度图像识别（Destruction and Construction Learning for Fine-grained Image Recognition）

基于破坏和构造学习的细粒度图像识别（Destruction and Construction Learning for Fine-grained Image Recognition）

专知会员服务

20+阅读 · 2020年1月26日

【视频中的零样本动作识别：综述】Zero-Shot Action Recognition in Videos: A Survey

【视频中的零样本动作识别：综述】Zero-Shot Action Recognition in Videos: A Survey

专知会员服务

39+阅读 · 2019年10月12日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

零样本文本分类，Zero-Shot Learning for Text Classification

零样本文本分类，Zero-Shot Learning for Text Classification

专知

16+阅读 · 2020年5月31日

【CVPR2020-中科院-腾讯优图】基于注意力卷积二叉神经树的细粒度视觉分类

【CVPR2020-中科院-腾讯优图】基于注意力卷积二叉神经树的细粒度视觉分类

专知

12+阅读 · 2020年3月29日

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

专知

11+阅读 · 2020年3月17日

超像素、语义分割、实例分割、全景分割傻傻分不清？

超像素、语义分割、实例分割、全景分割傻傻分不清？

计算机视觉life

19+阅读 · 2018年11月27日

学界 | FAIR提出用聚类方法结合卷积网络，实现无监督端到端图像分类

学界 | FAIR提出用聚类方法结合卷积网络，实现无监督端到端图像分类

机器之心

11+阅读 · 2018年8月6日

【干货】Python无监督学习的4大聚类算法

【干货】Python无监督学习的4大聚类算法

新智元

14+阅读 · 2018年5月26日

报名 | 码隆科技与谷歌研究院合办Kaggle大赛，挑战商品图像分类极限！

报名 | 码隆科技与谷歌研究院合办Kaggle大赛，挑战商品图像分类极限！

机器之心

10+阅读 · 2018年4月19日

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

CreateAMind

12+阅读 · 2018年4月7日

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

【论文推荐】最新七篇图像分类相关论文—条件标签空间、生成对抗胶囊网络、深度预测编码网络、生成对抗网络、数字病理图像、在线表示学习

专知

17+阅读 · 2018年3月3日

推荐｜caffe-orc主流ocr算法：CNN+BLSTM+CTC架构实现！

推荐｜caffe-orc主流ocr算法：CNN+BLSTM+CTC架构实现！

全球人工智能

19+阅读 · 2017年10月29日

相关论文

AutoNumerics: An Autonomous, PDE-Agnostic Multi-Agent Pipeline for Scientific Computing

AutoNumerics: An Autonomous, PDE-Agnostic Multi-Agent Pipeline for Scientific Computing

Arxiv

0+阅读 · 2月19日

SpectralGCD: Spectral Concept Selection and Cross-modal Representation Learning for Generalized Category Discovery

Arxiv

0+阅读 · 2月19日

ART: Adaptive Resampling-based Training for Imbalanced Classification

Arxiv

0+阅读 · 2月15日

Universal Transformation of One-Class Classifiers for Unsupervised Anomaly Detection

Arxiv

0+阅读 · 2月13日

Ca-MCF: Category-level Multi-label Causal Feature selection

Arxiv

0+阅读 · 2月13日

Bootstrapping MLLM for Weakly-Supervised Class-Agnostic Object Counting

Arxiv

0+阅读 · 2月13日

A Survey on Class-Agnostic Counting: Advancements from Reference-Based to Open-World Text-Guided Approaches

Arxiv

0+阅读 · 2月9日

LBL: Logarithmic Barrier Loss Function for One-class Classification

Arxiv

0+阅读 · 2月8日

CountZES: Counting via Zero-Shot Exemplar Selection

Arxiv

0+阅读 · 2月3日

UniHash: Unifying Pointwise and Pairwise Hashing Paradigms for Seen and Unseen Category Retrieval

Arxiv

0+阅读 · 1月20日

相关基金

基于分类能力结构度量与类相关性关系保留的特征选取方法研究

国家自然科学基金

1+阅读 · 2017年12月31日

不可忽略缺失机制下的广义矩方法和调整经验似然方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

考虑物品种类有限性的分类存储策略及仓储系统优化研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于对象模型与多点空间统计的高分辨率遥感影像分类策略

国家自然科学基金

4+阅读 · 2015年12月31日

基于概率语义分析的多关系图多类标分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

9+阅读 · 2015年12月31日

基于自学习对比度视觉注意模型和自适应深度特征的无分类目标检测

国家自然科学基金

2+阅读 · 2015年12月31日

结合图像块联合聚类加权和混合分类器的非对齐稀疏表示识别方法

国家自然科学基金

1+阅读 · 2015年12月31日

普适计算对象感知多模态不精确性数据融合算法研究

国家自然科学基金

5+阅读 · 2014年12月31日

函数空间的拓扑分类

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员