This study investigates unsupervised anomaly action recognition, which identifies video-level abnormal-human-behavior events in an unsupervised manner without abnormal samples, and simultaneously addresses three limitations in the conventional skeleton-based approaches: target domain-dependent DNN training, robustness against skeleton errors, and a lack of normal samples. We present a unified, user prompt-guided zero-shot learning framework using a target domain-independent skeleton feature extractor, which is pretrained on a large-scale action recognition dataset. Particularly, during the training phase using normal samples, the method models the distribution of skeleton features of the normal actions while freezing the weights of the DNNs and estimates the anomaly score using this distribution in the inference phase. Additionally, to increase robustness against skeleton errors, we introduce a DNN architecture inspired by a point cloud deep learning paradigm, which sparsely propagates the features between joints. Furthermore, to prevent the unobserved normal actions from being misidentified as abnormal actions, we incorporate a similarity score between the user prompt embeddings and skeleton features aligned in the common space into the anomaly score, which indirectly supplements normal actions. On two publicly available datasets, we conduct experiments to test the effectiveness of the proposed method with respect to abovementioned limitations.


翻译:摘要:本研究探索无监督异常动作识别,该方法无需异常样本即可在无监督方式下识别视频级异常人类行为事件,并同时解决传统基于骨骼的方法中的三个局限:依赖目标域训练的深度神经网络、对骨骼误差的鲁棒性不足以及正常样本缺失。我们提出一个统一的、用户提示引导的零样本学习框架,采用独立于目标域的骨骼特征提取器,该提取器在大型动作识别数据集上预训练。特别地,在使用正常样本的训练阶段,该方法在冻结深度神经网络权重的同时对正常动作的骨骼特征分布进行建模,并在推理阶段利用该分布估计异常分数。此外,为增强对骨骼误差的鲁棒性,我们引入一种受点云深度学习范式启发的深度神经网络架构,该架构在关节之间稀疏传播特征。进一步,为防止未观测到的正常动作被误判为异常,我们将用户提示嵌入与公共空间中对齐的骨骼特征之间的相似度分数纳入异常分数,从而间接补充正常动作信息。在两个公开数据集上,针对上述局限,我们开展实验验证所提方法的有效性。

0
下载
关闭预览

相关内容

视频自监督学习综述
专知会员服务
53+阅读 · 2022年7月5日
专知会员服务
90+阅读 · 2021年6月29日
专知会员服务
26+阅读 · 2021年5月23日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
EMNLP 2022 | 基于全局句向量的分布外文本检测
PaperWeekly
0+阅读 · 2022年10月31日
【SIGIR2018】五篇对抗训练文章
专知
12+阅读 · 2018年7月9日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2010年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2023年5月15日
Arxiv
13+阅读 · 2021年3月29日
A Survey on Deep Transfer Learning
Arxiv
11+阅读 · 2018年8月6日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
7+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
5+阅读 · 6月17日
相关资讯
EMNLP 2022 | 基于全局句向量的分布外文本检测
PaperWeekly
0+阅读 · 2022年10月31日
【SIGIR2018】五篇对抗训练文章
专知
12+阅读 · 2018年7月9日
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2010年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员