Child Sexual Abuse Imagery (CSAI) classification systems are needed solutions for lessening the psychological impacts often felt by law enforcement agents responsible for evaluating these materials and for efficient removal of these materials from the web. However, due to the nature of the task, researching and developing such systems is not a trivial endeavor. The images are highly sensitive, and the related datasets are under restrictive access regimes, which means most studies in the area are not reproducible or distributable and are therefore hard to compare and validate. More concerning still, most models for this task today lack an aspect often desired by law enforcement agents: explainability. In this paper, we apply an ensemble of Proxy Tasks -- tasks that correlate to CSAI classification -- yielding improvements in reproducibility, explainability, and security for distribution. This concept is applied for the first time to real CSAI, with a novel selection of relevant Proxy Tasks (selected from the CSAI literature) and training adaptations to the original framework. Our final model achieves competitive results, yielding 91.9% balanced accuracy on the RCPD dataset with the best Proxy Task combination. We furthermore contrast these results with the best-in-class representation learning model, DINO, and show that our ensemble improves accuracy and provides explanations for its classification results, a feature that a single deep learning model can seldom provide.


翻译:儿童性虐待图像分类系统是减轻执法人员心理影响及高效清除网络非法内容的必要解决方案。然而,此类系统的研发工作因任务特殊性而面临巨大挑战:图像高度敏感且相关数据集受严格访问限制,导致该领域多数研究难以复现、传播,更遑论比较与验证。更令人担忧的是,当前大多数模型缺乏执法人员迫切需要的可解释性。本文提出一种代理任务集成方法(即与儿童性虐待图像分类相关的关联任务),在可复现性、可解释性和分发安全性方面取得改进。该方案首次应用于真实儿童性虐待图像,创新性地从相关文献中选取了有效的代理任务组合,并对原始框架进行了适应性训练改进。最终模型在RCPD数据集上采用最优代理任务组合时,达到91.9%的均衡准确率。此外,我们与当前最优表征学习模型DINO进行对比,证明本集成方法在提升准确率的同时,能为分类结果提供可解释性——这是单一深度学习模型难以实现的特性。

0
下载
关闭预览

相关内容

Transformer 驱动的图像分类研究进展综述
专知会员服务
55+阅读 · 2023年2月24日
「可解释知识图谱推理」最新方法综述
专知会员服务
89+阅读 · 2022年12月17日
面向图像分类的对抗鲁棒性评估综述
专知会员服务
59+阅读 · 2022年10月15日
面向图像分类的小样本学习算法综述
专知会员服务
65+阅读 · 2022年5月9日
图像分类的深度卷积神经网络模型综述
专知会员服务
57+阅读 · 2021年10月29日
[CVPR 2020]BEDSR-Net:单张文档图像的阴影去除深度网络
专知会员服务
26+阅读 · 2020年9月29日
基于深度学习的医学图像半监督分割
CVer
14+阅读 · 2020年9月24日
用户画像技术及方法论
DataFunTalk
13+阅读 · 2020年5月27日
最全综述 | 图像分割算法
计算机视觉life
14+阅读 · 2019年6月20日
【干货】李沐等人:CNN图像分类Trick合集(附详细代码)
GAN生成式对抗网络
58+阅读 · 2018年12月11日
【学界】基于条件深度卷积生成对抗网络的图像识别方法
GAN生成式对抗网络
16+阅读 · 2018年7月26日
推荐 | 基于深度学习的图像语义分割方法回顾(附PDF下载)
机器学习算法与Python学习
25+阅读 · 2017年12月30日
国家自然科学基金
9+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
7+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
8+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
6+阅读 · 6月17日
相关基金
国家自然科学基金
9+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员