The classification performance of deep neural networks relies strongly on access to large, accurately annotated datasets. In medical imaging, however, obtaining such datasets is particularly challenging since annotations must be provided by specialized physicians, which severely limits the pool of annotators. Furthermore, class boundaries can often be ambiguous or difficult to define which further complicates machine learning-based classification. In this paper, we want to address this problem and introduce a framework for mislabel detection in medical datasets. This is validated on the two largest, publicly available datasets for Video Capsule Endoscopy, an important imaging procedure for examining the gastrointestinal tract based on a video stream of lowresolution images. In addition, potentially mislabeled samples identified by our pipeline were reviewed and re-annotated by three experienced gastroenterologists. Our results show that the proposed framework successfully detects incorrectly labeled data and results in an improved anomaly detection performance after cleaning the datasets compared to current baselines.


翻译:深度神经网络的分类性能在很大程度上依赖于获取大规模且标注准确的数据集。然而,在医学影像领域,获取此类数据集尤为困难,因为标注必须由专业医师提供,这严重限制了标注人员的规模。此外,类别边界常常模糊不清或难以界定,这进一步增加了基于机器学习的分类任务的复杂性。本文旨在解决这一问题,提出一种用于医学数据集中误标检测的框架。该框架在两个最大的公开视频胶囊内窥镜数据集上进行了验证——视频胶囊内窥镜是一种基于低分辨率图像视频流检查胃肠道的重要成像技术。此外,我们通过三位经验丰富的胃肠病学专家对算法流程识别出的潜在误标样本进行了复核与重新标注。实验结果表明,所提出的框架能有效检测错误标注的数据,且在清洗数据集后,相较于现有基线方法,异常检测性能得到了提升。

0
下载
关闭预览

相关内容

【MIT博士论文】基于数据的模型可靠性视角,322页pdf
专知会员服务
39+阅读 · 2024年3月25日
最新《深度半监督学习》综述论文,43页pdf
专知会员服务
156+阅读 · 2020年6月12日
深度学习模型可解释性的研究进展
专知
26+阅读 · 2020年8月1日
最全综述 | 图像目标检测
计算机视觉life
31+阅读 · 2019年6月24日
基于视频的目标检测的发展【附PPT与视频资料】
人工智能前沿讲习班
19+阅读 · 2018年12月14日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
16+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
16+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员