High-quality annotated datasets are crucial for advancing machine learning in medical image analysis. However, a critical gap exists: most datasets either offer a single, clean ground truth, which hides real-world expert disagreement, or they provide multiple annotations without a separate gold standard for objective evaluation. To bridge this gap, we introduce CytoCrowd, a new public benchmark for cytology analysis. The dataset features 446 high-resolution images, each with two key components: (1) raw, conflicting annotations from four independent pathologists, and (2) a separate, high-quality gold-standard ground truth established by a senior expert. This dual structure makes CytoCrowd a versatile resource. It serves as a benchmark for standard computer vision tasks, such as object detection and classification, using the ground truth. Simultaneously, it provides a realistic testbed for evaluating annotation aggregation algorithms that must resolve expert disagreements. We provide comprehensive baseline results for both tasks. Our experiments demonstrate the challenges presented by CytoCrowd and establish its value as a resource for developing the next generation of models for medical image analysis.


翻译:高质量标注数据集对于推动医学图像分析中的机器学习至关重要。然而,当前存在一个关键缺口:大多数数据集要么提供单一、干净的基准真值,这掩盖了真实世界中专家间的分歧;要么提供多个标注,但缺乏独立的金标准以进行客观评估。为填补这一缺口,我们引入了CytoCrowd,一个用于细胞学分析的新公开基准。该数据集包含446张高分辨率图像,每张图像具有两个关键组成部分:(1) 来自四位独立病理学家的原始、存在冲突的标注;(2) 由资深专家建立的独立、高质量的基准真值金标准。这种双重结构使CytoCrowd成为一个多功能资源。一方面,它可作为标准计算机视觉任务(如使用基准真值进行目标检测和分类)的基准。同时,它也为评估必须解决专家分歧的标注聚合算法提供了一个真实的测试平台。我们为这两类任务提供了全面的基线结果。我们的实验展示了CytoCrowd带来的挑战,并确立了其作为开发下一代医学图像分析模型资源的价值。

0
下载
关闭预览

相关内容

标签高效深度学习的医学图像分析:挑战与未来方向
专知会员服务
35+阅读 · 2023年4月3日
因果推断在医药图像的应用:数据缺失和数据不匹配
专知会员服务
58+阅读 · 2022年4月2日
高效医疗图像分析的统一表示
专知会员服务
36+阅读 · 2020年6月23日
【资源】图像分割/显著性检测数据集列表
专知
13+阅读 · 2019年5月22日
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
16+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
VIP会员
相关资讯
相关基金
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
16+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员