Safe artificial intelligence for perception tasks remains a major challenge, partly due to the lack of data with high-quality labels. Annotations themselves are subject to aleatoric and epistemic uncertainty, which is typically ignored during annotation and evaluation. While crowdsourcing enables collecting multiple annotations per image to estimate these uncertainties, this approach is impractical at scale due to the required annotation effort. We introduce a probabilistic label spreading method that provides reliable estimates of aleatoric and epistemic uncertainty of labels. Assuming label smoothness over the feature space, we propagate single annotations using a graph-based diffusion method. We prove that label spreading yields consistent probability estimators even when the number of annotations per data point converges to zero. We present and analyze a scalable implementation of our method. Experimental results indicate that, compared to baselines, our approach substantially reduces the annotation budget required to achieve a desired label quality on common image datasets and achieves a new state of the art on the Data-Centric Image Classification benchmark.


翻译:感知任务的安全人工智能仍面临重大挑战,部分原因在于缺乏高质量标注数据。标注过程本身同时受到偶然不确定性与认知不确定性的影响,而这些不确定性在标注和评估阶段通常被忽视。虽然众包技术能够为每张图像收集多个标注以估计这些不确定性,但由于所需标注工作量巨大,该方法难以实现规模化应用。本文提出一种概率标签传播方法,能够可靠估计标签的偶然不确定性与认知不确定性。基于特征空间中的标签平滑性假设,我们采用基于图的扩散方法对单次标注进行传播。我们证明,即使每个数据点的标注数量趋近于零,标签传播仍能产生一致的概率估计量。本文提出并分析了一种可扩展的方法实现方案。实验结果表明,在常见图像数据集上,与基线方法相比,本方法在达到目标标注质量时所需的标注预算显著降低,并在以数据为中心的图像分类基准测试中取得了新的最优性能。

0
下载
关闭预览

相关内容

小样本图像分类研究综述
专知会员服务
58+阅读 · 2023年1月27日
数据标注研究综述,软件学报,19页pdf
专知会员服务
95+阅读 · 2020年2月20日
零样本图像识别综述论文
专知
22+阅读 · 2020年4月4日
「PPT」深度学习中的不确定性估计
专知
27+阅读 · 2019年7月20日
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
25+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员