Deep-learning-based segmentation algorithms have substantially advanced the field of medical image analysis, particularly in structural delineations in MRIs. However, an important consideration is the intrinsic bias in the data. Concerns about unfairness, such as performance disparities based on sensitive attributes like race and sex, are increasingly urgent. In this work, we evaluate the results of three different segmentation models (UNesT, nnU-Net, and CoTr) and a traditional atlas-based method (ANTs), applied to segment the left and right nucleus accumbens (NAc) in MRI images. We utilize a dataset including four demographic subgroups: black female, black male, white female, and white male. We employ manually labeled gold-standard segmentations to train and test segmentation models. This study consists of two parts: the first assesses the segmentation performance of models, while the second measures the volumes they produce to evaluate the effects of race, sex, and their interaction. Fairness is quantitatively measured using a metric designed to quantify fairness in segmentation performance. Additionally, linear mixed models analyze the impact of demographic variables on segmentation accuracy and derived volumes. Training on the same race as the test subjects leads to significantly better segmentation accuracy for some models. ANTs and UNesT show notable improvements in segmentation accuracy when trained and tested on race-matched data, unlike nnU-Net, which demonstrates robust performance independent of demographic matching. Finally, we examine sex and race effects on the volume of the NAc using segmentations from the manual rater and from our biased models. Results reveal that the sex effects observed with manual segmentation can also be observed with biased models, whereas the race effects disappear in all but one model.


翻译:基于深度学习的分割算法显著推动了医学影像分析领域的发展,尤其在磁共振成像(MRI)的结构描绘方面。然而,一个重要考量是数据中存在的内在偏差。关于不公平性的担忧,例如基于种族和性别等敏感属性的性能差异,正日益紧迫。在本研究中,我们评估了三种不同分割模型(UNesT、nnU-Net和CoTr)以及一种传统的基于图谱方法(ANTs)在MRI图像中分割左右伏隔核(NAc)的结果。我们使用的数据集包含四个人口统计学亚组:黑人女性、黑人男性、白人女性和白人男性。我们采用手动标注的金标准分割来训练和测试分割模型。本研究包含两部分:第一部分评估模型的分割性能,第二部分测量模型产生的体积以评估种族、性别及其交互效应的影响。公平性通过一个专门设计用于量化分割性能公平性的指标进行定量测量。此外,线性混合模型分析了人口统计学变量对分割准确性和衍生体积的影响。对于某些模型,使用与测试对象相同种族的数据进行训练能显著提高分割准确性。ANTs和UNesT在种族匹配数据上训练和测试时显示出分割准确性的显著提升,而nnU-Net则表现出不依赖于人口统计学匹配的稳健性能。最后,我们利用手动标注者及我们带有偏差的模型产生的分割结果,检验了性别和种族对NAc体积的影响。结果显示,手动分割观察到的性别效应在带有偏差的模型中同样可以观察到,而种族效应则除一个模型外,在其他所有模型中均消失。

0
下载
关闭预览

相关内容

【MIT博士论文】利用深度学习改进医学影像分割,165页pdf
专知会员服务
50+阅读 · 2021年8月28日
专知会员服务
116+阅读 · 2021年1月11日
深度学习与医学图像分析
人工智能前沿讲习班
40+阅读 · 2019年6月8日
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
基于深度学习的图像超分辨率最新进展与趋势【附PDF】
人工智能前沿讲习班
15+阅读 · 2019年2月27日
推荐 | 基于深度学习的图像语义分割方法回顾(附PDF下载)
机器学习算法与Python学习
25+阅读 · 2017年12月30日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
(译文)认知战:以士兵为目标,塑造战略
专知会员服务
2+阅读 · 今天3:12
(中文)认知战的本体论基础(2026报告)
专知会员服务
17+阅读 · 今天1:45
美空军条令(2026):外国对内防御
专知会员服务
3+阅读 · 今天1:32
美国与以色列如何在攻击伊朗中使用人工智能
专知会员服务
7+阅读 · 4月16日
《自动化战略情报管控》
专知会员服务
3+阅读 · 4月16日
得失评估:审视对伊朗战争的轨迹(简报)
专知会员服务
3+阅读 · 4月16日
【CMU博士论文】迈向可解释机器学习的理论基础
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员