With the growing volume of CT examinations, there is an increasing demand for automated tools such as organ segmentation, abnormality detection, and report generation to support radiologists in managing their clinical workload. Multi-label classification of 3D Chest CT scans remains a critical yet challenging problem due to the complex spatial relationships inherent in volumetric data and the wide variability of abnormalities. Existing methods based on 3D convolutional neural networks struggle to capture long-range dependencies, while Vision Transformers often require extensive pre-training on large-scale, domain-specific datasets to perform competitively. In this work of academic research, we propose a 2.5D alternative by introducing a new graph-based framework that represents 3D CT volumes as structured graphs, where axial slice triplets serve as nodes processed through spectral graph convolution, enabling the model to reason over inter-slice dependencies while maintaining complexity compatible with clinical deployment. Our method, trained and evaluated on 3 datasets from independent institutions, achieves strong cross-dataset generalization, and shows competitive performance compared to state-of-the-art visual encoders. We further conduct comprehensive ablation studies to evaluate the impact of various aggregation strategies, edge-weighting schemes, and graph connectivity patterns. Additionally, we demonstrate the broader applicability of our approach through transfer experiments on automated radiology report generation and abdominal CT data.


翻译:随着CT检查数量的日益增长,对器官分割、异常检测和报告生成等自动化工具的需求不断增加,以辅助放射科医生管理临床工作负荷。由于体数据固有的复杂空间关系及异常的广泛变异性,3D胸部CT扫描的多标签分类仍是一个关键且具有挑战性的问题。基于3D卷积神经网络的现有方法难以捕捉长程依赖关系,而视觉Transformer通常需要在大规模领域特定数据集上进行广泛预训练才能获得有竞争力的性能。在本学术研究中,我们提出一种2.5D替代方案,引入基于图的新框架:将3D CT体数据表示为结构化图,其中轴向切片三元组作为节点通过谱图卷积进行处理,使模型能够推理切片间依赖关系,同时保持与临床部署兼容的复杂度。我们在来自独立机构的3个数据集上训练和评估所提方法,实现了强大的跨数据集泛化能力,并与最先进的视觉编码器相比展现出有竞争力的性能。我们进一步通过全面的消融研究评估了不同聚合策略、边权重方案和图连接模式的影响。此外,我们通过自动化放射学报告生成和腹部CT数据的迁移实验,证明了该方法具有更广泛的适用性。

0
下载
关闭预览

相关内容

3D是英文“Three Dimensions”的简称,中文是指三维、三个维度、三个坐标,即有长、有宽、有高,换句话说,就是立体的,是相对于只有长和宽的平面(2D)而言。
视觉Transformer预训练模型的胸腔X线影像多标签分类
专知会员服务
14+阅读 · 2022年7月29日
专知会员服务
50+阅读 · 2021年8月28日
基于深度学习的图异常检测技术综述
专知会员服务
86+阅读 · 2021年7月28日
专知会员服务
61+阅读 · 2021年5月11日
深度学习与医学图像分析
人工智能前沿讲习班
40+阅读 · 2019年6月8日
基于深度学习的目标检测算法剖析与实现【附PPT与视频资料】
人工智能前沿讲习班
12+阅读 · 2018年12月25日
基于视频的目标检测的发展【附PPT与视频资料】
人工智能前沿讲习班
19+阅读 · 2018年12月14日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
VIP会员
相关资讯
深度学习与医学图像分析
人工智能前沿讲习班
40+阅读 · 2019年6月8日
基于深度学习的目标检测算法剖析与实现【附PPT与视频资料】
人工智能前沿讲习班
12+阅读 · 2018年12月25日
基于视频的目标检测的发展【附PPT与视频资料】
人工智能前沿讲习班
19+阅读 · 2018年12月14日
相关基金
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员