A Computer Vision Hybrid Approach: CNN and Transformer Models for Accurate Alzheimer's Detection from Brain MRI Scans - 专知论文

会员服务 ·

0

混合 · CNN · 阿尔茨海默病 · 准确率 · Transformer ·

A Computer Vision Hybrid Approach: CNN and Transformer Models for Accurate Alzheimer's Detection from Brain MRI Scans

翻译：一种计算机视觉混合方法：CNN与Transformer模型用于从脑部MRI扫描中准确检测阿尔茨海默病

Md Mahmudul Hoque,Shuvo Karmaker,Md. Hadi Al-Amin,Md Modabberul Islam,Jisun Junayed,Farha Ulfat Mahi

Early and accurate classification of Alzheimers disease (AD) from brain MRI scans is essential for timely clinical intervention and improved patient outcomes. This study presents a comprehensive comparative analysis of five CNN architectures (EfficientNetB0, ResNet50, DenseNet201, MobileNetV3, VGG16), five Transformer-based models (ViT, ConvTransformer, PatchTransformer, MLP-Mixer, SimpleTransformer), and a proposed hybrid model named Evan_V2. All models were evaluated on a four-class AD classification task comprising Mild Dementia, Moderate Dementia, Non-Demented, and Very Mild Dementia categories. Experimental findings show that CNN architectures consistently achieved strong performance, with ResNet50 attaining 98.83% accuracy. Transformer models demonstrated competitive generalization capabilities, with ViT achieving the highest accuracy among them at 95.38%. However, individual Transformer variants exhibited greater class-specific instability. The proposed Evan_V2 hybrid model, which integrates outputs from ten CNN and Transformer architectures through feature-level fusion, achieved the best overall performance with 99.99% accuracy, 0.9989 F1-score, and 0.9968 ROC AUC. Confusion matrix analysis further confirmed that Evan_V2 substantially reduced misclassification across all dementia stages, outperforming every standalone model. These findings highlight the potential of hybrid ensemble strategies in producing highly reliable and clinically meaningful diagnostic tools for Alzheimers disease classification.

翻译：从脑部MRI扫描中对阿尔茨海默病进行早期准确分类，对于及时的临床干预和改善患者预后至关重要。本研究对五种CNN架构（EfficientNetB0、ResNet50、DenseNet201、MobileNetV3、VGG16）、五种基于Transformer的模型（ViT、ConvTransformer、PatchTransformer、MLP-Mixer、SimpleTransformer）以及一个名为Evan_V2的提出的混合模型进行了全面的比较分析。所有模型均在包含轻度痴呆、中度痴呆、非痴呆和极轻度痴呆类别的四分类AD任务上进行评估。实验结果表明，CNN架构始终表现出强大的性能，其中ResNet50达到了98.83%的准确率。Transformer模型展现了有竞争力的泛化能力，其中ViT以95.38%的准确率在其中表现最佳。然而，单个Transformer变体表现出更大的类别特异性不稳定性。所提出的Evan_V2混合模型通过特征级融合整合了十种CNN和Transformer架构的输出，取得了最佳的整体性能，准确率达到99.99%，F1分数为0.9989，ROC AUC为0.9968。混淆矩阵分析进一步证实，Evan_V2显著减少了所有痴呆阶段的误分类，其表现优于每个独立模型。这些发现凸显了混合集成策略在构建高度可靠且具有临床意义的阿尔茨海默病分类诊断工具方面的潜力。

0

相关内容

【博士论文】论视觉 Transformer (Vision Transformers) 中的归纳偏置

【博士论文】论视觉 Transformer (Vision Transformers) 中的归纳偏置

专知会员服务

9+阅读 · 2月13日

【TMI2022】C2FTrans:用于医学图像分割的从粗到细的Transformers

【TMI2022】C2FTrans:用于医学图像分割的从粗到细的Transformers

专知会员服务

24+阅读 · 2022年7月4日

阿联酋MBZ大学发布首篇《Transformers医学影像处理》综述论文，41页pdf阐述ViT在医学图像分割、检测、分类等应用

阿联酋MBZ大学发布首篇《Transformers医学影像处理》综述论文，41页pdf阐述ViT在医学图像分割、检测、分类等应用

专知会员服务

92+阅读 · 2022年1月25日

清华大学提出ACmix | 这才是Self-Attention与CNN正确的融合范式，性能速度全面提升

清华大学提出ACmix | 这才是Self-Attention与CNN正确的融合范式，性能速度全面提升

专知会员服务

27+阅读 · 2021年12月3日

中科院计算所最新「视觉Transformer」综述论文，带你全面了解最新CV分类、检测/分割方法

中科院计算所最新「视觉Transformer」综述论文，带你全面了解最新CV分类、检测/分割方法

专知会员服务

99+阅读 · 2021年11月16日

CNN/MLP/Transformer, 究竟谁行？中科大&微软实证三大网络结构公平比较，各有可取之处

专知会员服务

34+阅读 · 2021年9月18日

【上海交大】可解释CNN的对象分类，Interpretable CNNs for Object Classification

专知会员服务

54+阅读 · 2020年3月14日

【上海交通大学-张拳石】可解释CNN，Interpretable CNNs for Object Classification

【上海交通大学-张拳石】可解释CNN，Interpretable CNNs for Object Classification

专知会员服务

46+阅读 · 2020年3月13日

【论文】评估可扩展贝叶斯深度学习强大的计算机视觉的方法（Evaluating Scalable Bayesian Deep LearningMethods for Robust Computer Vision）

【论文】评估可扩展贝叶斯深度学习强大的计算机视觉的方法（Evaluating Scalable Bayesian Deep LearningMethods for Robust Computer Vision）

专知会员服务

12+阅读 · 2020年1月13日

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

19+阅读 · 2019年10月22日

CVPR 2019 | 告别低分辨率网络，微软提出高分辨率深度神经网络HRNet

CVPR 2019 | 告别低分辨率网络，微软提出高分辨率深度神经网络HRNet

微软研究院AI头条

14+阅读 · 2019年5月21日

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

专知

49+阅读 · 2018年12月23日

【干货】李沐等人：CNN图像分类Trick合集（附详细代码）

【干货】李沐等人：CNN图像分类Trick合集（附详细代码）

GAN生成式对抗网络

58+阅读 · 2018年12月11日

李沐等人：CNN图像分类Trick合集（附详细代码）

李沐等人：CNN图像分类Trick合集（附详细代码）

专知

12+阅读 · 2018年12月11日

CNN五大经典模型:LeNet，AlexNet，GoogleNet，VGG，DRL

CNN五大经典模型:LeNet，AlexNet，GoogleNet，VGG，DRL

黑龙江大学自然语言处理实验室

14+阅读 · 2018年9月7日

关于CNN图像分类的一份综合设计指南

关于CNN图像分类的一份综合设计指南

云栖社区

11+阅读 · 2018年5月15日

H-Nets：让CNN的旋转等变性更加稳定

H-Nets：让CNN的旋转等变性更加稳定

论智

12+阅读 · 2018年4月18日

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

极市平台

14+阅读 · 2018年3月21日

【深度】Deep Visualization:可视化并理解CNN

【深度】Deep Visualization:可视化并理解CNN

专知

12+阅读 · 2017年9月30日

CNN、RNN在自动特征提取中的应用

CNN、RNN在自动特征提取中的应用

乌镇智库

14+阅读 · 2017年8月4日

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

基于微透析在线分析技术和代谢组学方法的人参远志配伍治疗阿尔茨海默病的药效物质基础和作用机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

人类视空间分类的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

用于阿尔茨海默症早期诊断的氟标小分子MRI成像用Aβ探针的研究

国家自然科学基金

0+阅读 · 2015年12月31日

阿尔茨海默病生物标志物的电化学发光成像分析

国家自然科学基金

0+阅读 · 2015年12月31日

早期阿尔茨海默病胼胝体与海马的时空特征研究

国家自然科学基金

0+阅读 · 2015年12月31日

分析基因组关联研究数据识别阿尔茨海默和帕金森疾病相关的风险位点和遗传通路

国家自然科学基金

0+阅读 · 2014年12月31日

基于多模态影像学研究Aβ沉积对AD神经功能网络连接的影响机制

国家自然科学基金

0+阅读 · 2014年12月31日

基于脑网络组的阿尔茨海默病早期脑功能代偿机制的研究

国家自然科学基金

0+阅读 · 2014年12月31日

新型统计模型在精神疾病的基因、脑影像和行为数据整合中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

Probability-Invariant Random Walk Learning on Gyral Folding-Based Cortical Similarity Networks for Alzheimer's and Lewy Body Dementia Diagnosis

Probability-Invariant Random Walk Learning on Gyral Folding-Based Cortical Similarity Networks for Alzheimer's and Lewy Body Dementia Diagnosis

Arxiv

0+阅读 · 2月19日

MRC-GAT: A Meta-Relational Copula-Based Graph Attention Network for Interpretable Multimodal Alzheimer's Disease Diagnosis

Arxiv

0+阅读 · 2月17日

Breaking Data Efficiency Dilemma: A Federated and Augmented Learning Framework For Alzheimer's Disease Detection via Speech

Arxiv

0+阅读 · 2月16日

Chain-of-Thought Reasoning with Large Language Models for Clinical Alzheimer's Disease Assessment and Diagnosis

Arxiv

0+阅读 · 2月15日

CNN and ViT Efficiency Study on Tiny ImageNet and DermaMNIST Datasets

Arxiv

0+阅读 · 2月13日

An Intuitionistic Fuzzy Logic Driven UNet architecture: Application to Brain Image segmentation

Arxiv

0+阅读 · 2月4日

LEAD: An EEG Foundation Model for Alzheimer's Disease Detection

Arxiv

0+阅读 · 2月1日

Learning Alzheimer's Disease Signatures by bridging EEG with Spiking Neural Networks and Biophysical Simulations

Arxiv

0+阅读 · 1月30日

Multimodal Visual Surrogate Compression for Alzheimer's Disease Classification

Arxiv

0+阅读 · 1月29日

Designing and Evaluating a Conversational Agent for Early Diagnosis of Alzheimer's Disease and Related Dementias

Arxiv

0+阅读 · 1月27日

VIP会员

文章信息

相关主题

阿尔茨海默病

最新内容

论文解读 | 医学图像修复中的扩散模型：挑战、分类与未来方向

论文解读 | 医学图像修复中的扩散模型：挑战、分类与未来方向

专知会员服务

0+阅读 · 16分钟前

博士论文 | 从算法到基础模型：强化学习的统一视角

博士论文 | 从算法到基础模型：强化学习的统一视角

专知会员服务

0+阅读 · 18分钟前

面向国防作战的最佳自主与蜂群无人机技术

面向国防作战的最佳自主与蜂群无人机技术

专知会员服务

3+阅读 · 今天8:04

《异构人类团队的协作决策过程混合建模研究》

《异构人类团队的协作决策过程混合建模研究》

专知会员服务

4+阅读 · 今天7:59

《C5ISR系统中的注意力动态与自适应决策支持研究：视觉与多模态注意力引导对任务绩效影响的递归量化分析》最新36页报告

《C5ISR系统中的注意力动态与自适应决策支持研究：视觉与多模态注意力引导对任务绩效影响的递归量化分析》最新36页报告

专知会员服务

4+阅读 · 今天7:56

《设计思维中的人机协作：生成式人工智能对共情访谈影响的探究》140页

《设计思维中的人机协作：生成式人工智能对共情访谈影响的探究》140页

专知会员服务

4+阅读 · 今天7:50

博士论文 | 面向大模型推理的内存高效算法

博士论文 | 面向大模型推理的内存高效算法

专知会员服务

4+阅读 · 7月27日

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

专知会员服务

5+阅读 · 7月27日

《无人系统互操作性导论——无人系统联合架构（JAUS）》

《无人系统互操作性导论——无人系统联合架构（JAUS）》

专知会员服务

13+阅读 · 7月27日

美空军新型反无人机部队初探

美空军新型反无人机部队初探

专知会员服务

7+阅读 · 7月27日

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

专知会员服务

7+阅读 · 7月27日

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

专知会员服务

5+阅读 · 7月27日

《防空交战流程的概率建模研究》

《防空交战流程的概率建模研究》

专知会员服务

11+阅读 · 7月27日

ICML 2026 教程 | 数值优化理论还重要吗？

ICML 2026 教程 | 数值优化理论还重要吗？

专知会员服务

7+阅读 · 7月26日

ICM 2026 | 陶哲轩：人工智能时代的数学

ICM 2026 | 陶哲轩：人工智能时代的数学

专知会员服务

10+阅读 · 7月26日

相关VIP内容

【博士论文】论视觉 Transformer (Vision Transformers) 中的归纳偏置

【博士论文】论视觉 Transformer (Vision Transformers) 中的归纳偏置

专知会员服务

9+阅读 · 2月13日

【TMI2022】C2FTrans:用于医学图像分割的从粗到细的Transformers

【TMI2022】C2FTrans:用于医学图像分割的从粗到细的Transformers

专知会员服务

24+阅读 · 2022年7月4日

阿联酋MBZ大学发布首篇《Transformers医学影像处理》综述论文，41页pdf阐述ViT在医学图像分割、检测、分类等应用

阿联酋MBZ大学发布首篇《Transformers医学影像处理》综述论文，41页pdf阐述ViT在医学图像分割、检测、分类等应用

专知会员服务

92+阅读 · 2022年1月25日

清华大学提出ACmix | 这才是Self-Attention与CNN正确的融合范式，性能速度全面提升

清华大学提出ACmix | 这才是Self-Attention与CNN正确的融合范式，性能速度全面提升

专知会员服务

27+阅读 · 2021年12月3日

中科院计算所最新「视觉Transformer」综述论文，带你全面了解最新CV分类、检测/分割方法

中科院计算所最新「视觉Transformer」综述论文，带你全面了解最新CV分类、检测/分割方法

专知会员服务

99+阅读 · 2021年11月16日

CNN/MLP/Transformer, 究竟谁行？中科大&微软实证三大网络结构公平比较，各有可取之处

专知会员服务

34+阅读 · 2021年9月18日

【上海交大】可解释CNN的对象分类，Interpretable CNNs for Object Classification

专知会员服务

54+阅读 · 2020年3月14日

【上海交通大学-张拳石】可解释CNN，Interpretable CNNs for Object Classification

【上海交通大学-张拳石】可解释CNN，Interpretable CNNs for Object Classification

专知会员服务

46+阅读 · 2020年3月13日

【论文】评估可扩展贝叶斯深度学习强大的计算机视觉的方法（Evaluating Scalable Bayesian Deep LearningMethods for Robust Computer Vision）

【论文】评估可扩展贝叶斯深度学习强大的计算机视觉的方法（Evaluating Scalable Bayesian Deep LearningMethods for Robust Computer Vision）

专知会员服务

12+阅读 · 2020年1月13日

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

19+阅读 · 2019年10月22日

热门VIP内容

开通专知VIP会员享更多权益服务

博士论文 | 从算法到基础模型：强化学习的统一视角

《异构人类团队的协作决策过程混合建模研究》

论文解读 | 医学图像修复中的扩散模型：挑战、分类与未来方向

面向国防作战的最佳自主与蜂群无人机技术

相关资讯

CVPR 2019 | 告别低分辨率网络，微软提出高分辨率深度神经网络HRNet

CVPR 2019 | 告别低分辨率网络，微软提出高分辨率深度神经网络HRNet

微软研究院AI头条

14+阅读 · 2019年5月21日

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

清华大学孙茂松课题组:《图神经网络: 方法与应用》综述论文，20页pdf

专知

49+阅读 · 2018年12月23日

【干货】李沐等人：CNN图像分类Trick合集（附详细代码）

【干货】李沐等人：CNN图像分类Trick合集（附详细代码）

GAN生成式对抗网络

58+阅读 · 2018年12月11日

李沐等人：CNN图像分类Trick合集（附详细代码）

李沐等人：CNN图像分类Trick合集（附详细代码）

专知

12+阅读 · 2018年12月11日

CNN五大经典模型:LeNet，AlexNet，GoogleNet，VGG，DRL

CNN五大经典模型:LeNet，AlexNet，GoogleNet，VGG，DRL

黑龙江大学自然语言处理实验室

14+阅读 · 2018年9月7日

关于CNN图像分类的一份综合设计指南

关于CNN图像分类的一份综合设计指南

云栖社区

11+阅读 · 2018年5月15日

H-Nets：让CNN的旋转等变性更加稳定

H-Nets：让CNN的旋转等变性更加稳定

论智

12+阅读 · 2018年4月18日

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

CVPR 2018 | 使用CNN生成图像先验，实现更广泛场景的盲图像去模糊

极市平台

14+阅读 · 2018年3月21日

【深度】Deep Visualization:可视化并理解CNN

【深度】Deep Visualization:可视化并理解CNN

专知

12+阅读 · 2017年9月30日

CNN、RNN在自动特征提取中的应用

CNN、RNN在自动特征提取中的应用

乌镇智库

14+阅读 · 2017年8月4日

相关论文

Probability-Invariant Random Walk Learning on Gyral Folding-Based Cortical Similarity Networks for Alzheimer's and Lewy Body Dementia Diagnosis

Probability-Invariant Random Walk Learning on Gyral Folding-Based Cortical Similarity Networks for Alzheimer's and Lewy Body Dementia Diagnosis

Arxiv

0+阅读 · 2月19日

MRC-GAT: A Meta-Relational Copula-Based Graph Attention Network for Interpretable Multimodal Alzheimer's Disease Diagnosis

Arxiv

0+阅读 · 2月17日

Breaking Data Efficiency Dilemma: A Federated and Augmented Learning Framework For Alzheimer's Disease Detection via Speech

Arxiv

0+阅读 · 2月16日

Chain-of-Thought Reasoning with Large Language Models for Clinical Alzheimer's Disease Assessment and Diagnosis

Arxiv

0+阅读 · 2月15日

CNN and ViT Efficiency Study on Tiny ImageNet and DermaMNIST Datasets

Arxiv

0+阅读 · 2月13日

An Intuitionistic Fuzzy Logic Driven UNet architecture: Application to Brain Image segmentation

Arxiv

0+阅读 · 2月4日

LEAD: An EEG Foundation Model for Alzheimer's Disease Detection

Arxiv

0+阅读 · 2月1日

Learning Alzheimer's Disease Signatures by bridging EEG with Spiking Neural Networks and Biophysical Simulations

Arxiv

0+阅读 · 1月30日

Multimodal Visual Surrogate Compression for Alzheimer's Disease Classification

Arxiv

0+阅读 · 1月29日

Designing and Evaluating a Conversational Agent for Early Diagnosis of Alzheimer's Disease and Related Dementias

Arxiv

0+阅读 · 1月27日

相关基金

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

基于微透析在线分析技术和代谢组学方法的人参远志配伍治疗阿尔茨海默病的药效物质基础和作用机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

人类视空间分类的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

用于阿尔茨海默症早期诊断的氟标小分子MRI成像用Aβ探针的研究

国家自然科学基金

0+阅读 · 2015年12月31日

阿尔茨海默病生物标志物的电化学发光成像分析

国家自然科学基金

0+阅读 · 2015年12月31日

早期阿尔茨海默病胼胝体与海马的时空特征研究

国家自然科学基金

0+阅读 · 2015年12月31日

分析基因组关联研究数据识别阿尔茨海默和帕金森疾病相关的风险位点和遗传通路

国家自然科学基金

0+阅读 · 2014年12月31日

基于多模态影像学研究Aβ沉积对AD神经功能网络连接的影响机制

国家自然科学基金

0+阅读 · 2014年12月31日

基于脑网络组的阿尔茨海默病早期脑功能代偿机制的研究

国家自然科学基金

0+阅读 · 2014年12月31日

新型统计模型在精神疾病的基因、脑影像和行为数据整合中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员