Multimodal Visual Surrogate Compression for Alzheimer's Disease Classification - 专知论文

会员服务 ·

0

视觉替代 · 阿尔茨海默病 · 提取 · 多模 · 模态 ·

Multimodal Visual Surrogate Compression for Alzheimer's Disease Classification

翻译：多模态视觉替代压缩用于阿尔茨海默病分类

Dexuan Ding,Ciyuan Peng,Endrowednes Kuantama,Jingcai Guo,Jia Wu,Jian Yang,Amin Beheshti,Ming-Hsuan Yang,Yuankai Qi

High-dimensional structural MRI (sMRI) images are widely used for Alzheimer's Disease (AD) diagnosis. Most existing methods for sMRI representation learning rely on 3D architectures (e.g., 3D CNNs), slice-wise feature extraction with late aggregation, or apply training-free feature extractions using 2D foundation models (e.g., DINO). However, these three paradigms suffer from high computational cost, loss of cross-slice relations, and limited ability to extract discriminative features, respectively. To address these challenges, we propose Multimodal Visual Surrogate Compression (MVSC). It learns to compress and adapt large 3D sMRI volumes into compact 2D features, termed as visual surrogates, which are better aligned with frozen 2D foundation models to extract powerful representations for final AD classification. MVSC has two key components: a Volume Context Encoder that captures global cross-slice context under textual guidance, and an Adaptive Slice Fusion module that aggregates slice-level information in a text-enhanced, patch-wise manner. Extensive experiments on three large-scale Alzheimer's disease benchmarks demonstrate our MVSC performs favourably on both binary and multi-class classification tasks compared against state-of-the-art methods.

翻译：高维结构磁共振成像（sMRI）图像被广泛用于阿尔茨海默病（AD）诊断。现有的大多数sMRI表征学习方法依赖于三维架构（如3D CNN）、采用后期聚合的切片级特征提取，或使用二维基础模型（如DINO）进行免训练特征提取。然而，这三种范式分别存在计算成本高、跨切片关系丢失以及提取判别性特征能力有限的问题。为应对这些挑战，我们提出了多模态视觉替代压缩（MVSC）方法。该方法学习将大型三维sMRI体积压缩并适配为紧凑的二维特征（称为视觉替代），这些特征能更好地与冻结的二维基础模型对齐，从而为最终的AD分类提取强表征。MVSC包含两个关键组件：在文本引导下捕获全局跨切片上下文的体积上下文编码器，以及以文本增强的块状方式聚合切片级信息的自适应切片融合模块。在三个大规模阿尔茨海默病基准数据集上的大量实验表明，与最先进方法相比，我们的MVSC在二分类和多分类任务上均表现出优越性能。

0

相关内容

视觉替代

【牛津博士论文】面向神经影像应用的可扩展且可解释的空间模型

【牛津博士论文】面向神经影像应用的可扩展且可解释的空间模型

专知会员服务

14+阅读 · 2025年8月3日

【CVPR2025】通过高效提示与偏好优化增强SAM，实现半监督医学图像分割

【CVPR2025】通过高效提示与偏好优化增强SAM，实现半监督医学图像分割

专知会员服务

11+阅读 · 2025年3月8日

【ETHZ博士论文】利用多模态数据在计算机视觉中的应用，涉及超分辨率和分类

【ETHZ博士论文】利用多模态数据在计算机视觉中的应用，涉及超分辨率和分类

专知会员服务

42+阅读 · 2023年11月16日

《用于视网膜形态学和功能评估的多模态-多功能图像融合》美空军24页报告

《用于视网膜形态学和功能评估的多模态-多功能图像融合》美空军24页报告

专知会员服务

25+阅读 · 2023年4月2日

U-Net如何用在医学图像分割？德国亚琛工大等最新《医学图像分割》综述，详述六大类100多个算法

U-Net如何用在医学图像分割？德国亚琛工大等最新《医学图像分割》综述，详述六大类100多个算法

专知会员服务

52+阅读 · 2022年11月29日

视觉Transformer预训练模型的胸腔X线影像多标签分类

视觉Transformer预训练模型的胸腔X线影像多标签分类

专知会员服务

14+阅读 · 2022年7月29日

《人工智能在医学影像中复杂视觉模式的检测、定性和分类中的应用：关于肺部和神经影像中的应用》哥大2022最新博士论文

《人工智能在医学影像中复杂视觉模式的检测、定性和分类中的应用：关于肺部和神经影像中的应用》哥大2022最新博士论文

专知会员服务

32+阅读 · 2022年5月16日

瑞典皇家理工学院2022博士论文《从MRI图像分析和表征大脑形态的方法》

瑞典皇家理工学院2022博士论文《从MRI图像分析和表征大脑形态的方法》

专知会员服务

14+阅读 · 2022年4月18日

使用图卷积网络对多药副作用进行建模（Modeling polypharmacy side effects with graph convolutional networks）

使用图卷积网络对多药副作用进行建模（Modeling polypharmacy side effects with graph convolutional networks）

专知会员服务

36+阅读 · 2019年12月12日

【英国帝国理工学院】心脏图像分割的深度学习:综述，47页pdf，Deep learning for cardiac image segmentation: A review

【英国帝国理工学院】心脏图像分割的深度学习:综述，47页pdf，Deep learning for cardiac image segmentation: A review

专知会员服务

56+阅读 · 2019年11月14日

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

专知

14+阅读 · 2022年5月31日

基于深度学习的医学图像半监督分割

基于深度学习的医学图像半监督分割

CVer

14+阅读 · 2020年9月24日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

专家报告|深度学习+图像多模态融合

专家报告|深度学习+图像多模态融合

中国图象图形学报

12+阅读 · 2019年10月23日

基于关系网络的视觉建模：有望替代卷积神经网络

基于关系网络的视觉建模：有望替代卷积神经网络

微软研究院AI头条

10+阅读 · 2019年7月12日

计算机视觉方向简介 | 基于自然语言的跨模态行人re-id的SOTA方法（上）

计算机视觉方向简介 | 基于自然语言的跨模态行人re-id的SOTA方法（上）

计算机视觉life

12+阅读 · 2019年6月29日

【论文推荐】最新六篇视觉问答相关论文—深度嵌入学习、句子表征学习、深度特征聚合、3D匹配、细粒度文本摘要

【论文推荐】最新六篇视觉问答相关论文—深度嵌入学习、句子表征学习、深度特征聚合、3D匹配、细粒度文本摘要

专知

12+阅读 · 2018年6月9日

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

全球人工智能

12+阅读 · 2017年12月3日

【前沿】自动从CT医疗影像中生成诊断报告，卡内基梅隆大学CMU邢波教授团队最新基于深度学习的医疗影像研究成果

【前沿】自动从CT医疗影像中生成诊断报告，卡内基梅隆大学CMU邢波教授团队最新基于深度学习的医疗影像研究成果

专知

18+阅读 · 2017年11月24日

学界 | 深度学习在单图像超分辨率上的应用：SRCNN、Perceptual loss、SRResNet

学界 | 深度学习在单图像超分辨率上的应用：SRCNN、Perceptual loss、SRResNet

机器之心

12+阅读 · 2017年11月7日

人类视空间分类的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

人口老龄化背景下阿尔茨海默病患者卫生服务利用与经济保护模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

用于阿尔茨海默症早期诊断的氟标小分子MRI成像用Aβ探针的研究

国家自然科学基金

0+阅读 · 2015年12月31日

拉莫三嗪抑制阿尔茨海默病病理进展的作用及机制研究

国家自然科学基金

1+阅读 · 2015年12月31日

APOE基因多态性对阿尔茨海默病中特化促消退介质的影响

国家自然科学基金

0+阅读 · 2015年12月31日

阿尔茨海默病生物标志物的电化学发光成像分析

国家自然科学基金

0+阅读 · 2015年12月31日

早期阿尔茨海默病胼胝体与海马的时空特征研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多模态影像学研究Aβ沉积对AD神经功能网络连接的影响机制

国家自然科学基金

0+阅读 · 2014年12月31日

基于脑网络组的阿尔茨海默病早期脑功能代偿机制的研究

国家自然科学基金

0+阅读 · 2014年12月31日

骨髓基质神经干细胞联合法舒地尔多视角治疗AD的探索

国家自然科学基金

0+阅读 · 2014年12月31日

MRC-GAT: A Meta-Relational Copula-Based Graph Attention Network for Interpretable Multimodal Alzheimer's Disease Diagnosis

Arxiv

0+阅读 · 2月17日

Chain-of-Thought Reasoning with Large Language Models for Clinical Alzheimer's Disease Assessment and Diagnosis

Arxiv

0+阅读 · 2月15日

Generative Latent Representations of 3D Brain MRI for Multi-Task Downstream Analysis in Down Syndrome

Arxiv

0+阅读 · 2月14日

HMSViT: A Hierarchical Masked Self-Supervised Vision Transformer for Corneal Nerve Segmentation and Diabetic Neuropathy Diagnosis

Arxiv

0+阅读 · 2月14日

Multimodal LLM With Hierarchical Mixture-of-Experts for VQA on 3D Brain MRI

Arxiv

0+阅读 · 2月12日

LEAD: An EEG Foundation Model for Alzheimer's Disease Detection

Arxiv

0+阅读 · 2月1日

Learning Alzheimer's Disease Signatures by bridging EEG with Spiking Neural Networks and Biophysical Simulations

Arxiv

0+阅读 · 1月30日

Efficient Complex-Valued Vision Transformers for MRI Classification Directly from k-Space

Arxiv

0+阅读 · 1月26日

A multimodal vision foundation model for generalizable knee pathology

Arxiv

0+阅读 · 1月26日

A Computer Vision Hybrid Approach: CNN and Transformer Models for Accurate Alzheimer's Detection from Brain MRI Scans

Arxiv

0+阅读 · 1月21日

VIP会员

文章信息

相关主题

阿尔茨海默病

最新内容

美军条令《海军陆战队规划流程（2026版）》

美军条令《海军陆战队规划流程（2026版）》

专知会员服务

2+阅读 · 38分钟前

《压缩式分布式交互仿真标准》120页

《压缩式分布式交互仿真标准》120页

专知会员服务

3+阅读 · 53分钟前

《电子战数据交换模型研究报告》

《电子战数据交换模型研究报告》

专知会员服务

2+阅读 · 今天3:13

美军运用水下无人机与机器人系统竞速清除霍尔木兹海峡水雷

美军运用水下无人机与机器人系统竞速清除霍尔木兹海峡水雷

专知会员服务

4+阅读 · 今天2:55

《基于Transformer的异常舰船导航识别与跟踪》80页

《基于Transformer的异常舰船导航识别与跟踪》80页

专知会员服务

4+阅读 · 今天2:45

《美国太空系统司令部实验室原型作战管理系统的数据与决策可追溯性》

《美国太空系统司令部实验室原型作战管理系统的数据与决策可追溯性》

专知会员服务

4+阅读 · 今天2:41

《低数据领域军事目标检测模型研究》

《低数据领域军事目标检测模型研究》

专知会员服务

3+阅读 · 今天2:37

《为韧性而设计：在战略不确定时代提升军事空军基地的生存能力》

《为韧性而设计：在战略不确定时代提升军事空军基地的生存能力》

专知会员服务

4+阅读 · 今天2:32

【CMU博士论文】物理世界的视觉感知与深度理解

【CMU博士论文】物理世界的视觉感知与深度理解

专知会员服务

5+阅读 · 4月22日

多智能体系统：从经典范式到大基础模型驱动的未来

多智能体系统：从经典范式到大基础模型驱动的未来

专知会员服务

9+阅读 · 4月22日

伊朗战争停火期间美军关键弹药状况分析

伊朗战争停火期间美军关键弹药状况分析

专知会员服务

8+阅读 · 4月22日

电子战革命：塑造战场的十年突破（2015–2025）

电子战革命：塑造战场的十年突破（2015–2025）

专知会员服务

6+阅读 · 4月22日

人工智能赋能电子战解决方案：实现电磁优势的认知方法（万字长文）

人工智能赋能电子战解决方案：实现电磁优势的认知方法（万字长文）

专知会员服务

9+阅读 · 4月22日

《基于模型的系统工程框架及其在电子战系统中的应用》

《基于模型的系统工程框架及其在电子战系统中的应用》

专知会员服务

7+阅读 · 4月22日

人工智能即服务与未来战争（印度视角）

人工智能即服务与未来战争（印度视角）

专知会员服务

5+阅读 · 4月22日

相关VIP内容

【牛津博士论文】面向神经影像应用的可扩展且可解释的空间模型

【牛津博士论文】面向神经影像应用的可扩展且可解释的空间模型

专知会员服务

14+阅读 · 2025年8月3日

【CVPR2025】通过高效提示与偏好优化增强SAM，实现半监督医学图像分割

【CVPR2025】通过高效提示与偏好优化增强SAM，实现半监督医学图像分割

专知会员服务

11+阅读 · 2025年3月8日

【ETHZ博士论文】利用多模态数据在计算机视觉中的应用，涉及超分辨率和分类

【ETHZ博士论文】利用多模态数据在计算机视觉中的应用，涉及超分辨率和分类

专知会员服务

42+阅读 · 2023年11月16日

《用于视网膜形态学和功能评估的多模态-多功能图像融合》美空军24页报告

《用于视网膜形态学和功能评估的多模态-多功能图像融合》美空军24页报告

专知会员服务

25+阅读 · 2023年4月2日

U-Net如何用在医学图像分割？德国亚琛工大等最新《医学图像分割》综述，详述六大类100多个算法

U-Net如何用在医学图像分割？德国亚琛工大等最新《医学图像分割》综述，详述六大类100多个算法

专知会员服务

52+阅读 · 2022年11月29日

视觉Transformer预训练模型的胸腔X线影像多标签分类

视觉Transformer预训练模型的胸腔X线影像多标签分类

专知会员服务

14+阅读 · 2022年7月29日

《人工智能在医学影像中复杂视觉模式的检测、定性和分类中的应用：关于肺部和神经影像中的应用》哥大2022最新博士论文

《人工智能在医学影像中复杂视觉模式的检测、定性和分类中的应用：关于肺部和神经影像中的应用》哥大2022最新博士论文

专知会员服务

32+阅读 · 2022年5月16日

瑞典皇家理工学院2022博士论文《从MRI图像分析和表征大脑形态的方法》

瑞典皇家理工学院2022博士论文《从MRI图像分析和表征大脑形态的方法》

专知会员服务

14+阅读 · 2022年4月18日

使用图卷积网络对多药副作用进行建模（Modeling polypharmacy side effects with graph convolutional networks）

使用图卷积网络对多药副作用进行建模（Modeling polypharmacy side effects with graph convolutional networks）

专知会员服务

36+阅读 · 2019年12月12日

【英国帝国理工学院】心脏图像分割的深度学习:综述，47页pdf，Deep learning for cardiac image segmentation: A review

【英国帝国理工学院】心脏图像分割的深度学习:综述，47页pdf，Deep learning for cardiac image segmentation: A review

专知会员服务

56+阅读 · 2019年11月14日

热门VIP内容

开通专知VIP会员享更多权益服务

《压缩式分布式交互仿真标准》120页

美军运用水下无人机与机器人系统竞速清除霍尔木兹海峡水雷

美军条令《海军陆战队规划流程（2026版）》

《电子战数据交换模型研究报告》

相关资讯

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

【AI+医学】多模态深度学习在生物医学数据融合中的应用研究进展，瑞典舍午德大学

专知

14+阅读 · 2022年5月31日

基于深度学习的医学图像半监督分割

基于深度学习的医学图像半监督分割

CVer

14+阅读 · 2020年9月24日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

专家报告|深度学习+图像多模态融合

专家报告|深度学习+图像多模态融合

中国图象图形学报

12+阅读 · 2019年10月23日

基于关系网络的视觉建模：有望替代卷积神经网络

基于关系网络的视觉建模：有望替代卷积神经网络

微软研究院AI头条

10+阅读 · 2019年7月12日

计算机视觉方向简介 | 基于自然语言的跨模态行人re-id的SOTA方法（上）

计算机视觉方向简介 | 基于自然语言的跨模态行人re-id的SOTA方法（上）

计算机视觉life

12+阅读 · 2019年6月29日

【论文推荐】最新六篇视觉问答相关论文—深度嵌入学习、句子表征学习、深度特征聚合、3D匹配、细粒度文本摘要

【论文推荐】最新六篇视觉问答相关论文—深度嵌入学习、句子表征学习、深度特征聚合、3D匹配、细粒度文本摘要

专知

12+阅读 · 2018年6月9日

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

全球人工智能

12+阅读 · 2017年12月3日

【前沿】自动从CT医疗影像中生成诊断报告，卡内基梅隆大学CMU邢波教授团队最新基于深度学习的医疗影像研究成果

【前沿】自动从CT医疗影像中生成诊断报告，卡内基梅隆大学CMU邢波教授团队最新基于深度学习的医疗影像研究成果

专知

18+阅读 · 2017年11月24日

学界 | 深度学习在单图像超分辨率上的应用：SRCNN、Perceptual loss、SRResNet

学界 | 深度学习在单图像超分辨率上的应用：SRCNN、Perceptual loss、SRResNet

机器之心

12+阅读 · 2017年11月7日

相关论文

MRC-GAT: A Meta-Relational Copula-Based Graph Attention Network for Interpretable Multimodal Alzheimer's Disease Diagnosis

Arxiv

0+阅读 · 2月17日

Chain-of-Thought Reasoning with Large Language Models for Clinical Alzheimer's Disease Assessment and Diagnosis

Arxiv

0+阅读 · 2月15日

Generative Latent Representations of 3D Brain MRI for Multi-Task Downstream Analysis in Down Syndrome

Arxiv

0+阅读 · 2月14日

HMSViT: A Hierarchical Masked Self-Supervised Vision Transformer for Corneal Nerve Segmentation and Diabetic Neuropathy Diagnosis

Arxiv

0+阅读 · 2月14日

Multimodal LLM With Hierarchical Mixture-of-Experts for VQA on 3D Brain MRI

Arxiv

0+阅读 · 2月12日

LEAD: An EEG Foundation Model for Alzheimer's Disease Detection

Arxiv

0+阅读 · 2月1日

Learning Alzheimer's Disease Signatures by bridging EEG with Spiking Neural Networks and Biophysical Simulations

Arxiv

0+阅读 · 1月30日

Efficient Complex-Valued Vision Transformers for MRI Classification Directly from k-Space

Arxiv

0+阅读 · 1月26日

A multimodal vision foundation model for generalizable knee pathology

Arxiv

0+阅读 · 1月26日

A Computer Vision Hybrid Approach: CNN and Transformer Models for Accurate Alzheimer's Detection from Brain MRI Scans

Arxiv

0+阅读 · 1月21日

相关基金

人类视空间分类的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

人口老龄化背景下阿尔茨海默病患者卫生服务利用与经济保护模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

用于阿尔茨海默症早期诊断的氟标小分子MRI成像用Aβ探针的研究

国家自然科学基金

0+阅读 · 2015年12月31日

拉莫三嗪抑制阿尔茨海默病病理进展的作用及机制研究

国家自然科学基金

1+阅读 · 2015年12月31日

APOE基因多态性对阿尔茨海默病中特化促消退介质的影响

国家自然科学基金

0+阅读 · 2015年12月31日

阿尔茨海默病生物标志物的电化学发光成像分析

国家自然科学基金

0+阅读 · 2015年12月31日

早期阿尔茨海默病胼胝体与海马的时空特征研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多模态影像学研究Aβ沉积对AD神经功能网络连接的影响机制

国家自然科学基金

0+阅读 · 2014年12月31日

基于脑网络组的阿尔茨海默病早期脑功能代偿机制的研究

国家自然科学基金

0+阅读 · 2014年12月31日

骨髓基质神经干细胞联合法舒地尔多视角治疗AD的探索

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员