CAF-Mamba: Mamba-Based Cross-Modal Adaptive Attention Fusion for Multimodal Depression Detection - 专知论文

会员服务 ·

0

模态 · Mamba · 融合 · 跨模态 · 自适应 ·

CAF-Mamba: Mamba-Based Cross-Modal Adaptive Attention Fusion for Multimodal Depression Detection

翻译：CAF-Mamba：基于Mamba的跨模态自适应注意力融合用于多模态抑郁症检测

Bowen Zhou,Marc-André Fiedler,Ayoub Al-Hamadi

from arxiv, The paper contains a total of 5 pages and 3 figures. This paper has been accepted for publication in the proceedings of 2026 IEEE ICASSP Conference

Depression is a prevalent mental health disorder that severely impairs daily functioning and quality of life. While recent deep learning approaches for depression detection have shown promise, most rely on limited feature types, overlook explicit cross-modal interactions, and employ simple concatenation or static weighting for fusion. To overcome these limitations, we propose CAF-Mamba, a novel Mamba-based cross-modal adaptive attention fusion framework. CAF-Mamba not only captures cross-modal interactions explicitly and implicitly, but also dynamically adjusts modality contributions through a modality-wise attention mechanism, enabling more effective multimodal fusion. Experiments on two in-the-wild benchmark datasets, LMVD and D-Vlog, demonstrate that CAF-Mamba consistently outperforms existing methods and achieves state-of-the-art performance. Our code is available at https://github.com/zbw-zhou/CAF-Mamba.

翻译：抑郁症是一种普遍存在的心理健康障碍，严重损害日常功能和生活质量。尽管近期基于深度学习的抑郁症检测方法展现出潜力，但大多数方法依赖有限的特征类型，忽视了显式的跨模态交互，并采用简单的拼接或静态加权进行融合。为克服这些局限，我们提出了CAF-Mamba，一种新颖的基于Mamba的跨模态自适应注意力融合框架。CAF-Mamba不仅显式和隐式地捕捉跨模态交互，还通过模态级注意力机制动态调整各模态的贡献，从而实现更有效的多模态融合。在两个真实场景基准数据集LMVD和D-Vlog上的实验表明，CAF-Mamba持续优于现有方法，并取得了最先进的性能。我们的代码可在 https://github.com/zbw-zhou/CAF-Mamba 获取。

0

相关内容

MMA：多模态记忆智能体

MMA：多模态记忆智能体

专知会员服务

10+阅读 · 2月19日

TransMLA：多头潜在注意力（MLA）即为所需

TransMLA：多头潜在注意力（MLA）即为所需

专知会员服务

23+阅读 · 2025年2月13日

《图Mamba》最新综述，探索图学习中的状态空间模型

《图Mamba》最新综述，探索图学习中的状态空间模型

专知会员服务

31+阅读 · 2024年12月26日

《视觉中的Mamba：技术与应用》全面综述

《视觉中的Mamba：技术与应用》全面综述

专知会员服务

37+阅读 · 2024年10月7日

Mamba 架构在医学图像分析中的全面综述：分类、分割、重建及其他应用

Mamba 架构在医学图像分析中的全面综述：分类、分割、重建及其他应用

专知会员服务

29+阅读 · 2024年10月4日

《分布式部分可观察马尔科夫决策过程中机器智能体的分解信念》美国空军技术学院2022最新论文

《分布式部分可观察马尔科夫决策过程中机器智能体的分解信念》美国空军技术学院2022最新论文

专知会员服务

26+阅读 · 2022年10月18日

【Scientific Reports】《多中心影像诊断的联邦学习：心血管疾病的模拟研究》

【Scientific Reports】《多中心影像诊断的联邦学习：心血管疾病的模拟研究》

专知会员服务

20+阅读 · 2022年8月4日

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

专知会员服务

27+阅读 · 2022年3月22日

多模态情绪识别研究综述

多模态情绪识别研究综述

专知会员服务

170+阅读 · 2020年12月21日

【CIKM 2019论文】基于Motif注意力的图卷积网络（Graph Convolutional Networks with Motif-based Attention），John Boaz Lee，Ryan Rossi，孔祥南

【CIKM 2019论文】基于Motif注意力的图卷积网络（Graph Convolutional Networks with Motif-based Attention），John Boaz Lee，Ryan Rossi，孔祥南

专知会员服务

53+阅读 · 2019年11月20日

多模态情绪识别研究综述

多模态情绪识别研究综述

专知

25+阅读 · 2020年12月21日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

【论文笔记】具有深度注意力网络的协同Bundle（项目组合）推荐

【论文笔记】具有深度注意力网络的协同Bundle（项目组合）推荐

专知

11+阅读 · 2019年10月14日

MSRA开源基于注意力机制的全新推荐模型，融合用户长短期偏好

MSRA开源基于注意力机制的全新推荐模型，融合用户长短期偏好

AI前线

15+阅读 · 2019年9月22日

自适应注意力机制在Image Caption中的应用

自适应注意力机制在Image Caption中的应用

PaperWeekly

10+阅读 · 2018年5月10日

自然语言处理中的自注意力机制（Self-Attention Mechanism）

自然语言处理中的自注意力机制（Self-Attention Mechanism）

PaperWeekly

22+阅读 · 2018年3月28日

苦尽甘来：AI为更有效地治疗抑郁症带来希望

苦尽甘来：AI为更有效地治疗抑郁症带来希望

英伟达NVIDIA中国

10+阅读 · 2018年3月1日

【干货】基于注意力机制的神经匹配模型用于短文本检索

【干货】基于注意力机制的神经匹配模型用于短文本检索

专知

11+阅读 · 2018年1月11日

【AAAI 2018】多种注意力机制互补完成VQA（视觉问答），清华大学、香港中文大学等团队最新工作

【AAAI 2018】多种注意力机制互补完成VQA（视觉问答），清华大学、香港中文大学等团队最新工作

专知

22+阅读 · 2017年12月17日

深度学习中的注意力机制

深度学习中的注意力机制

人工智能头条

16+阅读 · 2017年11月2日

基于个体化定位的经颅磁刺激治疗抑郁症的疗效及脑机制研究

国家自然科学基金

0+阅读 · 2016年12月31日

mPFC神经环路中突触结构重塑与慢性应激大鼠抑郁样行为的关系研究

国家自然科学基金

0+阅读 · 2015年12月31日

抑郁症患者及一级亲属奖励与惩罚处理神经机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

精神分裂症的多尺度动态功能连接研究

国家自然科学基金

3+阅读 · 2015年12月31日

海马有髓神经纤维脱髓鞘在抑郁症中的作用

国家自然科学基金

0+阅读 · 2015年12月31日

应用多模态fMRI探讨交泰丸治疗抑郁症患者的脑机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

儿童期创伤与抑郁症发生的易感性和保护性神经网络机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

精细亚区尺度难治性抑郁症异常神经环路的多模态MRI解析

国家自然科学基金

0+阅读 · 2015年12月31日

Mir124介导柴胡疏肝散调控抑郁症肝郁证模型海马神经可塑性的分子机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

新型统计模型在精神疾病的基因、脑影像和行为数据整合中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

Adaptive Clinical-Aware Latent Diffusion for Multimodal Brain Image Generation and Missing Modality Imputation

Arxiv

0+阅读 · 3月10日

MedMASLab: A Unified Orchestration Framework for Benchmarking Multimodal Medical Multi-Agent Systems

Arxiv

0+阅读 · 3月10日

InterMind: Doctor-Patient-Family Interactive Depression Assessment Empowered by Large Language Models

Arxiv

0+阅读 · 3月9日

Physical Activity Trajectories Preceding Incident Major Depressive Disorder Diagnosis Using Consumer Wearable Devices in the All of Us Research Program: Case-Control Study

Physical Activity Trajectories Preceding Incident Major Depressive Disorder Diagnosis Using Consumer Wearable Devices in the All of Us Research Program: Case-Control Study

Arxiv

0+阅读 · 2月18日

Clinically Inspired Symptom-Guided Depression Detection from Emotion-Aware Speech Representations

Arxiv

0+阅读 · 2月17日

Finetuning Large Language Models for Automated Depression Screening in Nigerian Pidgin English: GENSCORE Pilot Study

Arxiv

0+阅读 · 2月13日

Tiny Recursive Reasoning with Mamba-2 Attention Hybrid

Arxiv

0+阅读 · 2月12日

LingxiDiagBench: A Multi-Agent Framework for Benchmarking LLMs in Chinese Psychiatric Consultation and Diagnosis

Arxiv

0+阅读 · 2月10日

MambaVF: State Space Model for Efficient Video Fusion

Arxiv

0+阅读 · 2月5日

Interactive Spatial-Frequency Fusion Mamba for Multi-Modal Image Fusion

Arxiv

0+阅读 · 2月4日

VIP会员

文章信息

相关主题

最新内容

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

专知会员服务

1+阅读 · 5月31日

比利时发布用于实时战场军事装备识别的离线人工智能系统

比利时发布用于实时战场军事装备识别的离线人工智能系统

专知会员服务

1+阅读 · 5月31日

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

专知会员服务

1+阅读 · 5月31日

超越网格：作战环境对炮兵的影响

超越网格：作战环境对炮兵的影响

专知会员服务

1+阅读 · 5月31日

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

专知会员服务

4+阅读 · 5月31日

综述 | 推理时控制：可信大语言模型的运行时治理全景

综述 | 推理时控制：可信大语言模型的运行时治理全景

专知会员服务

3+阅读 · 5月31日

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

4+阅读 · 5月30日

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

6+阅读 · 5月30日

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

4+阅读 · 5月30日

美以伊战争：首次人工智能战争——军事自主性困境

美以伊战争：首次人工智能战争——军事自主性困境

专知会员服务

5+阅读 · 5月30日

《Palantir任务保障性软件安全标准（MA-S2）》

《Palantir任务保障性软件安全标准（MA-S2）》

专知会员服务

15+阅读 · 5月30日

《美海军利用扩展现实增强知识流动研究》300页报告

《美海军利用扩展现实增强知识流动研究》300页报告

专知会员服务

8+阅读 · 5月30日

基于声学的无人机检测技术综述

基于声学的无人机检测技术综述

专知会员服务

8+阅读 · 5月30日

《当代混合战争分析框架：俄乌战争经验教训》

《当代混合战争分析框架：俄乌战争经验教训》

专知会员服务

9+阅读 · 5月30日

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

专知会员服务

13+阅读 · 5月29日

相关VIP内容

MMA：多模态记忆智能体

MMA：多模态记忆智能体

专知会员服务

10+阅读 · 2月19日

TransMLA：多头潜在注意力（MLA）即为所需

TransMLA：多头潜在注意力（MLA）即为所需

专知会员服务

23+阅读 · 2025年2月13日

《图Mamba》最新综述，探索图学习中的状态空间模型

《图Mamba》最新综述，探索图学习中的状态空间模型

专知会员服务

31+阅读 · 2024年12月26日

《视觉中的Mamba：技术与应用》全面综述

《视觉中的Mamba：技术与应用》全面综述

专知会员服务

37+阅读 · 2024年10月7日

Mamba 架构在医学图像分析中的全面综述：分类、分割、重建及其他应用

Mamba 架构在医学图像分析中的全面综述：分类、分割、重建及其他应用

专知会员服务

29+阅读 · 2024年10月4日

《分布式部分可观察马尔科夫决策过程中机器智能体的分解信念》美国空军技术学院2022最新论文

《分布式部分可观察马尔科夫决策过程中机器智能体的分解信念》美国空军技术学院2022最新论文

专知会员服务

26+阅读 · 2022年10月18日

【Scientific Reports】《多中心影像诊断的联邦学习：心血管疾病的模拟研究》

【Scientific Reports】《多中心影像诊断的联邦学习：心血管疾病的模拟研究》

专知会员服务

20+阅读 · 2022年8月4日

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

专知会员服务

27+阅读 · 2022年3月22日

多模态情绪识别研究综述

多模态情绪识别研究综述

专知会员服务

170+阅读 · 2020年12月21日

【CIKM 2019论文】基于Motif注意力的图卷积网络（Graph Convolutional Networks with Motif-based Attention），John Boaz Lee，Ryan Rossi，孔祥南

【CIKM 2019论文】基于Motif注意力的图卷积网络（Graph Convolutional Networks with Motif-based Attention），John Boaz Lee，Ryan Rossi，孔祥南

专知会员服务

53+阅读 · 2019年11月20日

热门VIP内容

开通专知VIP会员享更多权益服务

比利时发布用于实时战场军事装备识别的离线人工智能系统

超越网格：作战环境对炮兵的影响

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

相关资讯

多模态情绪识别研究综述

多模态情绪识别研究综述

专知

25+阅读 · 2020年12月21日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

【论文笔记】具有深度注意力网络的协同Bundle（项目组合）推荐

【论文笔记】具有深度注意力网络的协同Bundle（项目组合）推荐

专知

11+阅读 · 2019年10月14日

MSRA开源基于注意力机制的全新推荐模型，融合用户长短期偏好

MSRA开源基于注意力机制的全新推荐模型，融合用户长短期偏好

AI前线

15+阅读 · 2019年9月22日

自适应注意力机制在Image Caption中的应用

自适应注意力机制在Image Caption中的应用

PaperWeekly

10+阅读 · 2018年5月10日

自然语言处理中的自注意力机制（Self-Attention Mechanism）

自然语言处理中的自注意力机制（Self-Attention Mechanism）

PaperWeekly

22+阅读 · 2018年3月28日

苦尽甘来：AI为更有效地治疗抑郁症带来希望

苦尽甘来：AI为更有效地治疗抑郁症带来希望

英伟达NVIDIA中国

10+阅读 · 2018年3月1日

【干货】基于注意力机制的神经匹配模型用于短文本检索

【干货】基于注意力机制的神经匹配模型用于短文本检索

专知

11+阅读 · 2018年1月11日

【AAAI 2018】多种注意力机制互补完成VQA（视觉问答），清华大学、香港中文大学等团队最新工作

【AAAI 2018】多种注意力机制互补完成VQA（视觉问答），清华大学、香港中文大学等团队最新工作

专知

22+阅读 · 2017年12月17日

深度学习中的注意力机制

深度学习中的注意力机制

人工智能头条

16+阅读 · 2017年11月2日

相关论文

Adaptive Clinical-Aware Latent Diffusion for Multimodal Brain Image Generation and Missing Modality Imputation

Arxiv

0+阅读 · 3月10日

MedMASLab: A Unified Orchestration Framework for Benchmarking Multimodal Medical Multi-Agent Systems

Arxiv

0+阅读 · 3月10日

InterMind: Doctor-Patient-Family Interactive Depression Assessment Empowered by Large Language Models

Arxiv

0+阅读 · 3月9日

Physical Activity Trajectories Preceding Incident Major Depressive Disorder Diagnosis Using Consumer Wearable Devices in the All of Us Research Program: Case-Control Study

Physical Activity Trajectories Preceding Incident Major Depressive Disorder Diagnosis Using Consumer Wearable Devices in the All of Us Research Program: Case-Control Study

Arxiv

0+阅读 · 2月18日

Clinically Inspired Symptom-Guided Depression Detection from Emotion-Aware Speech Representations

Arxiv

0+阅读 · 2月17日

Finetuning Large Language Models for Automated Depression Screening in Nigerian Pidgin English: GENSCORE Pilot Study

Arxiv

0+阅读 · 2月13日

Tiny Recursive Reasoning with Mamba-2 Attention Hybrid

Arxiv

0+阅读 · 2月12日

LingxiDiagBench: A Multi-Agent Framework for Benchmarking LLMs in Chinese Psychiatric Consultation and Diagnosis

Arxiv

0+阅读 · 2月10日

MambaVF: State Space Model for Efficient Video Fusion

Arxiv

0+阅读 · 2月5日

Interactive Spatial-Frequency Fusion Mamba for Multi-Modal Image Fusion

Arxiv

0+阅读 · 2月4日

相关基金

基于个体化定位的经颅磁刺激治疗抑郁症的疗效及脑机制研究

国家自然科学基金

0+阅读 · 2016年12月31日

mPFC神经环路中突触结构重塑与慢性应激大鼠抑郁样行为的关系研究

国家自然科学基金

0+阅读 · 2015年12月31日

抑郁症患者及一级亲属奖励与惩罚处理神经机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

精神分裂症的多尺度动态功能连接研究

国家自然科学基金

3+阅读 · 2015年12月31日

海马有髓神经纤维脱髓鞘在抑郁症中的作用

国家自然科学基金

0+阅读 · 2015年12月31日

应用多模态fMRI探讨交泰丸治疗抑郁症患者的脑机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

儿童期创伤与抑郁症发生的易感性和保护性神经网络机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

精细亚区尺度难治性抑郁症异常神经环路的多模态MRI解析

国家自然科学基金

0+阅读 · 2015年12月31日

Mir124介导柴胡疏肝散调控抑郁症肝郁证模型海马神经可塑性的分子机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

新型统计模型在精神疾病的基因、脑影像和行为数据整合中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员