CAF-Mamba: Mamba-Based Cross-Modal Adaptive Attention Fusion for Multimodal Depression Detection - 专知论文

会员服务 ·

0

模态 · Mamba · 融合 · 跨模态 · 自适应 ·

CAF-Mamba: Mamba-Based Cross-Modal Adaptive Attention Fusion for Multimodal Depression Detection

翻译：CAF-Mamba：基于Mamba的跨模态自适应注意力融合用于多模态抑郁症检测

Bowen Zhou,Marc-André Fiedler,Ayoub Al-Hamadi

from arxiv, The paper contains a total of 5 pages and 3 figures. This paper has been accepted for publication in the proceedings of 2026 IEEE ICASSP Conference

Depression is a prevalent mental health disorder that severely impairs daily functioning and quality of life. While recent deep learning approaches for depression detection have shown promise, most rely on limited feature types, overlook explicit cross-modal interactions, and employ simple concatenation or static weighting for fusion. To overcome these limitations, we propose CAF-Mamba, a novel Mamba-based cross-modal adaptive attention fusion framework. CAF-Mamba not only captures cross-modal interactions explicitly and implicitly, but also dynamically adjusts modality contributions through a modality-wise attention mechanism, enabling more effective multimodal fusion. Experiments on two in-the-wild benchmark datasets, LMVD and D-Vlog, demonstrate that CAF-Mamba consistently outperforms existing methods and achieves state-of-the-art performance.

翻译：抑郁症是一种普遍的精神健康障碍，严重损害日常功能和生活质量。尽管近期用于抑郁症检测的深度学习方法显示出潜力，但大多数方法依赖于有限的模态特征类型，忽视了显式的跨模态交互，并采用简单的拼接或静态加权进行融合。为克服这些局限，我们提出了CAF-Mamba，一种新颖的基于Mamba的跨模态自适应注意力融合框架。CAF-Mamba不仅显式和隐式地捕获跨模态交互，还通过模态级注意力机制动态调整各模态的贡献，从而实现更有效的多模态融合。在两个真实场景基准数据集LMVD和D-Vlog上的实验表明，CAF-Mamba持续优于现有方法，并取得了最先进的性能。

0

相关内容

MMA：多模态记忆智能体

MMA：多模态记忆智能体

专知会员服务

10+阅读 · 2月19日

【博士论文】弥合多模态基础模型与世界模型之间的鸿沟

【博士论文】弥合多模态基础模型与世界模型之间的鸿沟

专知会员服务

32+阅读 · 2025年10月9日

TransMLA：多头潜在注意力（MLA）即为所需

TransMLA：多头潜在注意力（MLA）即为所需

专知会员服务

23+阅读 · 2025年2月13日

《图Mamba》最新综述，探索图学习中的状态空间模型

《图Mamba》最新综述，探索图学习中的状态空间模型

专知会员服务

31+阅读 · 2024年12月26日

Mamba 架构在医学图像分析中的全面综述：分类、分割、重建及其他应用

Mamba 架构在医学图像分析中的全面综述：分类、分割、重建及其他应用

专知会员服务

29+阅读 · 2024年10月4日

【斯坦福博士论文】多维神经影像分析，194页pdf

【斯坦福博士论文】多维神经影像分析，194页pdf

专知会员服务

22+阅读 · 2024年6月21日

【Scientific Reports】《多中心影像诊断的联邦学习：心血管疾病的模拟研究》

【Scientific Reports】《多中心影像诊断的联邦学习：心血管疾病的模拟研究》

专知会员服务

20+阅读 · 2022年8月4日

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

专知会员服务

27+阅读 · 2022年3月22日

多模态情绪识别研究综述

多模态情绪识别研究综述

专知会员服务

170+阅读 · 2020年12月21日

【CIKM 2019论文】基于Motif注意力的图卷积网络（Graph Convolutional Networks with Motif-based Attention），John Boaz Lee，Ryan Rossi，孔祥南

【CIKM 2019论文】基于Motif注意力的图卷积网络（Graph Convolutional Networks with Motif-based Attention），John Boaz Lee，Ryan Rossi，孔祥南

专知会员服务

53+阅读 · 2019年11月20日

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

专知

10+阅读 · 2023年4月6日

多模态情绪识别研究综述

多模态情绪识别研究综述

专知

25+阅读 · 2020年12月21日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

【论文笔记】具有深度注意力网络的协同Bundle（项目组合）推荐

【论文笔记】具有深度注意力网络的协同Bundle（项目组合）推荐

专知

11+阅读 · 2019年10月14日

自适应注意力机制在Image Caption中的应用

自适应注意力机制在Image Caption中的应用

PaperWeekly

10+阅读 · 2018年5月10日

自然语言处理中的自注意力机制（Self-Attention Mechanism）

自然语言处理中的自注意力机制（Self-Attention Mechanism）

PaperWeekly

22+阅读 · 2018年3月28日

苦尽甘来：AI为更有效地治疗抑郁症带来希望

苦尽甘来：AI为更有效地治疗抑郁症带来希望

英伟达NVIDIA中国

10+阅读 · 2018年3月1日

【干货】基于注意力机制的神经匹配模型用于短文本检索

【干货】基于注意力机制的神经匹配模型用于短文本检索

专知

11+阅读 · 2018年1月11日

【AAAI 2018】多种注意力机制互补完成VQA（视觉问答），清华大学、香港中文大学等团队最新工作

【AAAI 2018】多种注意力机制互补完成VQA（视觉问答），清华大学、香港中文大学等团队最新工作

专知

22+阅读 · 2017年12月17日

深度学习中的注意力机制

深度学习中的注意力机制

CSDN大数据

24+阅读 · 2017年11月2日

基于个体化定位的经颅磁刺激治疗抑郁症的疗效及脑机制研究

国家自然科学基金

0+阅读 · 2016年12月31日

mPFC神经环路中突触结构重塑与慢性应激大鼠抑郁样行为的关系研究

国家自然科学基金

0+阅读 · 2015年12月31日

抑郁症患者及一级亲属奖励与惩罚处理神经机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

精神分裂症的多尺度动态功能连接研究

国家自然科学基金

3+阅读 · 2015年12月31日

海马有髓神经纤维脱髓鞘在抑郁症中的作用

国家自然科学基金

0+阅读 · 2015年12月31日

应用多模态fMRI探讨交泰丸治疗抑郁症患者的脑机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

儿童期创伤与抑郁症发生的易感性和保护性神经网络机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

精细亚区尺度难治性抑郁症异常神经环路的多模态MRI解析

国家自然科学基金

0+阅读 · 2015年12月31日

Mir124介导柴胡疏肝散调控抑郁症肝郁证模型海马神经可塑性的分子机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

新型统计模型在精神疾病的基因、脑影像和行为数据整合中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

Clinically Inspired Symptom-Guided Depression Detection from Emotion-Aware Speech Representations

Arxiv

0+阅读 · 2月17日

MambaVF: State Space Model for Efficient Video Fusion

Arxiv

0+阅读 · 2月5日

Interactive Spatial-Frequency Fusion Mamba for Multi-Modal Image Fusion

Arxiv

0+阅读 · 2月4日

MHDash: An Online Platform for Benchmarking Mental Health-Aware AI Assistants

Arxiv

0+阅读 · 1月30日

HADUA: Hierarchical Attention and Dynamic Uniform Alignment for Robust Cross-Subject Emotion Recognition

Arxiv

0+阅读 · 1月29日

A Non-Invasive 3D Gait Analysis Framework for Quantifying Psychomotor Retardation in Major Depressive Disorder

Arxiv

0+阅读 · 1月27日

Unified Cross-Modal Attention-Mixer Based Structural-Functional Connectomics Fusion for Neuropsychiatric Disorder Diagnosis

Arxiv

0+阅读 · 1月25日

MambAttention: Mamba with Multi-Head Attention for Generalizable Single-Channel Speech Enhancement

Arxiv

0+阅读 · 1月21日

READ-Net: Clarifying Emotional Ambiguity via Adaptive Feature Recalibration for Audio-Visual Depression Detection

Arxiv

0+阅读 · 1月21日

Multimodal Emotion Recognition using Audio-Video Transformer Fusion with Cross Attention

Arxiv

0+阅读 · 1月20日

VIP会员

文章信息

相关主题

最新内容

何为下一代指挥与控制？美陆军选择第四步兵师进行快速原型NGC2开发

何为下一代指挥与控制？美陆军选择第四步兵师进行快速原型NGC2开发

专知会员服务

0+阅读 · 45分钟前

《低成本自杀式无人机战争的军事战略影响：以乌克兰和伊朗为案例研究》

《低成本自杀式无人机战争的军事战略影响：以乌克兰和伊朗为案例研究》

专知会员服务

0+阅读 · 今天9:11

深入Maven智能系统：Palantir基于Claude打造的军事大脑

深入Maven智能系统：Palantir基于Claude打造的军事大脑

专知会员服务

4+阅读 · 今天8:18

“Maven计划”的发展演变之“Maven智能系统”应用

“Maven计划”的发展演变之“Maven智能系统”应用

专知会员服务

2+阅读 · 今天8:03

伊朗的无人机蜂群策略如何挑战美国防御系统：人工智能驱动的无人机战争与现代冲突的转型

伊朗的无人机蜂群策略如何挑战美国防御系统：人工智能驱动的无人机战争与现代冲突的转型

专知会员服务

4+阅读 · 今天7:39

《将小型无人机系统与巡飞弹集成至连及以下级别战术机动》（美陆军最新报告中文版）

《将小型无人机系统与巡飞弹集成至连及以下级别战术机动》（美陆军最新报告中文版）

专知会员服务

2+阅读 · 今天6:58

加拿大国防部发布项目需求：用于高级态势决策的多模态人工智能

加拿大国防部发布项目需求：用于高级态势决策的多模态人工智能

专知会员服务

3+阅读 · 今天6:54

《无人机革命：来自俄乌战场的启示》（报告）

《无人机革命：来自俄乌战场的启示》（报告）

专知会员服务

4+阅读 · 今天6:48

《实现联合作战能力所需的技术》58页报告

《实现联合作战能力所需的技术》58页报告

专知会员服务

2+阅读 · 今天6:30

《算法化目标定位：人工智能在以色列加沙打击行动中的作用及其伦理影响》（中文版）

《算法化目标定位：人工智能在以色列加沙打击行动中的作用及其伦理影响》（中文版）

专知会员服务

4+阅读 · 今天6:22

以色列运用人工智能优化空袭警报系统

以色列运用人工智能优化空袭警报系统

专知会员服务

3+阅读 · 今天6:20

以色列在多条战线部署AI智能体

以色列在多条战线部署AI智能体

专知会员服务

4+阅读 · 今天6:12

《将形式化方法工具应用于电子战代码库（经验报告）》

《将形式化方法工具应用于电子战代码库（经验报告）》

专知会员服务

3+阅读 · 今天6:09

2025年大语言模型进展报告

2025年大语言模型进展报告

专知会员服务

18+阅读 · 4月25日

多智能体协作机制

多智能体协作机制

专知会员服务

15+阅读 · 4月25日

相关VIP内容

MMA：多模态记忆智能体

MMA：多模态记忆智能体

专知会员服务

10+阅读 · 2月19日

【博士论文】弥合多模态基础模型与世界模型之间的鸿沟

【博士论文】弥合多模态基础模型与世界模型之间的鸿沟

专知会员服务

32+阅读 · 2025年10月9日

TransMLA：多头潜在注意力（MLA）即为所需

TransMLA：多头潜在注意力（MLA）即为所需

专知会员服务

23+阅读 · 2025年2月13日

《图Mamba》最新综述，探索图学习中的状态空间模型

《图Mamba》最新综述，探索图学习中的状态空间模型

专知会员服务

31+阅读 · 2024年12月26日

Mamba 架构在医学图像分析中的全面综述：分类、分割、重建及其他应用

Mamba 架构在医学图像分析中的全面综述：分类、分割、重建及其他应用

专知会员服务

29+阅读 · 2024年10月4日

【斯坦福博士论文】多维神经影像分析，194页pdf

【斯坦福博士论文】多维神经影像分析，194页pdf

专知会员服务

22+阅读 · 2024年6月21日

【Scientific Reports】《多中心影像诊断的联邦学习：心血管疾病的模拟研究》

【Scientific Reports】《多中心影像诊断的联邦学习：心血管疾病的模拟研究》

专知会员服务

20+阅读 · 2022年8月4日

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

【TPAMI2022】关联关系驱动的多模态分类，AF: An Association-based Fusion Method for Multi-Modal Classification

专知会员服务

27+阅读 · 2022年3月22日

多模态情绪识别研究综述

多模态情绪识别研究综述

专知会员服务

170+阅读 · 2020年12月21日

【CIKM 2019论文】基于Motif注意力的图卷积网络（Graph Convolutional Networks with Motif-based Attention），John Boaz Lee，Ryan Rossi，孔祥南

【CIKM 2019论文】基于Motif注意力的图卷积网络（Graph Convolutional Networks with Motif-based Attention），John Boaz Lee，Ryan Rossi，孔祥南

专知会员服务

53+阅读 · 2019年11月20日

热门VIP内容

开通专知VIP会员享更多权益服务

《低成本自杀式无人机战争的军事战略影响：以乌克兰和伊朗为案例研究》

“Maven计划”的发展演变之“Maven智能系统”应用

何为下一代指挥与控制？美陆军选择第四步兵师进行快速原型NGC2开发

深入Maven智能系统：Palantir基于Claude打造的军事大脑

相关资讯

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

专知

10+阅读 · 2023年4月6日

多模态情绪识别研究综述

多模态情绪识别研究综述

专知

25+阅读 · 2020年12月21日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

【论文笔记】具有深度注意力网络的协同Bundle（项目组合）推荐

【论文笔记】具有深度注意力网络的协同Bundle（项目组合）推荐

专知

11+阅读 · 2019年10月14日

自适应注意力机制在Image Caption中的应用

自适应注意力机制在Image Caption中的应用

PaperWeekly

10+阅读 · 2018年5月10日

自然语言处理中的自注意力机制（Self-Attention Mechanism）

自然语言处理中的自注意力机制（Self-Attention Mechanism）

PaperWeekly

22+阅读 · 2018年3月28日

苦尽甘来：AI为更有效地治疗抑郁症带来希望

苦尽甘来：AI为更有效地治疗抑郁症带来希望

英伟达NVIDIA中国

10+阅读 · 2018年3月1日

【干货】基于注意力机制的神经匹配模型用于短文本检索

【干货】基于注意力机制的神经匹配模型用于短文本检索

专知

11+阅读 · 2018年1月11日

【AAAI 2018】多种注意力机制互补完成VQA（视觉问答），清华大学、香港中文大学等团队最新工作

【AAAI 2018】多种注意力机制互补完成VQA（视觉问答），清华大学、香港中文大学等团队最新工作

专知

22+阅读 · 2017年12月17日

深度学习中的注意力机制

深度学习中的注意力机制

CSDN大数据

24+阅读 · 2017年11月2日

相关论文

Clinically Inspired Symptom-Guided Depression Detection from Emotion-Aware Speech Representations

Arxiv

0+阅读 · 2月17日

MambaVF: State Space Model for Efficient Video Fusion

Arxiv

0+阅读 · 2月5日

Interactive Spatial-Frequency Fusion Mamba for Multi-Modal Image Fusion

Arxiv

0+阅读 · 2月4日

MHDash: An Online Platform for Benchmarking Mental Health-Aware AI Assistants

Arxiv

0+阅读 · 1月30日

HADUA: Hierarchical Attention and Dynamic Uniform Alignment for Robust Cross-Subject Emotion Recognition

Arxiv

0+阅读 · 1月29日

A Non-Invasive 3D Gait Analysis Framework for Quantifying Psychomotor Retardation in Major Depressive Disorder

Arxiv

0+阅读 · 1月27日

Unified Cross-Modal Attention-Mixer Based Structural-Functional Connectomics Fusion for Neuropsychiatric Disorder Diagnosis

Arxiv

0+阅读 · 1月25日

MambAttention: Mamba with Multi-Head Attention for Generalizable Single-Channel Speech Enhancement

Arxiv

0+阅读 · 1月21日

READ-Net: Clarifying Emotional Ambiguity via Adaptive Feature Recalibration for Audio-Visual Depression Detection

Arxiv

0+阅读 · 1月21日

Multimodal Emotion Recognition using Audio-Video Transformer Fusion with Cross Attention

Arxiv

0+阅读 · 1月20日

相关基金

基于个体化定位的经颅磁刺激治疗抑郁症的疗效及脑机制研究

国家自然科学基金

0+阅读 · 2016年12月31日

mPFC神经环路中突触结构重塑与慢性应激大鼠抑郁样行为的关系研究

国家自然科学基金

0+阅读 · 2015年12月31日

抑郁症患者及一级亲属奖励与惩罚处理神经机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

精神分裂症的多尺度动态功能连接研究

国家自然科学基金

3+阅读 · 2015年12月31日

海马有髓神经纤维脱髓鞘在抑郁症中的作用

国家自然科学基金

0+阅读 · 2015年12月31日

应用多模态fMRI探讨交泰丸治疗抑郁症患者的脑机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

儿童期创伤与抑郁症发生的易感性和保护性神经网络机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

精细亚区尺度难治性抑郁症异常神经环路的多模态MRI解析

国家自然科学基金

0+阅读 · 2015年12月31日

Mir124介导柴胡疏肝散调控抑郁症肝郁证模型海马神经可塑性的分子机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

新型统计模型在精神疾病的基因、脑影像和行为数据整合中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员