Reliable stress recognition is critical in applications such as medical monitoring and safety-critical systems, including real-world driving. While stress is commonly detected using physiological signals such as perinasal perspiration and heart rate, facial activity provides complementary cues that can be captured unobtrusively from video. We propose a multimodal stress estimation framework that combines facial videos and physiological signals, remaining effective even when biosignal acquisition is challenging. Facial behavior is represented using a dense 3D Morphable Model, yielding a 56-dimensional descriptor that captures subtle expression and head-pose dynamics over time. To study how stress modulates facial motion, we perform extensive experiments alongside established physiological markers. Paired hypothesis tests between baseline and stressor phases show that 38 of 56 facial components exhibit consistent, phase-specific stress responses comparable to physiological markers. Building on these findings, we introduce a Transformer-based temporal modeling framework and evaluate unimodal, early-fusion, and cross-modal attention strategies. Cross-modal attention fusion of 3D-derived facial features with physiological signals substantially improves performance over physiological signals alone, increasing AUROC from 52.7% and accuracy from 51.0% to 92.0% and 86.7%, respectively. Although evaluated on driving data, the proposed framework and protocol may generalize to other stress estimation settings.


翻译:可靠的压力识别在医疗监护和安全关键系统(如真实驾驶场景)中至关重要。虽然压力通常通过生理信号(如鼻周出汗和心率)进行检测,但面部活动提供了可从视频中无干扰捕获的补充线索。我们提出了一种多模态压力估计框架,该框架结合了面部视频与生理信号,即使在生物信号采集困难时仍保持有效。面部行为通过密集三维可形变模型进行表征,生成一个56维描述符,用于捕捉随时间变化的细微表情与头部姿态动态。为研究压力如何调节面部运动,我们与成熟的生理标记物进行了广泛对比实验。基线阶段与压力源阶段间的配对假设检验表明,56个面部成分中有38个表现出与生理标记物相当的、一致的阶段特异性压力响应。基于这些发现,我们引入了一种基于Transformer的时序建模框架,并评估了单模态、早期融合及跨模态注意力策略。将三维衍生面部特征与生理信号进行跨模态注意力融合,相比仅使用生理信号,性能显著提升:AUROC从52.7%提高至92.0%,准确率从51.0%提升至86.7%。尽管在驾驶数据上评估,所提出的框架与协议可能推广至其他压力估计场景。

0
下载
关闭预览

相关内容

自动驾驶中的3D目标检测研究进展
专知会员服务
11+阅读 · 2025年7月20日
可解释的人工智能在生物医学图像分析中的应用综述
专知会员服务
14+阅读 · 2025年7月11日
基于深度学习的物体姿态估计综述
专知会员服务
26+阅读 · 2024年5月15日
【AI+军事】附论文《感受到的压力和脑网络效率》
专知会员服务
16+阅读 · 2022年5月18日
【AI+军事】附论文+PPT《军事飞行员的情绪压力分析》
专知会员服务
43+阅读 · 2022年5月11日
最新《深度学习人体姿态估计》综述论文,26页pdf
专知会员服务
40+阅读 · 2020年12月29日
论文盘点:人脸表情识别解析
PaperWeekly
13+阅读 · 2020年7月26日
深度学习人体姿态估计算法综述
AI前线
25+阅读 · 2019年5月19日
如何设计基于深度学习的图像压缩算法
论智
41+阅读 · 2018年4月26日
从传统方法到深度学习,人脸关键点检测方法综述
机器之心
14+阅读 · 2017年12月17日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
《系统簇式多域作战规划范畴论框架》
专知会员服务
2+阅读 · 今天14:54
高效视频扩散模型:进展与挑战
专知会员服务
0+阅读 · 今天13:34
乌克兰前线的五项创新
专知会员服务
6+阅读 · 今天6:14
 军事通信系统与设备的技术演进综述
专知会员服务
4+阅读 · 今天5:59
《北约标准:医疗评估手册》174页
专知会员服务
4+阅读 · 今天5:51
《提升生成模型的安全性与保障》博士论文
专知会员服务
4+阅读 · 今天5:47
美国当前高超音速导弹发展概述
专知会员服务
4+阅读 · 4月19日
无人机蜂群建模与仿真方法
专知会员服务
13+阅读 · 4月19日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员