基于多模态大语言模型的计算情感分析：一项新兴方法机遇的当前证据 (Computational emotion analysis with multimodal LLMs: Current evidence on an emerging methodological opportunity) - 专知论文

会员服务 ·

0

多模 · 模态 · 分析 · 视频 · 多模态 ·

Computational emotion analysis with multimodal LLMs: Current evidence on an emerging methodological opportunity

翻译：基于多模态大语言模型的计算情感分析：一项新兴方法机遇的当前证据

Research increasingly leverages audio-visual materials to analyze emotions in political communication. Multimodal large language models (mLLMs) promise to enable such analyses through in-context learning. However, we lack systematic evidence on whether these models can reliably measure emotions in real-world political settings. This paper evaluates leading mLLMs for video-based emotional arousal measurement using two complementary human-labeled video datasets: recordings created under laboratory conditions and real-world parliamentary debates. I find a critical lab-vs-field performance gap. In video created under laboratory conditions, mLLMs arousal scores approach human-level reliability with little to no demographic bias. However, in parliamentary debate recordings, all examined models' arousal scores correlate at best moderately with average human ratings and exhibit systematic bias by speaker gender and age. Neither relying on leading closed-source mLLMs nor computational noise mitigation strategies change this finding. Further, mLLMs underperform even in sentiment analysis when using video recordings instead of text transcripts of the same speeches. These findings reveal important limitations of current mLLMs for real-world political video analysis and establish a rigorous evaluation framework for tracking future developments.

翻译：研究越来越多地利用视听材料来分析政治传播中的情感。多模态大语言模型有望通过情境学习实现此类分析。然而，我们缺乏系统性的证据来证明这些模型能否在现实世界的政治环境中可靠地测量情感。本文使用两个互补的人工标注视频数据集——实验室条件下录制的视频和现实世界议会辩论录像——评估了领先的多模态大语言模型在基于视频的情感唤醒度测量方面的表现。我发现了一个关键的实验室与现场性能差距。在实验室条件下录制的视频中，多模态大语言模型的唤醒度评分接近人类水平的可靠性，且几乎没有人口统计学偏差。然而，在议会辩论录像中，所有被考察模型的唤醒度评分与人类平均评分的相关性最多仅为中等，并表现出由发言者性别和年龄导致的系统性偏差。无论是依赖领先的闭源多模态大语言模型，还是采用计算噪声缓解策略，都无法改变这一发现。此外，当使用视频录像而非相同演讲的文本转录稿时，多模态大语言模型甚至在情感分析任务中也表现不佳。这些发现揭示了当前多模态大语言模型在现实世界政治视频分析中的重要局限性，并建立了一个严格的评估框架以追踪未来的发展。

0

相关内容

多模态对话情感识别：方法、趋势、挑战与前景综述

多模态对话情感识别：方法、趋势、挑战与前景综述

专知会员服务

20+阅读 · 2025年5月28日

《大型语言模型情感认知》最新进展

《大型语言模型情感认知》最新进展

专知会员服务

43+阅读 · 2024年10月3日

多模态情感计算的最新趋势：来自自然语言处理视角的综述

多模态情感计算的最新趋势：来自自然语言处理视角的综述

专知会员服务

32+阅读 · 2024年9月16日

大模型情感计算？东北大学等最新《大语言模型时代的情感计算：从自然语言处理角度》综述

大模型情感计算？东北大学等最新《大语言模型时代的情感计算：从自然语言处理角度》综述

专知会员服务

32+阅读 · 2024年8月13日

大型语言模型遇上文本中心的多模态情感分析：综述

大型语言模型遇上文本中心的多模态情感分析：综述

专知会员服务

25+阅读 · 2024年6月13日

从数据中心视角看多模态大型语言模型的综述

从数据中心视角看多模态大型语言模型的综述

专知会员服务

58+阅读 · 2024年5月28日

【CMU博士论文】多感官人工智能的基础

【CMU博士论文】多感官人工智能的基础

专知会员服务

40+阅读 · 2024年5月3日

情报分析《微调多语言模型以剪切自动事件数据》2023最新73页论文

情报分析《微调多语言模型以剪切自动事件数据》2023最新73页论文

专知会员服务

46+阅读 · 2023年8月27日

【复旦大学等】情感计算的系统综述:情感模型、数据库及研究进展，A Systematic Review on Affective Computing: Emotion Models, Databases, and Recent Advances

【复旦大学等】情感计算的系统综述:情感模型、数据库及研究进展，A Systematic Review on Affective Computing: Emotion Models, Databases, and Recent Advances

专知会员服务

55+阅读 · 2022年3月17日

面向社会媒体的多模态情感分析与表达，搜狗AI交互技术中心高级总监陈伟，第八届全国社会媒体处理大会SMP2019

面向社会媒体的多模态情感分析与表达，搜狗AI交互技术中心高级总监陈伟，第八届全国社会媒体处理大会SMP2019

专知会员服务

51+阅读 · 2019年10月22日

数据受限条件下的多模态处理技术综述

数据受限条件下的多模态处理技术综述

专知

22+阅读 · 2022年7月16日

情感计算研究进展、现状及趋势

情感计算研究进展、现状及趋势

哈工大SCIR

26+阅读 · 2022年4月27日

情感计算综述

情感计算综述

人工智能学家

34+阅读 · 2019年4月6日

【论文推荐】最新八篇情感分析相关论文—Pair-wise判别器、多模态情感分析、上下文语境、Gated 卷积网络

【论文推荐】最新八篇情感分析相关论文—Pair-wise判别器、多模态情感分析、上下文语境、Gated 卷积网络

专知

20+阅读 · 2018年6月29日

【论文推荐】最新八篇情感分析相关论文—注意力网络、多模态情感分析、情感分析局限性、跨语言情感分类、多语言情感分析

【论文推荐】最新八篇情感分析相关论文—注意力网络、多模态情感分析、情感分析局限性、跨语言情感分类、多语言情感分析

专知

52+阅读 · 2018年6月28日

【论文推荐】最新六篇情感分析相关论文—深度上下文、支持向量机、两级LSTM、多模态情感分析、软件工程、代码混合

【论文推荐】最新六篇情感分析相关论文—深度上下文、支持向量机、两级LSTM、多模态情感分析、软件工程、代码混合

专知

24+阅读 · 2018年3月31日

【论文推荐】最新5篇情感分析相关论文—深度学习情感分析综述、情感分析语料库、情感预测性、上下文和位置感知的因子分解模型、LSTM

【论文推荐】最新5篇情感分析相关论文—深度学习情感分析综述、情感分析语料库、情感预测性、上下文和位置感知的因子分解模型、LSTM

专知

55+阅读 · 2018年1月28日

情感分析的新方法，使用word2vec对微博文本进行情感分析和分类

情感分析的新方法，使用word2vec对微博文本进行情感分析和分类

数据挖掘入门与实战

22+阅读 · 2018年1月6日

独家 | 为什么要利用NLP做情感分析？

独家 | 为什么要利用NLP做情感分析？

数盟

13+阅读 · 2017年12月20日

深度学习在情感分析中的应用

深度学习在情感分析中的应用

CSDN大数据

14+阅读 · 2017年8月22日

基于多源语义表示学习的社交媒体文本属性情感分类研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于人脸表情、身体姿态和语音的多模态情感识别方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

中文社交化短文本情感分析与话题挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向复杂情报的大数据分析方法与决策支持

国家自然科学基金

41+阅读 · 2014年12月31日

面向大数据的群体偏好决策分析研究

国家自然科学基金

6+阅读 · 2014年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

大数据环境下多媒体网络舆情信息的语义识别与危机响应研究

国家自然科学基金

4+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

MME-Emotion: A Holistic Evaluation Benchmark for Emotional Intelligence in Multimodal Large Language Models

Arxiv

0+阅读 · 2月11日

Orthogonal Disentanglement with Projected Feature Alignment for Multimodal Emotion Recognition in Conversation

Arxiv

0+阅读 · 2月11日

OmniMER: Auxiliary-Enhanced LLM Adaptation for Indonesian Multimodal Emotion Recognition

Arxiv

0+阅读 · 2月10日

Customizing Visual Emotion Evaluation for MLLMs: An Open-vocabulary, Multifaceted, and Scalable Approach

Arxiv

0+阅读 · 2月5日

XEmoGPT: An Explainable Multimodal Emotion Recognition Framework with Cue-Level Perception and Reasoning

Arxiv

0+阅读 · 2月5日

Multimodal Large Language Models for Real-Time Situated Reasoning

Arxiv

0+阅读 · 2月2日

Decoding Ambiguous Emotions with Test-Time Scaling in Audio-Language Models

Arxiv

0+阅读 · 2月1日

Emotion-LLaMAv2 and MMEVerse: A New Framework and Benchmark for Multimodal Emotion Understanding

Arxiv

0+阅读 · 1月23日

Impact of LLMs news Sentiment Analysis on Stock Price Movement Prediction

Arxiv

0+阅读 · 1月22日

MoLAN: A Unified Modality-Aware Noise Dynamic Editing Framework for Multimodal Sentiment Analysis

Arxiv

0+阅读 · 1月16日

VIP会员

文章信息

相关主题

相关VIP内容

多模态对话情感识别：方法、趋势、挑战与前景综述

多模态对话情感识别：方法、趋势、挑战与前景综述

专知会员服务

20+阅读 · 2025年5月28日

《大型语言模型情感认知》最新进展

《大型语言模型情感认知》最新进展

专知会员服务

43+阅读 · 2024年10月3日

多模态情感计算的最新趋势：来自自然语言处理视角的综述

多模态情感计算的最新趋势：来自自然语言处理视角的综述

专知会员服务

32+阅读 · 2024年9月16日

大模型情感计算？东北大学等最新《大语言模型时代的情感计算：从自然语言处理角度》综述

大模型情感计算？东北大学等最新《大语言模型时代的情感计算：从自然语言处理角度》综述

专知会员服务

32+阅读 · 2024年8月13日

大型语言模型遇上文本中心的多模态情感分析：综述

大型语言模型遇上文本中心的多模态情感分析：综述

专知会员服务

25+阅读 · 2024年6月13日

从数据中心视角看多模态大型语言模型的综述

从数据中心视角看多模态大型语言模型的综述

专知会员服务

58+阅读 · 2024年5月28日

【CMU博士论文】多感官人工智能的基础

【CMU博士论文】多感官人工智能的基础

专知会员服务

40+阅读 · 2024年5月3日

情报分析《微调多语言模型以剪切自动事件数据》2023最新73页论文

情报分析《微调多语言模型以剪切自动事件数据》2023最新73页论文

专知会员服务

46+阅读 · 2023年8月27日

【复旦大学等】情感计算的系统综述:情感模型、数据库及研究进展，A Systematic Review on Affective Computing: Emotion Models, Databases, and Recent Advances

【复旦大学等】情感计算的系统综述:情感模型、数据库及研究进展，A Systematic Review on Affective Computing: Emotion Models, Databases, and Recent Advances

专知会员服务

55+阅读 · 2022年3月17日

面向社会媒体的多模态情感分析与表达，搜狗AI交互技术中心高级总监陈伟，第八届全国社会媒体处理大会SMP2019

面向社会媒体的多模态情感分析与表达，搜狗AI交互技术中心高级总监陈伟，第八届全国社会媒体处理大会SMP2019

专知会员服务

51+阅读 · 2019年10月22日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】基于自适应表征的高效视觉建模

《多域作战中融合网络、电子战与动能机动》

AI智能体时代大模型安全风险与攻防新挑战

迈向个性化大语言模型驱动的智能体：基础、评估与未来方向

相关资讯

数据受限条件下的多模态处理技术综述

数据受限条件下的多模态处理技术综述

专知

22+阅读 · 2022年7月16日

情感计算研究进展、现状及趋势

情感计算研究进展、现状及趋势

哈工大SCIR

26+阅读 · 2022年4月27日

情感计算综述

情感计算综述

人工智能学家

34+阅读 · 2019年4月6日

【论文推荐】最新八篇情感分析相关论文—Pair-wise判别器、多模态情感分析、上下文语境、Gated 卷积网络

【论文推荐】最新八篇情感分析相关论文—Pair-wise判别器、多模态情感分析、上下文语境、Gated 卷积网络

专知

20+阅读 · 2018年6月29日

【论文推荐】最新八篇情感分析相关论文—注意力网络、多模态情感分析、情感分析局限性、跨语言情感分类、多语言情感分析

【论文推荐】最新八篇情感分析相关论文—注意力网络、多模态情感分析、情感分析局限性、跨语言情感分类、多语言情感分析

专知

52+阅读 · 2018年6月28日

【论文推荐】最新六篇情感分析相关论文—深度上下文、支持向量机、两级LSTM、多模态情感分析、软件工程、代码混合

【论文推荐】最新六篇情感分析相关论文—深度上下文、支持向量机、两级LSTM、多模态情感分析、软件工程、代码混合

专知

24+阅读 · 2018年3月31日

【论文推荐】最新5篇情感分析相关论文—深度学习情感分析综述、情感分析语料库、情感预测性、上下文和位置感知的因子分解模型、LSTM

【论文推荐】最新5篇情感分析相关论文—深度学习情感分析综述、情感分析语料库、情感预测性、上下文和位置感知的因子分解模型、LSTM

专知

55+阅读 · 2018年1月28日

情感分析的新方法，使用word2vec对微博文本进行情感分析和分类

情感分析的新方法，使用word2vec对微博文本进行情感分析和分类

数据挖掘入门与实战

22+阅读 · 2018年1月6日

独家 | 为什么要利用NLP做情感分析？

独家 | 为什么要利用NLP做情感分析？

数盟

13+阅读 · 2017年12月20日

深度学习在情感分析中的应用

深度学习在情感分析中的应用

CSDN大数据

14+阅读 · 2017年8月22日

相关论文

MME-Emotion: A Holistic Evaluation Benchmark for Emotional Intelligence in Multimodal Large Language Models

Arxiv

0+阅读 · 2月11日

Orthogonal Disentanglement with Projected Feature Alignment for Multimodal Emotion Recognition in Conversation

Arxiv

0+阅读 · 2月11日

OmniMER: Auxiliary-Enhanced LLM Adaptation for Indonesian Multimodal Emotion Recognition

Arxiv

0+阅读 · 2月10日

Customizing Visual Emotion Evaluation for MLLMs: An Open-vocabulary, Multifaceted, and Scalable Approach

Arxiv

0+阅读 · 2月5日

XEmoGPT: An Explainable Multimodal Emotion Recognition Framework with Cue-Level Perception and Reasoning

Arxiv

0+阅读 · 2月5日

Multimodal Large Language Models for Real-Time Situated Reasoning

Arxiv

0+阅读 · 2月2日

Decoding Ambiguous Emotions with Test-Time Scaling in Audio-Language Models

Arxiv

0+阅读 · 2月1日

Emotion-LLaMAv2 and MMEVerse: A New Framework and Benchmark for Multimodal Emotion Understanding

Arxiv

0+阅读 · 1月23日

Impact of LLMs news Sentiment Analysis on Stock Price Movement Prediction

Arxiv

0+阅读 · 1月22日

MoLAN: A Unified Modality-Aware Noise Dynamic Editing Framework for Multimodal Sentiment Analysis

Arxiv

0+阅读 · 1月16日

相关基金

基于多源语义表示学习的社交媒体文本属性情感分类研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于人脸表情、身体姿态和语音的多模态情感识别方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

中文社交化短文本情感分析与话题挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向复杂情报的大数据分析方法与决策支持

国家自然科学基金

41+阅读 · 2014年12月31日

面向大数据的群体偏好决策分析研究

国家自然科学基金

6+阅读 · 2014年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

大数据环境下多媒体网络舆情信息的语义识别与危机响应研究

国家自然科学基金

4+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员