Multimodal sentiment analysis is an increasingly popular research area, which extends the conventional language-based definition of sentiment analysis to a multimodal setup where other relevant modalities accompany language. In this paper, we pose the problem of multimodal sentiment analysis as modeling intra-modality and inter-modality dynamics. We introduce a novel model, termed Tensor Fusion Network, which learns both such dynamics end-to-end. The proposed approach is tailored for the volatile nature of spoken language in online videos as well as accompanying gestures and voice. In the experiments, our model outperforms state-of-the-art approaches for both multimodal and unimodal sentiment analysis.


翻译:多模式情绪分析是一个日益受欢迎的研究领域,它把传统语言的情绪分析定义扩大到多式联运结构,而其他相关模式也伴随语言。在本文中,我们提出了多式联运情绪分析问题,作为内部和现代动态的模型。我们引入了一种新颖的模式,称为Tensor融合网络,既学习这种动态,又从终端到终端学习。建议的方法是针对在线视频中口语的不稳定性以及随附的手势和声音。在实验中,我们的模型在多式联运和单式情绪分析方面优于最先进的方法。

4
下载
关闭预览

相关内容

[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
机器学习入门的经验与建议
专知会员服务
94+阅读 · 2019年10月10日
Unsupervised Learning via Meta-Learning
CreateAMind
44+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
笔记 | Sentiment Analysis
黑龙江大学自然语言处理实验室
10+阅读 · 2018年5月6日
Arxiv
25+阅读 · 2018年1月24日
VIP会员
Top
微信扫码咨询专知VIP会员