ConFEDE: Contrastive Feature Decomposition for Multimodal Sentiment Analysis


Abstract

멀티모달 감성 분석(Multimodal Sentiment Analysis)는 비디오 컨텐츠 내의 감성을 분석하는 것을 목표로 한다. 최근 연구에 따르면, 다중 모달 감성 분석은 주요적으로 멀티모달 정보의 효과적인 표현을 학습하는 것에 달려있다는 점을 시사하고 있다. 본 연구에서, 멀티모달 정보의 표현력을 향상시키기 위해서 대조적 표현(Contrastive Representation)학습과 대조적 특징 분해(Contrasitive Feature Decomposition)을 동시에 수행할 수 있는 통합된 학습 구조인 “ConFEDE”을 제안한다.

Introduction