arxiv.org

2404.16456v2.pdf


Abstract

Multimodal sentiment analysis (MSA)는 멀티모달 데이터를 통해 사람의 감성을 이해하는 것을 목표로한다. 대부분의 MSA는 모든 모달리티 데이터가 항시 존재한다는 가정을 기반으로 연구를 진행해왔다. 그러나, 실제 상황에서는, 몇몇 요인들로 인해 불확실한 모달리티 결측 문제를 초래하고, 그로 인해 모델의 성능이 급격하게 하락한다. 본 논문에서는 이를 해결하기 위해 Correlation-decoupled Knowledge Distillation (CorrKD) 라는 프레임워크를 제안한다. 구체적으로, missing sementics를 재구축하기 위해 cross-sample correlations를 포함하고 있는 포괄적인 지식을 전파하기 위해 sample-level contrastive distillation mechanism 을 제안한다. 더 나아가서, category prototypes을 활용하여 cross-category correlations를 포착할 수 있는 category guided prototype distillation mechansim을 제안한다.

Introduction

Untitled

Methodology

Untitled

3.1. Problem Formulation

3.2. Overall Framework