Multimodal Prompt Learning with Missing Modalities for Sentiment...

2407.05374v1 (1).pdf


Abstract

멀티모달 모델의 발전은 멀티모달 분석 및 감정 인식 분야긔 상당히 진보된 성과를 이뤄내고 있다. 그러나, 현실 세계에서는, 다양한 결측 모달리티 문제로 인해 모델의 성능 저하를 야기할 수 있다. 본 연구에서는, 이러한 결측 모달리티 문제를 다루기 위해 프롬프트 학습 방법을 활용한 획기적인 멀티모달 트랜스포머 구조를 제안한다. 해당 모델은 총 세 가지 프롬프트에 대해 소개한다 : generative prompts, missing-signal prompts, and missing type prompts. 프롬프트 학습을 통해 학습 가능한 파라미터의 수를 상당히 줄일 수 있음을 확인한다.


Introduction


Proposed Method

Overall Architecture

Overall Architecture

Problem Definition