소셜 미디어에서 비꼼(Sarcasm)은 감성 분석에 중요한 역할을 한다. 비꼼 대상 식별(Sarcasm Target Identification, STI)은 비꼼을 깊이 이해하기 위한 더 많은 연구가 필요하다. 그러나, 맥락이 부족하거나 비꼼 대상이 확실하지 않은 경우 대상 식별이 매우 어려워지는 문제가 있다. 본 논문에서는, STI에 다중 모달리티(Multimodality)를 도입함으로써 Multimodal Sarcasm Target Identification (MSTI) task를 제시한다. 저자들은 텍스트 대상 라벨링(Textual target labeling)과 시각적 대상 감지(Visual target detection)을 동시에 수행할 수 있는 “multi-scale crossmodality model” 을 제안한다.
비꼼(Sarcasm) 분석이 필요한 이유
⇒ Sarcasm Target Identification은 Customer Service, Opinion Mining, Online Harassment Detection에서 큰 의미를 지닌다.
기존 연구의 접근법
⇒ 저자는 텍스트 정보만을 활용하면 정확한 비꼼 대상을 식별하기 어렵다고 주장
한계점
⇒ 이를 정확히 분석하려면, 이미지에 대한 정보를 함께 활용해야 한다고 주장
제안 방법