openaccess.thecvf.com


Abstract

이질적(heterogeneous)이고 고차원적인(high-dimensional)한 데이터의 통합이 점점 더 중요해지고 있는 추세이다. 기존의 멀티모달 분류 알고리즘들은 주로 서로 다른 모달리티 데이터의 상호 보완성을 활용함으로써 모델의 성능을 향상시키는 것에 집중을 하였다. 그러나, 기존 방법론들은 신뢰할 수 있는 멀티모달 융향을 제공하는데에 약하며, 특히 의료 진단과 같은 안전이 중요한 응용 분야에서는 이러한 약점이 더욱 두드러진다. 이러한 문제를 해결하기 위해, 본 연구에서는 “Multimodal Dynamics” 라는 신뢰할 수 있는 멀티모달 분류 알고리즘을 제안한다. 이 알고리즘은 서로 다른 샘플에 대해 “feature-level” 과 “modality-level”정보 유효성(informativeness)을 동적으로 평가하고, 그에 따라 신뢰할 수 있는 모달리티 통합을 수행한다. 구체적으로 각 모달리티 내 특징의 정보 변화를 포착하기 위해 sparse gating을 도입하여 각 모달리티 분류 신뢰도를 평가하기 위해 실제 클래스 확률을 사용한다. 최종적으로, 동적 정보 유효성 추정 전략(dynamical informativeness estimation strategy)를 제안한다.


Introduction

image.png


Proposed Method

image.png

Feature-level Dynamics

Feature-informativeness encoder