Towards Good Practices for Missing Modality Robust Action Recognition

Towards Good Practices for Missing Modality.pdf


Abstract

일반적인 멀티모달 모델은 학습과정과 추론과정에서 동일한 모달리티 데이터가 있다고 가정한다. 그러나, 실용적인 측면에서 보면 이러한 가정을 충족하는 환경이 아닌 경우들도 존재할 수 있다. 본 논문은 멀티모달 action recognition을 위한 실용적인 상황(Training 할 때는 모든 모달리티 존재, testing 할 때는 랜덤하게 일부 모달리티 누락되는 상황) 을 가정한다. 또한 ActionMAE라는 간단한 모듈 네트워크를 제안하여 일부 누락된 모달리티 데이터가 존재하면 그 데이터를 재구축(reconstruction)하도록 학습하고 실제 추론 과정에서 활용한다.

Introduction

Method

Untitled