Multimodal Knowledge Distillation for Egocentric Action Recognition Robust to Missing Modalities
本論文は、欠損したモダリティに頑健であり、教師モデルの計算リソースを約 50% 削減しながら多様なセンサー構成での展開を可能にする、新しいマルチモーダル知識蒸留フレームワーク「KARMMA」を提案し、Epic-Kitchens や Something-Something などのデータセットでその有効性を示しています。