Inference-Time Dynamic Modality Selection for Incomplete Multimodal Classification
Este artículo presenta DyMo, un marco de selección dinámica de modalidades en tiempo de inferencia que resuelve el dilema entre descartar o imputar datos faltantes en el aprendizaje multimodal al identificar e integrar adaptativamente las modalidades recuperadas más fiables mediante una función de recompensa basada en la pérdida de la tarea, logrando un rendimiento superior en diversos escenarios de datos incompletos.