Let's Reward Step-by-Step: Step-Aware Contrastive Alignment for Vision-Language Navigation in Continuous Environments
Cet article propose SACA, un cadre d'alignement contrastif sensible aux étapes qui améliore la navigation vision-langage en environnement continu en extrayant une supervision dense des trajectoires imparfaites pour surmonter les limites des méthodes d'apprentissage par renforcement et de l'ajustement par supervision.