CARE What Fails: Contrastive Anchored-REflection for Verifiable Multimodal
Le papier présente CARE, un cadre d'entraînement postérieur centré sur les échecs pour le raisonnement multimodal qui transforme les erreurs en signaux d'apprentissage exploitables grâce à un objectif contrastif ancré et à un échantillonnage guidé par la réflexion, améliorant ainsi significativement la précision et la stabilité de l'entraînement sur des modèles de vision-linguistique.