GTR-Turbo: Merged Checkpoint is Secretly a Free Teacher for Agentic VLM Training
Il paper presenta GTR-Turbo, un metodo efficiente che utilizza un modello "insegnante" gratuito generato dalla fusione di checkpoint durante l'addestramento per migliorare le prestazioni degli agenti VLM e ridurre costi e tempi, eliminando la dipendenza da modelli proprietari costosi.