RAGTrack: Language-aware RGBT Tracking with Retrieval-Augmented Generation
Ce papier présente RAGTrack, un cadre de suivi RGBT innovant qui intègre des descriptions textuelles générées par des modèles de langage multimodaux et utilise une génération augmentée par la récupération pour améliorer la robustesse du suivi d'objets face aux variations d'apparence et aux distractions de l'arrière-plan.