ReHARK: Refined Hybrid Adaptive RBF Kernels for Robust One-Shot Vision-Language Adaptation
Le papier présente ReHARK, un cadre d'adaptation sans entraînement qui résout le dilemme stabilité-plasticité dans l'apprentissage vision-langage en un seul exemple grâce à une régularisation globale dans un espace de Hilbert à noyaux reproduisants et à une pipeline de raffinement multistade, établissant ainsi un nouvel état de l'art avec une précision moyenne de 65,83 % sur 11 benchmarks.