ReHARK: Refined Hybrid Adaptive RBF Kernels for Robust One-Shot Vision-Language Adaptation
Il paper presenta ReHARK, un framework di adattamento training-free che risolve il dilemma stabilità-plasticità nell'apprendimento one-shot per modelli visione-linguaggio come CLIP, combinando regolarizzazione globale in spazi RKHS, fusione di conoscenze multimodali e kernel RBF adattivi per raggiungere nuove prestazioni all'avanguardia su 11 benchmark.