Large Multimodal Models as General In-Context Classifiers
Questo lavoro dimostra che i Large Multimodal Models (LMM), se potenziati dal metodo training-free CIRCLE per l'apprendimento in contesto, possono superare i modelli contrastivi VLM nella classificazione sia a mondo chiuso che aperto, posizionandosi come classificatori unificati e flessibili.