UrbanAlign: Post-hoc Semantic Calibration for VLM-Human Preference Alignment
Il paper presenta UrbanAlign, un framework post-hoc che allinea i modelli visione-linguaggio congelati alle preferenze umane per la valutazione degli spazi urbani, ottenendo prestazioni superiori attraverso un processo a tre stadi di estrazione concettuale e calibrazione senza modificare i pesi del modello.