ORIC: Benchmarking Object Recognition under Contextual Incongruity in Large Vision-Language Models
Die Arbeit stellt das ORIC-Framework vor, das die Erkennungsleistung von Large Vision-Language-Modellen bei kontextueller Inkongruität untersucht, einen entsprechenden Benchmark erstellt und durch gezieltes Fine-Tuning die Zuverlässigkeit dieser Modelle in atypischen Szenarien verbessert.