OmniEarth: A Benchmark for Evaluating Vision-Language Models in Geospatial Tasks
Dit paper introduceert OmniEarth, een nieuw benchmark voor het systematisch evalueren van vision-language modellen in aardobservatie, dat 28 taken omvat over perceptie, redenering en robuustheid om de huidige beperkingen van bestaande modellen in complexe geospatiale scenario's in kaart te brengen.