Learning to Wander: Improving the Global Image Geolocation Ability of LMMs via Actionable Reasoning
Ce papier présente WanderBench, le premier benchmark mondial de géolocalisation basé sur des panoramas navigables, et GeoAoT, un cadre d'inférence qui améliore la précision des modèles multimodaux en générant des plans d'action concrets plutôt que de simples chaînes de raisonnement textuelles.