Loc2^2: Interpretable Cross-View Localization via Depth-Lifted Local Feature Matching

Il paper propone Loc2^2, un metodo interpretabile e ad alta precisione per la localizzazione incrociata tra viste aeree e terrestri che stima la posa 3D tramite la corrispondenza diretta delle caratteristiche locali, il sollevamento in spazio BEV basato sulla profondità e l'allineamento Procrustes, ottenendo risultati all'avanguardia senza necessità di annotazioni a livello di pixel.

Zimin Xia, Chenghao Xu, Alexandre Alahi2026-02-27💻 cs

PoSh: Using Scene Graphs To Guide LLMs-as-a-Judge For Detailed Image Descriptions

Il paper introduce PoSh, una metrica che utilizza grafi di scena per guidare i LLM nella valutazione di descrizioni d'immagine dettagliate, e DOCENT, un nuovo dataset di opere d'arte con giudizi esperti, dimostrando che questo approccio supera le metriche esistenti nel correlarsi con le valutazioni umane e nel guidare l'addestramento dei modelli.

Amith Ananthram, Elias Stengel-Eskin, Lorena A. Bradford + 7 more2026-02-27💬 cs.CL

Learning with less: label-efficient land cover classification at very high spatial resolution using self-supervised deep learning

Questo studio dimostra che l'apprendimento auto-supervisionato permette di realizzare una classificazione della copertura del suolo a risoluzione di 1 metro su larga scala con un'alta accuratezza, utilizzando un dataset di addestramento etichettato estremamente ridotto e migliaia di immagini aeree non etichettate per il pre-addestramento.

Dakota Hester, Vitor S. Martins, Lucas B. Ferreira + 1 more2026-02-27💻 cs