Measuring the Intrinsic Dimension of Earth Representations

Questo studio introduce la prima analisi della dimensionalità intrinseca delle rappresentazioni neurali implicite geografiche, rivelando che la loro complessità effettiva è molto inferiore alla dimensione ambientale e che tale metrica può essere utilizzata come strumento efficace per la valutazione, il debugging e la progettazione di modelli senza bisogno di etichette.

Arjun Rao, Marc Rußwurm, Konstantin Klemmer + 1 more2026-03-03🤖 cs.LG

AdaptVision: Efficient Vision-Language Models via Adaptive Visual Acquisition

AdaptVision è un paradigma efficiente per i modelli visione-linguaggio che, ispirandosi alla visione attiva umana e utilizzando un framework di apprendimento per rinforzo con ottimizzazione della politica disaccoppiata (DTPO), determina autonomamente il numero minimo di token visivi necessari per ogni campione attraverso un approccio a grana grossa-fine che combina token compressi e l'acquisizione selettiva di regioni chiave.

Zichuan Lin, Yicheng Liu, Yang Yang + 2 more2026-03-03💬 cs.CL