VLN-Cache: Enabling Token Caching for VLN Models with Visual/Semantic Dynamics Awareness
Il paper presenta VLN-Cache, un framework di caching dei token che supera i limiti delle metodologie esistenti nei modelli di Navigazione Visivo-Linguistica (VLN) adattandosi alle dinamiche visive e semantiche attraverso un rimappaggio allineato alla vista e un filtro di rilevanza, ottenendo un significativo aumento della velocità di inferenza senza compromettere il successo della navigazione.