ViLAM: Distilling Vision-Language Reasoning into Attention Maps for Social Robot Navigation
Dit paper introduceert ViLAM, een methode die visueel-taalredenering distilleert naar ruimtelijke attentiekaarten om sociale robotnavigatie te verbeteren, wat resulteert in een aanzienlijke stijging van het succespercentage in vergelijking met bestaande methoden.