Restoring Linguistic Grounding in VLA Models via Train-Free Attention Recalibration
Questo paper introduce ICBench per diagnosticare la "cecità linguistica" nei modelli VLA, che ignorano le istruzioni contraddittorie favorendo le priorità visive, e propone IGAR, un metodo senza riaddestramento che ripristina l'attenzione alle istruzioni durante l'inferenza per prevenire azioni errate.