Learning Humanoid End-Effector Control for Open-Vocabulary Visual Loco-Manipulation
Il paper presenta HERO, un nuovo paradigma che combina modelli visivi open-vocabulary per la generalizzazione con un preciso controllo end-effector appreso tramite simulazione, permettendo ai robot umanoidi di manipolare oggetti arbitrari in ambienti reali non strutturati.