Residual Control for Fast Recovery from Dynamics Shifts
Il paper propone un'architettura di controllo residuo allineata alla stabilità che, mantenendo invariata una politica RL nominale e regolando un canale additivo tramite un "Stability Alignment Gate", permette ai sistemi robotici di recuperare rapidamente le prestazioni dopo shift dinamici imprevisti senza necessità di riaddestramento.