ResWM: Residual-Action World Model for Visual RL
Il paper introduce ResWM, un modello del mondo basato su azioni residue che, riformulando il controllo come aggiustamenti incrementali e utilizzando un codificatore delle differenze di osservazione, migliora significativamente l'efficienza dei campioni, la stabilità e la fluidità del controllo rispetto ai metodi tradizionali nell'apprendimento per rinforzo visivo.