Return Augmented Decision Transformer for Off-Dynamics Reinforcement Learning
Il paper propone REAG, un metodo che allinea la distribuzione dei ritorni tra dominio sorgente e target per adattare i Decision Transformer all'apprendimento offline con dinamiche diverse, ottenendo teoricamente e sperimentalmente prestazioni ottimali senza perdita dovuta allo shift dinamico.