Pretraining in Actor-Critic Reinforcement Learning for Robot Locomotion
Questo lavoro propone un paradigma di preaddestramento per l'apprendimento per rinforzo nella locomozione robotica, basato su un modello inverso dinamico propriocezionale addestrato su dati di esplorazione, che migliora significativamente l'efficienza dei campioni e le prestazioni dei compiti rispetto all'inizializzazione casuale.