Lifelong Imitation Learning with Multimodal Latent Replay and Incremental Adjustment
Cet article présente un cadre d'apprentissage par imitation à vie qui améliore continuellement les politiques grâce à une réplay multimodale dans un espace latent et un ajustement incrémental des caractéristiques, établissant ainsi un nouvel état de l'art sur les benchmarks LIBERO avec une réduction significative de l'oubli.