Routing without Forgetting
Il paper introduce "Routing without Forgetting" (RwF), un'architettura transformer che risolve il problema dell'apprendimento continuo online senza dimenticare, sostituendo l'adattamento graduale dei parametri con un routing dinamico basato su reti di Hopfield moderne per generare prompt contestuali in un singolo passaggio.