Grow, Don't Overwrite: Fine-tuning Without Forgetting

Deze paper introduceert een nieuwe methode voor het uitbreiden van pre-getrainde modellen zonder hun oorspronkelijke kennis te verliezen, waardoor het mogelijk is om gespecialiseerde taken te leren zonder de prestaties op de oorspronkelijke taken te schaden.

Dyah Adila, Hanna Mazzawi, Benoit Dherin, Xavier Gonzalvo

Gepubliceerd 2026-03-10
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Groeien, niet overschrijven: Hoe je een slimme AI laat leren zonder zijn geheugen te verliezen

Stel je voor dat je een zeer ervaren, veelzijdige kok hebt. Deze kok kan perfect Italiaans, Japans en Mexicaans koken. Hij kent de basisrecepten uit zijn hoofd en kan op elk moment een heerlijk gerecht neerzetten. Dit is je pre-getrainde AI-model.

Nu wil je deze kok leren om Indonesisch te koken. Het probleem? Als je hem gewoon laat oefenen op Indonesische recepten, begint hij de oude recepten te vergeten. Misschien vergeet hij hoe je pasta maakt, of hoe je sushi rolt. Dit fenomeen heet in de AI-wereld "catastrophic forgetting" (catastrofaal vergeten). De nieuwe kennis overschrijft de oude.

De meeste bestaande methoden om dit op te lossen zijn als een "geheugentrainer" die de kok dwingt om niet te vergeten, maar dan kan hij de nieuwe Indonesische gerechten niet goed leren. Of je moet een hele nieuwe kok aannemen, maar dan heb je twee mensen nodig die elk hun eigen ding doen, wat inefficiënt is.

De auteurs van dit paper hebben een slimme oplossing bedacht: "Grow, Don't Overwrite" (Groeien, niet overschrijven).

De Creatieve Analogie: Het Uitbreiden van de Keuken

In plaats van de oude kok te dwingen om zijn geheugen te herschrijven, bouwen ze gewoon een nieuwe vleugel aan de keuken.

  1. De Kopieer- en Vermenigvuldig-methode:
    Stel je voor dat de kok een speciale "opslagkast" heeft voor ingrediënten (de MLP-submodules in de AI). De auteurs zeggen: "Laten we deze kast verdubbelen!"

    • Ze nemen de bestaande ingrediënten en zetten er een exacte kopie naast.
    • Maar wacht! Als je gewoon twee kasten hebt, krijg je dubbel zoveel eten. Dat is niet wat we willen. We willen dat het resultaat op het bord hetzelfde blijft als voorheen.
    • De Magische Truc: Ze verdubbelen de ingrediënten, maar ze halveren tegelijkertijd de hoeveelheid die eruit komt (de down-projection).
    • Het resultaat: De kok kan nu meer ingrediënten tegelijk verwerken (meer capaciteit), maar als hij een oud recept maakt, komt er precies hetzelfde gerecht uit als voorheen. De basisfunctie is onveranderd.
  2. Nieuwe Vaardigheden in de Nieuwe Vleugel:
    Nu ze die extra ruimte hebben gecreëerd, laten ze de kok in die nieuwe ruimte oefenen op de Indonesische recepten.

    • Hij leert de nieuwe vaardigheden in de nieuwe kast.
    • De oude kast blijft intact en wordt niet aangeraakt.
    • Geen vergeten: Omdat de oude kast nooit is veranderd, kan de kok nog steeds perfect Italiaans, Japans en Mexicaans koken.

Waarom is dit zo speciaal?

  • Geen compromis: Normaal moet je kiezen tussen "goed leren" en "niet vergeten". Met deze methode kun je beide. De AI wordt beter in de nieuwe taak én blijft perfect in de oude.
  • Slimme besparing: Je hoeft niet de hele keuken uit te breiden. De onderzoekers ontdekten dat je vaak maar een paar specifieke kasten (lagen in het netwerk) hoeft te verdubbelen om hetzelfde resultaat te krijgen als een volledige verbouwing. Dit bespaart enorm veel tijd en rekenkracht.
  • Aanpasbaar: Voor simpele taken (zoals vertalen) volstaat een kleine uitbreiding. Voor heel moeilijke taken (zoals wiskunde) moet je wat meer ruimte toevoegen, maar het werkt altijd zonder de basis te verstoren.

Samenvattend

Stel je voor dat je een boek hebt vol met kennis. In plaats van de oude pagina's te wissen om nieuwe informatie te schrijven, plak je er gewoon nieuwe pagina's bij. Je leest de nieuwe pagina's om iets nieuws te leren, maar de oude pagina's blijven precies zoals ze waren.

Deze methode zorgt ervoor dat AI-modellen kunnen groeien als een boom: ze krijgen nieuwe takken voor nieuwe vaardigheden, maar de stam en de oude takken blijven stevig en gezond. Geen vergeten, alleen maar groeien.