One-Prompt Strikes Back: Sparse Mixture of Experts for Prompt-based Continual Learning

Deze paper introduceert SMoPE, een nieuw raamwerk voor continu leren dat een sparse Mixture of Experts-architectuur toepast op gedeelde prompts om de prestaties van taakspecifieke methoden te benaderen met aanzienlijk minder rekenkosten en geheugengebruik.

Minh Le, Bao-Ngoc Dao, Huy Nguyen, Quyen Tran, Anh Nguyen, Nhat Ho

Gepubliceerd 2026-03-12
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

SMoPE: De Slimme "All-in-One" Prompt voor AI die niet vergeet

Stel je voor dat je een zeer getalenteerde chef-kok hebt (de AI) die al duizenden recepten kent. Je wilt deze chef nu leren nieuwe gerechten te maken, één voor één, zonder dat hij de oude recepten vergeet. Dit is wat wetenschappers Continual Learning (doorlopend leren) noemen.

Het probleem is dat AI-modellen vaak "catastrofaal vergeten": zodra ze een nieuw gerecht leren, raken ze de details van de oude recepten kwijt.

Tot nu toe waren er twee manieren om dit op te lossen, maar beide hadden nadelen:

  1. De "Eén Chef per Taak"-methode: Je maakt voor elk nieuw gerecht een volledig nieuwe set instructies (prompts). Dit werkt goed, maar is inefficiënt. Het is alsof je voor elke nieuwe klant een nieuwe chef inhuurt. Het kost veel ruimte en geld.
  2. De "Één Chef voor Alles"-methode: Je gebruikt één set instructies voor alle gerechten. Dit is heel efficiënt, maar de chef raakt in de war. De instructies voor sushi en de instructies voor pizza botsen met elkaar, en de kwaliteit van beide gerechten zakt.

De Oplossing: SMoPE

De auteurs van dit paper hebben een slimme tussenweg bedacht, genaamd SMoPE (Sparse Mixture of Prompt Experts). Ze gebruiken een creatieve analogie uit de keuken om dit uit te leggen:

De Creatieve Analogie: De "Slimme Keukenbrigade"

Stel je voor dat de AI niet één chef is, maar een grote keukenbrigade met 25 specialisten (de "experts").

  • De Oude Aanpak: Als je een nieuwe taak had, kiest de chef alle 25 specialisten tegelijk om te helpen. Ze roepen allemaal tegelijk, wat chaos veroorzaakt en de oude kennis overstemt.
  • De SMoPE Aanpak: Voor elke nieuwe opdracht (bijvoorbeeld: "Maak een visgerecht") kijkt de chef eerst naar de ingrediënten. Vervolgens kiest hij slechts 5 specialisten uit de brigade die het beste bij vis passen. De andere 20 specialisten blijven rustig in de hoek staan.

Dit is het geheim van SMoPE: Selectieve Activering.

Hoe werkt het in de praktijk?

  1. De "All-in-One" Instructie: In plaats van 100 verschillende instructieboekjes te maken voor 100 verschillende taken, heeft SMoPE één groot boek met 25 verschillende "hoofdstukken" (de experts).
  2. De Slimme Keuzemachine (De Router): Wanneer de AI een nieuwe foto ziet (bijvoorbeeld een vogel), berekent hij direct welke 5 van de 25 experts het beste bij die vogel passen. Alleen die 5 worden "aan" gezet om het antwoord te geven. De rest blijft "uit".
    • Vergelijking: Het is alsof je in een bibliotheek niet alle boeken tegelijk opent, maar alleen de 5 boeken die precies over het onderwerp gaan waar je naar op zoek bent.
  3. De "Stoornis-Remmer" (Adaptief Ruis): Soms kiezen de specialisten steeds dezelfde 5 mensen, terwijl er andere experts zijn die ook slim zijn maar nooit worden gebruikt. SMoPE heeft een slimme truc: het geeft een kleine "schok" (ruis) aan de favoriete specialisten om hen te dwingen even te stoppen, zodat de minder gebruikte specialisten ook een kans krijgen. Dit zorgt voor een eerlijke verdeling van het werk.
  4. Het Onzichtbare Geheugen (Prototypes): Om te voorkomen dat de specialisten hun oude kennis verliezen, onthoudt SMoPE de "stijl" van de oude taken. Het is alsof de chef een foto van een oud gerecht in zijn hoofd houdt. Als hij een nieuw gerecht maakt, kijkt hij naar die foto om zeker te weten dat hij de oude smaak niet verpest.

Waarom is dit geweldig?

  • Efficiëntie: Omdat ze maar 5 specialisten per taak gebruiken in plaats van 25, is de berekening 50% sneller en kost het veel minder computerkracht.
  • Geen Vergeten: Omdat ze niet alles tegelijk updaten, blijven de oude kennis en vaardigheden veilig bewaard.
  • Beter dan de rest: In tests bleek SMoPE beter te presteren dan methoden die duizenden parameters gebruiken, terwijl ze zelf veel minder ruimte innemen.

Kortom:
SMoPE is als een super-efficiënte keukenbrigade die niet iedereen tegelijk laat roepen, maar slim de juiste specialisten selecteert voor elke klus. Zo blijft de brigade snel, goedkoop, en vergeet hij nooit hoe hij de oude gerechten moet maken.