Each language version is independently generated for its own context, not a direct translation.
Stel je voor dat je een geniale chef-kok hebt die al duizenden kookboeken uit zijn hoofd kent. Deze chef kan op elk moment een gerecht maken, zelfs als hij nog nooit de specifieke ingrediënten heeft gezien (dit noemen we "zero-shot" leren). Hij is een Vision-Language Model (VLM), zoals CLIP: hij begrijpt zowel beelden als taal.
Het probleem is echter: wat als je die chef vraagt om een heel specifiek, nieuw gerecht te maken, bijvoorbeeld "de perfecte Nederlandse stroopwafel", maar je hebt hem maar één recept gegeven?
Als je de chef nu dwingt om zich op dat ene recept te focussen, kan hij zijn geheugen verliezen. Hij vergeet misschien hoe hij een pizza of een soep maakt, omdat hij zich zo op de stroopwafel heeft gefocust. Dit noemen onderzoekers catastrophic forgetting (catastrofaal vergeten).
Deze paper introduceert EvoPrompt, een slimme manier om die chef te trainen zonder zijn geheugen te laten verdwijnen. Hier is hoe het werkt, vertaald naar alledaagse termen:
1. De "Gemeenschappelijke Notitieblok" (Modality-Shared Prompt Projector)
Stel je voor dat de chef een enorme keuken heeft met 12 verschillende werkbladen (laagjes). Eerdere methoden gaven elke werkblad een apart, los notitieblokje met instructies. Dat werkte niet goed, want de instructies op werkblad 1 wisten niets van werkblad 12.
EvoPrompt doet iets anders: het gebruikt één groot, centraal notitieblok (de Modality-Shared Prompt Projector).
- Dit notitieblok bevat de basisideeën.
- Vervolgens worden deze ideeën slim vertaald naar elk specifiek werkblad.
- Het voordeel: De chef houdt de connectie tussen alle werkbladen. Hij weet dat wat hij op het eerste blad leert, ook relevant is voor het laatste. Het zorgt voor een betere samenwerking tussen "zien" (beelden) en "lezen" (taal).
2. De "Richting vs. De Kracht" (Evolutionary Trajectory)
Dit is het meest creatieve deel. Stel je voor dat je een kompas hebt.
- De richting is waar het kompas naartoe wijst (bijvoorbeeld: "Noorden"). Dit is de basisinformatie die de chef al kent.
- De kracht is hoe hard je op de naald duwt om hem iets te laten bewegen.
Bij de oude methoden veranderde je zowel de richting als de kracht. Soms veranderde je de richting zo veel dat het kompas volledig verkeerd ging wijzen (vergeten van oude kennis).
EvoPrompt doet iets slims:
- Het bevriest de richting die de chef in het begin heeft geleerd. Die basisrichting blijft altijd "Noorden".
- Alleen de kracht (hoe hard je duwt) mag veranderen.
- Als de chef later in de training nog iets nieuws moet leren, voegt hij een nieuwe richting toe, maar hij verandert de oude basisrichting niet.
De analogie: Het is alsof je een oude boom hebt. Je mag nieuwe takken laten groeien (nieuwe taken leren), maar je mag de stam (de oude kennis) niet kapen of verdraaien. De boom groeit, maar blijft staan.
3. De "Orde in de Keuken" (Feature Geometric Regularization)
Soms, als je te veel nieuwe instructies geeft, raken de instructies door elkaar. De chef weet niet meer welk ingrediënt bij welk gerecht hoort; alles wordt een modderige soep.
EvoPrompt voegt een regel toe: "Houd de planken gescheiden."
Het zorgt ervoor dat de verschillende kenmerken (zoals kleur, vorm, tekst) niet door elkaar lopen. Ze blijven "orthogonaal" (haaks op elkaar), net als de planken in een goed georganiseerde kast. Dit voorkomt dat de chef in de war raakt en zorgt dat hij scherp blijft.
4. De "Slimme Rangschikking" (Adaptive Rank Reduction)
In het begin van de training heeft de chef veel ruimte nodig om te ontdekken wat er mogelijk is. Maar naarmate hij meer leert, heeft hij minder ruimte nodig voor de kleine details.
EvoPrompt past dit automatisch aan:
- Aan het begin: Veel ruimte (hoge "rang") om veel te leren.
- Aan het einde: Minder ruimte (lagere "rang") voor de fijne afwerking.
Dit maakt het proces sneller en efficiënter, zonder dat de kwaliteit daalt.
Wat is het resultaat?
Met EvoPrompt kan de chef:
- De perfecte stroopwafel maken (hij leert de nieuwe taak goed).
- Maar hij vergeet niet hoe hij pizza's of soep maakt (hij behoudt zijn oude kennis).
- Hij doet dit allemaal met heel weinig recepten (weinig data).
Kortom: EvoPrompt is als een slimme coach die een genie helpt zich aan te passen aan nieuwe taken, zonder dat het genie zijn eigen identiteit verliest. Het zorgt ervoor dat de AI niet "vergeten" raakt wat hij al wist, terwijl hij toch nieuw leert.