Modular Delta Merging with Orthogonal Constraints: A Scalable Framework for Continual and Reversible Model Composition

Dit paper introduceert MDM-OC, een schaalbaar kader voor continue en reversibele modelcompositie dat taakinterferentie elimineert door specifieke delta's te projecteren op orthogonale deelruimtes, waardoor modellen efficiënt kunnen worden samengevoegd, bijgewerkt en conform regelgeving zoals de GDPR weer ongedaan gemaakt.

Haris Khan, Sadia Asif, Shumaila Asif, Muhammad Zeeshan Karamat, Rajesh Upadhayaya

Gepubliceerd 2026-04-14
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een enorme, slimme robot bouwt die alles kan doen: van het herkennen van katten tot het schrijven van gedichten en het vertalen van talen. In de wereld van kunstmatige intelligentie (AI) noemen we dit een "model".

Het probleem is dat als je deze robot wilt leren een nieuwe taak (bijvoorbeeld "recepten schrijven"), je vaak zijn oude kennis vergeet. Of als je twee robots combineert, raken ze in de war en werken ze slechter. En wat als je later wilt dat de robot een specifieke kennis weer "vergeet" omdat een gebruiker dat vraagt (zoals vereist door privacywetten)? Dat is heel moeilijk.

Deze paper introduceert een slimme oplossing genaamd MDM-OC. Laten we dit uitleggen met een paar alledaagse analogieën.

1. Het Probleem: De Rommelige Werkbank

Stel je voor dat je een meester-timmerman bent (het basis-model). Je hebt een standaard gereedschapskist.

  • Als je een nieuwe taak leert (bijvoorbeeld het maken van een stoel), maak je een nieuwe set gereedschap aan.
  • Als je een andere taak leert (een tafel maken), maak je nog een set gereedschap.

In de oude methoden probeerde je al deze gereedschappen in één grote kist te gooien. Het resultaat? De hamers botsten tegen de schroevendraaiers, de schroeven kwamen los en de robot (de timmerman) werd verward. Hij kon de stoel niet meer goed maken terwijl hij de tafel probeerde te bouwen. Dit heet "catastrophic forgetting" (catastrofaal vergeten).

2. De Oplossing: Het "Onafhankelijke Vakje" Systeem

MDM-OC lost dit op door een heel slimme manier te gebruiken om gereedschap op te slaan. In plaats van alles in één grote kist te gooien, gebruikt het orthogonale subruimtes.

De Analogie van de 3D-Ruimte:
Stel je voor dat je een kamer hebt met drie dimensies: links-rechts, voor-achter en boven-onder.

  • De basis-robot staat in het midden.
  • De stoel-taak wordt opgeslagen als een beweging die alleen links-rechts gaat.
  • De tafel-taak wordt opgeslagen als een beweging die alleen voor-achter gaat.
  • De recept-taak gaat alleen boven-onder.

Omdat deze bewegingen loodrecht op elkaar staan (ze zijn "orthogonaal"), botsen ze nooit! Je kunt de robot de stoel laten maken, en dan direct de tafel, zonder dat de ene beweging de andere verstoort. Ze werken in hun eigen, onafhankelijke ruimte.

3. Hoe werkt het in de praktijk? (De 3 Stappen)

Stap 1: De "Verschil"-Notitie (Delta's)
In plaats van de hele robot opnieuw te bouwen voor elke taak, slaat MDM-OC alleen het verschil op.

  • Voorbeeld: "Om van basis-robot naar stoel-robot te gaan, moet je alleen de arm 5 cm naar links bewegen." Dat is je "delta" (verschil). Dit is veel minder geheugen nodig dan de hele robot opnieuw opslaan.

Stap 2: Het "Loodrechte" Draaien (Orthogonalisatie)
Als je een nieuwe taak wilt toevoegen, kijkt het systeem: "Hé, deze nieuwe beweging lijkt wel een beetje op de oude."
In plaats van ze te laten botsen, draait het systeem de nieuwe beweging zo dat hij perfect loodrecht op de oude staat.

  • Voorbeeld: Als de oude taak "links-rechts" ging, zorgt MDM-OC dat de nieuwe taak "voor-achter" gaat, zelfs als de oorspronkelijke idee daar anders was. Zo wordt er nooit een conflict.

Stap 3: Het "Afbreken" (Reversibiliteit)
Dit is het coolste deel. Omdat elke taak in zijn eigen, onafhankelijke richting zit, kun je een taak er weer uit halen alsof je een blok uit een legobouwwerk haalt.

  • Voorbeeld: Als iemand zegt: "Ik wil dat de robot geen recepten meer kent (omdat ik mijn recepten niet wil delen)", dan haalt MDM-OC gewoon de "boven-onder" beweging weg. De robot blijft perfect stoelen en tafels maken. Hij is niet verward, en hij heeft niets "vergeten" van de andere taken. Dit is cruciaal voor privacywetten (zoals de GDPR).

Waarom is dit belangrijk?

  1. Geen Verwarring: Robots kunnen honderden taken leren zonder dat ze elkaar verstoren.
  2. Privacy & Wetgeving: Als een gebruiker vraagt om zijn data te laten vergeten, kun je de specifieke kennis van die gebruiker "wegdraaien" zonder de hele robot opnieuw te hoeven trainen.
  3. Efficiëntie: Je slaat alleen de kleine verschillen op, niet de hele robot. Dit bespaart enorm veel computergeheugen.

Samenvattend

Stel je voor dat je een muziekbundel hebt.

  • Oude methode: Je probeert alle nummers door elkaar te spelen op één piano. Het klinkt als een enorme lawaai.
  • MDM-OC: Je geeft elke muzikant een eigen instrument dat op een andere frequentie speelt. Ze spelen samen een prachtig orkest, maar als je één muzikant wilt stoppen, klinkt de rest nog steeds perfect. En je kunt een nieuwe muzikant toevoegen zonder dat de anderen hun toon veranderen.

Deze paper (MDM-OC) is dus een nieuwe, slimme manier om AI-modellen samen te voegen, te updaten en weer terug te draaien, zodat ze slimmer worden zonder ooit in de war te raken.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →