An Empirical Study and Theoretical Explanation on Task-Level Model-Merging Collapse

Each language version is independently generated for its own context, not a direct translation.

Samenvatting: Waarom sommige AI-modellen "in elkaar storten" bij het samenvoegen

Stel je voor dat je een superkrachtige basis-AI hebt, zoals een leeg, slim brein. Verschillende teams nemen dit brein en trainen het apart op specifieke taken: één team leert het wiskunde, een ander leert het poëzie schrijven, en weer een ander leert het medische diagnoses te stellen.

Nu wil je al deze gespecialiseerde versies samenvoegen tot één "supermodel" dat alles kan. Het idee is simpel: je neemt de kennis van de wiskundeleraar, de dichter en de dokter en plakt ze bij elkaar. Maar in de praktijk gebeurt er iets vreemds: soms werkt dit perfect, maar soms stort het hele systeem in. De nieuwe AI wordt dan niet alleen niet beter, maar hij vergeet zelfs wat hij eerder kon.

De auteurs van dit paper noemen dit "Merging Collapse" (samenklontering). Ze hebben onderzocht waarom dit gebeurt en komen met een verrassende ontdekking.

De Verkeerde Theorie: Het is niet de "Inkt" die botst

Vroeger dachten experts dat het probleem zat in de parameters (de getallen in het model).

De analogie: Stel je voor dat je twee recepten hebt. Recept A zegt: "Voeg 2 eetlepels zout toe." Recept B zegt: "Voeg 2 eetlepels suiker toe." Als je ze samenvoegt, dacht men dat het probleem was dat de zout- en suikerlepels tegenstrijdige instructies gaven.
De ontdekking: De onderzoekers hebben bewezen dat dit niet de oorzaak is. Zelfs als de instructies (de parameters) perfect lijken te kloppen, kan het samenvoegen toch mislukken. Het probleem zit niet in de "instructies" zelf, maar in iets dieper.

De Ware Oorzaak: Het "Denkbeeld" is incompatibel

De echte oorzaak ligt in hoe de AI de wereld begrijpt (de representaties).

De analogie: Stel je voor dat de wiskundeleraar denkt in termen van cijfers en formules, terwijl de dichter denkt in gevoel en metaforen. Als je ze probeert te laten samenwerken, praten ze niet alleen over verschillende dingen, maar ze gebruiken ook totaal verschillende "taal" om hun gedachten te vormen.
Als je deze twee verschillende denkwerelden probeert te middelen (te samenvoegen), krijg je een rommelige mix die niemand meer begrijpt. De AI raakt in de war omdat de concepten fundamenteel niet bij elkaar passen.

De paper noemt dit "Representational Incompatibility" (onverenigbaarheid van voorstellingen). Het is alsof je probeert een olifant en een muis te middelen; je krijgt geen "grote muis" of "kleine olifant", maar een onmogelijk wezen dat nergens goed voor is.

De Wiskundige Regel: De "Afstand" tussen ideeën

De auteurs hebben een wiskundige theorie ontwikkeld (gebaseerd op informatie-theorie) die zegt:

Hoe verder de "denkwerelden" van twee taken van elkaar verwijderd zijn, hoe groter de kans dat het samenvoegen mislukt.

Ze hebben een nieuwe meetlat bedacht, de "Hidden State Similarity" (gelijkenis van de verborgen gedachten).

Hoe het werkt: Ze kijken niet naar de getallen in het model, maar naar hoe het model in zijn hoofd naar een vraag kijkt. Als twee modellen op dezelfde vraag heel verschillende "denkbeelden" hebben, is de afstand groot.
Het resultaat: Als die afstand te groot is, is samenvoegen onmogelijk zonder dat de AI crasht. De theorie voorspelt precies hoe groot die afstand mag zijn voordat het misgaat.

Wat betekent dit voor de toekomst?

Dit onderzoek verandert hoe we AI bouwen:

Kies je team wijs: Je kunt niet zomaar elke twee AI-modellen samenvoegen. Je moet eerst kijken of hun "denkwerelden" op elkaar lijken.
Geen magische knop: Er is geen enkele techniek die alle problemen oplost. Als de taken te verschillend zijn, zal elke methode falen.
Slimmer testen: Voordat je modellen samenvoegt, kun je nu meten of ze "op dezelfde golflengte" zitten. Als dat zo is, werkt het; als niet, laat het maar.

Kortom: Het samenvoegen van AI-modellen is niet zoals het plakken van LEGO-blokjes. Het is meer zoals het samenvoegen van twee verschillende culturen. Als de culturen te verschillend zijn, ontstaat er chaos. Als ze op elkaar lijken, ontstaat er iets moois. De kunst is om te weten welke culturen samengaan.

Each language version is independently generated for its own context, not a direct translation.

Hier is een gedetailleerde technische samenvatting van het artikel "An Empirical Study and Theoretical Explanation on Task-Level Model-Merging Collapse" in het Nederlands.

Probleemstelling

Het artikel adresseert het fenomeen van "merging collapse" (instorting bij het samenvoegen) bij Large Language Models (LLM's). Hoewel model-merging een veelbelovende techniek is om onafhankelijk gefinetuned modellen van dezelfde basis te combineren zonder opnieuw te trainen, wordt in de praktijk vaak waargenomen dat bepaalde combinaties van taak-specialisten leiden tot catastrofale prestatiedalingen.

Traditioneel wordt aangenomen dat dit faalschuld is van conflicterende parameter-updates (waarbij de gewichtsveranderingen voor verschillende taken elkaars optimalisatie ondermijnen). De auteurs stellen echter dat dit een onvoldoende verklaring is, aangezien sommige taakcombinaties falen ongeacht de gebruikte mergemethode, zelfs als de parameterconflicten laag lijken te zijn. De kernvraag is: Wat zijn de fundamentele beperkingen die bepalen welke taken succesvol kunnen worden samengevoegd zonder instorting?

Methodologie

De auteurs hanteren een combinatie van uitgebreide empirische studies en een nieuwe theoretische benadering:

Empirische Analyse:
- Datasets & Modellen: Er zijn experimenten uitgevoerd op diverse modellen (o.a. Llama3, Qwen2.5, T5) en datasets (GLUE, Lots-of-LoRAs).
- Mergemethoden: Vijf state-of-the-art technieken werden getest: Linear Averaging (LA), Task Arithmetic (TA), TIES, DARE en SLERP.
- Metrieken: De auteurs vergelijken traditionele parameter-ruimte metrieken (zoals tekenveranderingen, magnitude-ratio's en cosine-ähnlichkeit van taakvectoren) met een nieuwe metriek gebaseerd op hidden-state representaties.
- Definitie van Collapse: "Merging loss" wordt gedefinieerd als het percentage prestatieverlies op specifieke taken na het samenvoegen.
Theoretisch Kader:
- De auteurs introduceren een theoretisch framework gebaseerd op Rate-Distortion theorie (informatietheorie).
- Ze maken gebruik van de aanname van Linear Mode Connectivity (LMC), wat stelt dat gefinetuned minima in de parameterruimte lineair verbonden zijn.
- Ze bewijzen een stelling (Theorem 1) die een ondergrens stelt aan de vervorming (distortion) van hidden states bij het samenvoegen, afhankelijk van de geometrie van de taak-specifieke representatieclusters.

Belangrijkste Bijdragen

Identificatie van Representational Incompatibility:
De studie toont aan dat "merging collapse" primair wordt gedreven door onverenigbaarheid op het niveau van representaties (hidden states) en niet door conflicten in de parameterruimte. Bepaalde taakcombinaties falen consequent over alle mergemethoden heen.
Theoretische Onderbouwing (Rate-Distortion):
De auteurs formaliseren het probleem met een dimensie-afhankelijke ondergrens. Voor representaties in $\mathbb{R}^d$ kan geen enkele convexe mergemethode een vervorming beneden een bepaalde drempel bereiken die direct gerelateerd is aan de diameter ( $\Delta$ ) van de taak-specifieke representatieclusters. Dit legt een fundamentele limiet op aan de "mergeability" van taken, onafhankelijk van de gebruikte techniek.
Nieuwe Metriek: Hidden-State Distance Similarity:
Gebaseerd op de theorie stellen de auteurs een nieuwe metriek voor: Hidden-State Distance Similarity. Deze meet de gemiddelde $L_2$ -afstand tussen de verborgen staten van verschillende modellen op dezelfde inputs. Ze introduceren ook de Merging Difficulty Score (MDS), een maatstaf die de weerstand tegen samenvoeging kwantificeert.

Resultaten

Universeel Falen: Experimenten tonen aan dat zelfs de beste mergemethoden aanzienlijke prestatieverliezen (vaak >10-20%, soms tot -100%) ondervinden bij het samenvoegen van meerdere modellen. Dit is geen technisch tekortkoming van specifieke algoritmen, maar een inherent probleem.
Taakafhankelijkheid vs. Methodedependentie: Statistische tests (ANOVA) tonen aan dat de keuze van de taakcombinatie een zeer significant effect heeft op het falen (p-waarde $\ll 0.05$ ), terwijl de keuze van de mergemethode nauwelijks invloed heeft.
Correlatie met Metrieken:
- Traditionele parameter-conflictmetrieken (zoals tekenveranderingen) tonen geen significante correlatie met merging collapse (p-waarden > 0.05).
- De nieuwe Hidden-State Distance Similarity toont een sterke correlatie met merging succes/falen. Taken met een hoge MDS (lage representatieve overeenkomst) leiden bijna altijd tot catastrofale instorting.
Validatie: Door taken met een hoge MDS te vervangen door taken met een lage MDS (hogere compatibiliteit), kon de prestatie na het samenvoegen aanzienlijk worden verbeterd, wat de praktische bruikbaarheid van de theorie bevestigt.

Betekenis en Conclusie

Deze studie verschaft een fundamenteel inzicht in de beperkingen van model-merging:

Paradigmaverschuiving: Het weerlegt het gangbare idee dat parameterconflicten de hoofdoorzaak van falen zijn. In plaats daarvan is het de fundamentele onverenigbaarheid van wat de modellen leren (hun interne representaties) die het probleem veroorzaakt.
Theoretische Grenzen: Het biedt een wiskundige ondergrens voor hoe goed taken kunnen worden samengevoegd, gebaseerd op de geometrie van hun representatieruimte.
Praktische Richtlijnen: De voorgestelde MDS-metriek biedt een actiebaar instrument voor onderzoekers en ingenieurs om te voorspellen of een set taken succesvol kan worden samengevoegd voordat er kostbare experimenten worden uitgevoerd. Het stelt de community in staat om taakselectie te optimaliseren op basis van representatieve compatibiliteit in plaats van alleen parameter-gebaseerde heuristieken.

Kortom, het artikel beweert dat "merging collapse" een fundamenteel, door de taak bepaald fenomeen is dat verklaard kan worden door informatietheorie, en biedt een nieuwe richting voor het ontwikkelen van robuustere mergestrategieën.

An Empirical Study and Theoretical Explanation on Task-Level Model-Merging Collapse

De Verkeerde Theorie: Het is niet de "Inkt" die botst

De Ware Oorzaak: Het "Denkbeeld" is incompatibel

De Wiskundige Regel: De "Afstand" tussen ideeën

Wat betekent dit voor de toekomst?

Probleemstelling

Methodologie

Belangrijkste Bijdragen

Resultaten

Betekenis en Conclusie

Meer zoals dit

PnLCalib: Sports Field Registration via Points and Lines Optimization

Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards

Sparse Variational Student-t Processes for Heavy-tailed Modeling

Robust Training of Neural Networks at Arbitrary Precision and Sparsity

DRUPI: Dataset Reduction Using Privileged Information