ROSE: Reordered SparseGPT for More Accurate One-Shot Large Language Models Pruning

Dit paper introduceert ROSE, een geoptimaliseerde versie van SparseGPT die door middel van een twee-niveau herschikking van de pruning-sequentie gebaseerd op geschatte verlieswaarden, de prestaties van één-slag (one-shot) pruning van grote taalmodellen aanzienlijk verbetert.

Mingluo Su, Huan Wang

Gepubliceerd 2026-03-09
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een gigantische bibliotheek hebt, vol met boeken die een kunstmatige intelligentie (zoals een chatbot) heeft geleerd. Deze bibliotheek is zo groot dat hij niet in één kamer past; hij heeft een heel gebouw nodig. Om deze bibliotheek sneller en goedkoper te kunnen gebruiken op een gewone laptop of telefoon, willen we sommige boeken weggooien. Dit noemen we "pruning" (het snoeien).

Het probleem is: welke boeken goo je weg? Als je per ongeluk de verkeerde boeken weggooit, vergeet de computer belangrijke dingen en wordt hij dom.

Het oude probleem: De "Links-na-Rechts" regel

Een populaire manier om dit te doen, heet SparseGPT. Dit werkt als een slimme bibliothecaris die zegt: "We gaan de boeken van links naar rechts doorlopen. Als een boek er niet belangrijk uitziet, gooien we het weg en passen we de rest van de boeken een beetje aan om het gat op te vullen."

Maar er zit een addertje onder het gras. In sommige delen van de bibliotheek zitten de boeken niet willekeurig verspreid. Er zijn groepen boeken die heel sterk op elkaar lijken en dicht bij elkaar staan (dit noemen de auteurs een "kolomvormig patroon").

Als de bibliothecaris (SparseGPT) deze groepen in de verkeerde volgorde aanpakt, gaat het mis. Hij gooit eerst de "makkelijke" boeken weg, en laat de "moeilijke" boeken voor het laatst. Maar op het moment dat hij die moeilijke boeken moet weggooien, zijn er al te veel andere boeken weggehaald om het gat op te vullen. Het resultaat is een rommelige bibliotheek die veel minder goed werkt.

De oplossing: ROSE (De Slimme Sorteerder)

De onderzoekers van dit paper hebben een nieuwe methode bedacht, genaamd ROSE.

Stel je voor dat je in plaats van stiekem links-na-rechts te werken, eerst even een proefronde doet. Je kijkt naar alle boeken en zegt: "Oké, als ik dit specifieke boek nu zou weggooien, hoeveel moeite kost het om het gat op te vullen?"

ROSE doet precies dit:

  1. De Proef: Het kijkt naar de boeken en berekent welke boeken het "gevaarlijkst" zijn om weg te gooien (de boeken met de grootste "pruning loss").
  2. De Ommezwaai: In plaats van ze in de oude volgorde te houden, draait ROSE de volgorde om. De boeken die het gevaarlijkst zijn om weg te gooien, worden nu als eerste verwijderd.
  3. Waarom werkt dit? Omdat je ze als eerste weggooit, zijn er nog alle andere boeken beschikbaar om het gat op te vullen. Je hebt dus meer hulpbronnen om de schade te herstellen. De boeken die minder belangrijk zijn, blijven voor het laatst.

De Twee Trucs van ROSE

ROSE werkt op twee niveaus, net als het organiseren van een grote opslagkast:

  • Binnen de lade (Kolommen): Binnen één groep boeken (een blok), sorteert ROSE de boeken zodat de gevaarlijkste bovenaan liggen.
  • De hele kast (Blokken): ROSE kijkt ook naar de hele lade. Als een hele lade heel veel gevaarlijke boeken heeft, wordt die lade als eerste aangepakt.

Hoe weet ROSE wie het moet doen?

Niet elke bibliotheek heeft dit probleem. Sommige bibliotheken zijn al willekeurig genoeg. ROSE heeft een slimme sensor die kijkt: "Zie ik hier een patroon van groepen boeken die sterk op elkaar lijken?"

  • Als het antwoord ja is, dan gebruikt ROSE zijn slimme sorteermethode.
  • Als het antwoord nee is, doet hij gewoon wat de oude methode deed.

Het Resultaat

Door deze slimme volgorde te kiezen, blijft de bibliotheek (het AI-model) veel slimmer en accurater, zelfs als je heel veel boeken weggooit. In tests met bekende modellen (zoals LLaMA) bleek ROSE veel beter te presteren dan de oude methode, zonder dat het veel langer duurt om de bibliotheek te sorteren.

Kortom: ROSE is als een slimme bibliothecaris die niet blindelings links-na-rechts werkt, maar eerst kijkt welke boeken het belangrijkst zijn om eerst weg te halen, zodat de rest van de bibliotheek perfect kan worden aangepast. Het resultaat is een kleinere, snellere bibliotheek die nog steeds alles weet.