Identifying and Evaluating Inactive Heads in Pretrained LLMs

Dit onderzoek identificeert en evalueert inactieve attention-heads in vooraf getrainde grote taalmodellen door middel van diverse scoresystemen en modelinterventies, waarbij wordt vastgesteld dat gemiddeld meer dan 12% van deze heads kan worden verwijderd zonder noemenswaardig verlies van prestaties, en dat methoden die uitsluitend op attentieweights vertrouwen het aantal inactieve heads onderschatten.

Pedro Sandoval-Segura, Xijun Wang, Ashwinee Panda, Micah Goldblum, Ronen Basri, Tom Goldstein, David Jacobs

Gepubliceerd 2026-03-03
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Titel: Het "Slapende Helden"-probleem in slimme computers

Stel je voor dat een grote taalmodel (zoals een slimme chatbot) niet één brein is, maar een gigantisch team van 1000 kleine specialisten die allemaal tegelijk werken. Deze specialisten noemen we "attention heads" (aandachtshoofden). Hun job is om te kijken naar de woorden in een zin en te beslissen: "Welk woord is nu belangrijk?"

In dit nieuwe onderzoek ontdekten de auteurs een verrassend geheim: een groot deel van dit team slaapt eigenlijk de hele dag. Ze zitten in de kamer, kijken mee, maar doen eigenlijk niets. Ze zijn "inactief".

Hier is hoe het onderzoek werkt, vertaald in een simpel verhaal:

1. Het oude idee: "Kijk naar wie er naar de eerste persoon kijkt"

Vroeger dachten onderzoekers dat ze de slapende specialisten konden vinden door te kijken naar wie er naar het eerste woord in de zin kijkt.

  • De analogie: Stel je voor dat je een vergadering hebt. Als een specialist alleen maar naar de voorzitter (het eerste woord) staart en die voorzitter zegt niets belangrijks, dan is die specialist waarschijnlijk lui.
  • Het probleem: De auteurs ontdekten dat dit een valstrik is. Soms kijken specialisten naar de voorzitter, maar doen ze nog steeds nuttig werk. En soms kijken ze naar niemand en doen ze ook niets, maar dat zag je niet met de oude methode. Het was alsof je alleen de mensen telde die naar de klok kijken, en vergeten was dat er ook mensen zijn die gewoon in de leegte staren.

2. De nieuwe methode: "Kijk naar wat ze eigenlijk doen"

De auteurs bedachten een betere manier om te zien wie er echt niets doet. Ze keken niet naar naar wie ze kijken, maar naar wat ze produceren.

  • De analogie: In plaats van te kijken naar wie er naar de voorzitter kijkt, kijken we naar het werkstuk dat elke specialist aflevert. Als een specialist een werkstuk maakt dat zo klein is dat het bijna niet bestaat (bijna nul), dan is die specialist inactief. Het maakt niet uit of hij naar de voorzitter, de achterwand of de deur kijkt; als zijn bijdrage aan het eindresultaat verwaarloosbaar klein is, kan hij weg.

Ze testten 12 verschillende manieren om dit te meten, maar de beste methode was simpelweg: "Hoe groot is het eindproduct van deze specialist?"

3. Het experiment: "De ontslagronde"

Om te bewijzen dat deze specialisten echt niet nodig waren, deden ze een experiment:

  • Ze namen een slimme computer en zetten de output van deze "slapende" specialisten op nul. Alsof ze die mensen uit de vergadering haalden of hun pen uit hun hand namen.
  • Het resultaat: Het team bleef bijna even goed presteren! Zelfs als ze meer dan 12% van de specialisten uitschakelden, bleef de computer net zo slim als voorheen.
  • De les: We hebben al die extra mensen niet nodig. Ze kosten alleen maar energie en tijd.

4. Waarom is dit belangrijk?

  • Efficiëntie: Als we weten wie er slaapt, kunnen we die delen van de computer uitschakelen. Dat betekent dat de computer sneller werkt en minder stroom verbruikt.
  • Geen "one size fits all": Ze ontdekten ook dat elke familie van computers (Llama, Qwen, OLMo) een beetje anders werkt. Wat voor de ene computer een slapende specialist is, werkt voor de ander misschien wel. Maar de methode van "kijk naar het eindproduct" werkt overal het beste.
  • Training: Ze ontdekten ook dat als je een computer "bijleert" (finetuning), de slaapgedrag van de specialisten nauwelijks verandert. Ze blijven gewoon slapen, ongeacht wat je hen leert.

Samenvatting in één zin

Dit onderzoek laat zien dat grote AI-modellen veel "dode gewicht" hebben; door simpelweg te kijken naar wat de onderdelen daadwerkelijk produceren in plaats van waar ze naar kijken, kunnen we een groot deel van de computer uitschakelen zonder dat de slimme antwoorden minder goed worden. Het is alsof je een orkest ontdekt dat halfvol zit met muzikanten die alleen maar meeblazen, en je merkt dat het orkest net zo mooi klinkt als je die stilhoudt.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →