HiAP: A Multi-Granular Stochastic Auto-Pruning Framework for Vision Transformers

Dit paper introduceert HiAP, een end-to-end trainingsframework dat Vision Transformers op meerdere granulariteiten automatisch en stochastisch inplant om de reken- en geheugenkosten op randapparaten te verminderen zonder complexe multi-stap pipelines of handmatige heuristieken.

Andy Li, Aiden Durrant, Milan Markovic, Georgios Leontidis

Gepubliceerd 2026-03-13
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat een Vision Transformer (ViT) een gigantische, hyper-intelligente chef-kok is die miljoenen foto's tegelijk moet analyseren. Deze chef is ongelooflijk goed in het herkennen van objecten, maar hij heeft een enorm probleem: hij staat in een keuken die te klein is voor zijn apparatuur. Hij heeft te veel ingrediënten nodig (geheugen) en te veel werkbladruimte (rekenkracht) om zijn gerechten te bereiden. Hierdoor kan hij niet werken in kleine keukens, zoals die in je smartphone of een slimme camera.

De huidige oplossing is vaak om de chef te dwingen om minder te koken, maar de methoden die daarvoor worden gebruikt zijn vaak omslachtig. Ze vragen een menselijke expert om te beslissen welke ingrediënten weg moeten, of ze gebruiken een ingewikkeld, meerstaps proces waarbij de chef eerst een proefmenu maakt, dan wordt geëvalueerd, en pas daarna echt begint met koken.

HiAP (Hierarchical Auto-Pruning) is een nieuwe, slimme manier om deze chef te trainen om zelf te beslissen wat hij nodig heeft. Hier is hoe het werkt, vertaald naar alledaagse taal:

1. De Twee-Lagen "Zelfreinigende" Keuken

Stel je voor dat HiAP twee soorten schakelaars heeft die de chef zelf kan bedienen:

  • De Macro-schakelaars (De Grote Knoppen): Dit zijn de schakelaars die hele kookstations (zoals de "Aandachtshoofden" of de "Voedingsnetwerken") volledig uitschakelen. Als een station niet nodig is, wordt het gewoon verwijderd. Dit bespaart enorm veel ruimte op het werkblad (geheugenbandbreedte), omdat de chef niet meer hoeft te lopen naar die lege stations.
  • De Micro-schakelaars (De Kleine Knoppen): Binnen de stations die wel blijven, kan de chef nu ook de hoeveelheid ingrediënten aanpassen. Hij kan bijvoorbeeld beslissen dat hij in een bepaalde pan niet 64 kruiden gebruikt, maar slechts 32. Dit maakt het gerecht lichter en sneller te bereiden zonder de smaak (de nauwkeurigheid) te veel te veranderen.

Het unieke aan HiAP is dat de chef beide schakelaars tegelijkertijd kan bedienen. Hij kan een heel station sluiten én tegelijkertijd de inhoud van de andere stations verkleinen.

2. De "Gumbel-Sigmoid" Magische Zandloper

Hoe leert de chef dit? In plaats van dat een mens zegt "verwijder dit", gebruikt HiAP een wiskundig trucje dat lijkt op een magische zandloper.

  • Aan het begin van de training is de zandloper nog heel losjes. De schakelaars zijn vaag en "zacht". De chef probeert uit wat er gebeurt als hij een station halfslachtig uitschakelt. Hij leert hierdoor welke routes belangrijk zijn.
  • Naarmate de tijd vordert, wordt de zandloper steeds strakker. De schakelaars worden harder. De chef begint te zien: "Ah, dit station werkt echt niet, ik doe het helemaal dicht." Of: "Deze kruiden zijn overbodig, ik doe ze weg."
  • Aan het einde zijn de schakelaars volledig hard (aan of uit). De chef heeft nu een perfect, compact recept dat hij direct kan gebruiken. Er is geen tweede ronde nodig om het te "finetunen". Hij is klaar om te koken.

3. Waarom is dit zo slim?

De meeste andere methoden zijn als een architect die eerst een plattegrond tekent, dan bouwt, en dan pas ziet dat het te zwaar is, waarna hij moet slopen en herbouwen. Dat kost tijd en energie.

HiAP is als een slimme, zelforganiserende tuin.

  • De tuinier (de computer) plant zaden (de volledige structuur).
  • De tuinier geeft de planten een signaal: "Jullie moeten binnen een bepaalde omheining blijven."
  • De planten groeien en concurreren om ruimte. De zwakke takken (onnodige onderdelen) sterven vanzelf af, terwijl de sterke takken blijven staan.
  • Uiteindelijk heb je een prachtige, compacte struik die precies past in de pot, zonder dat de tuinier handmatig elke tak heeft moeten snoeien.

Het Resultaat

Met HiAP kunnen we deze gigantische, zware AI-modellen verkleinen tot iets dat past in een gewone telefoon of drone, zonder dat ze minder goed worden in het herkennen van dingen.

  • Snelheid: Omdat de "lege stations" volledig worden verwijderd, hoeft de computer niet meer naar die lege plekken te kijken. Dit bespaart tijd en batterij.
  • Eenvoud: Er is geen dure menselijke expert nodig om te beslissen wat weg moet. Het model leert het zelf in één keer.
  • Efficiëntie: Het model wordt niet alleen kleiner, maar ook slimmer in hoe het zijn middelen gebruikt. Het houdt de belangrijke dingen vast en gooit alleen het echte rommel weg.

Kortom: HiAP is de slimme assistent die een overvolle, inefficiënte AI omtovert tot een strakke, snelle en efficiënte machine die overal mee naartoe genomen kan worden.