Idempotent Slices with Applications to Code-Size Reduction

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een enorme, rommelige garage hebt vol met gereedschap. Je hebt honderden hamers, duizenden schroevendraaiers en talloze sleutels. Veel van deze tools zijn exact hetzelfde, maar ze staan verspreid over de hele garage: één op de plank, één in de la, en nog een onder een stapel doeken.

Als je de garage wilt opruimen en kleiner wilt maken (zodat hij makkelijker te vervoeren is), zou je die dubbele gereedschappen kunnen samenvoegen. Maar hier zit de kluif: wat als die dubbele gereedschappen niet naast elkaar staan, maar verspreid liggen tussen andere, unieke spullen? En wat als je ze verplaatst, je per ongeluk een muur breekt of een deur blokkeert?

Dit is precies het probleem dat dit wetenschappelijke artikel aanpakt, maar dan voor computerprogramma's in plaats van een garage.

Hier is een uitleg in gewone taal, met een paar creatieve vergelijkingen:

1. Het Probleem: De "Rommelige" Code

Programma's zijn vaak gebouwd als een reusachtig labyrint van instructies. Soms doet een computer precies hetzelfde stukje werk op twee of drie verschillende plekken in dat labyrint.

De oude aanpak: Bestaande tools konden alleen die stukken vinden die naast elkaar lagen (zoals twee identieke hamers die op één plank staan). Als de dubbele stukken ver uit elkaar lagen (bijvoorbeeld één in de keuken en één in de slaapkamer), zagen ze die niet.
Het risico: Als je een stukje code verplaatst zonder goed te kijken, kan het programma crashen of fouten gaan geven. Het is alsof je een muur weghaalt in je huis zonder te weten of daar een steunbalk in zit.

2. De Oplossing: "Idempotente Slices" (De Onveranderlijke Taart)

De auteurs van dit paper hebben een nieuwe manier bedacht om deze dubbele stukken te vinden, zelfs als ze ver uit elkaar liggen. Ze noemen dit een "Idempotent Backward Slice".

Laten we dit uitleggen met een taartvergelijking:
Stel je voor dat je een taart maakt.

De "Slice" (Het stukje): Dit is een specifiek receptje binnen het grote recept. Bijvoorbeeld: "Meng suiker, eieren en bloem".
Idempotent: Dit betekent "herhaalbaar zonder schade". Als je dit mengsel drie keer maakt met dezelfde ingrediënten, krijg je elke keer exact hetzelfde mengsel. Het maakt de wereld niet kapot, het verandert niets buiten de kom.
De Backward Slice: Dit is het vinden van alle stappen die nodig zijn om dat ene mengsel te maken, terugwerkend naar de basis.

De auteurs zeggen: "Als we dit specifieke, veilige stukje taartrecept kunnen vinden, kunnen we het uit het grote recept knippen, in een apart boekje zetten, en op de plekken waar het nodig is, gewoon zeggen: 'Kijk in boekje X voor dit mengsel'."

3. De Magische Bril: GSA (De Landkaart met Verkeersborden)

Hoe vinden ze deze stukken nu zo goed? Ze gebruiken een speciale manier om naar het programma te kijken, genaamd Gated Static Single Assignment (GSA).

De vergelijking: Stel je voor dat je een oude, handgetekende landkaart hebt (de oude manier). Daarop zie je alleen wegen. Soms weet je niet welke afslag je moet nemen als het regent of als het zonnig is.
De GSA-kaart: Dit is een moderne, digitale navigatiekaart. Hij heeft niet alleen wegen, maar ook verkeersborden die precies zeggen: "Als het regent (predicaat A), ga dan links. Als het zonnig is (predicaat B), ga dan rechts."

Door deze "verkeersborden" (de poorten of 'gates') toe te voegen, kunnen de auteurs precies zien welke instructies veilig zijn om te verplaatsen, zelfs als ze door een ingewikkeld labyrint van 'als-dan'-regels lopen. Ze zien nu duidelijk welke stukken een "veilig eiland" vormen dat je kunt verplaatsen zonder de rest van de stad (het programma) te verstoren.

4. Het Resultaat: Een Kleinere Garage

Wat gebeurt er als ze deze techniek toepassen?

Ze zoeken naar die veilige, herhaalbare stukjes code (de taartrecepten).
Ze knippen ze uit.
Ze kijken of ze diezelfde stukjes ergens anders ook hebben.
Als dat zo is, maken ze één kopie en laten de computer daarheen verwijzen.

Het effect:

De code wordt kleiner. In sommige tests werd de grootte van het programma met wel 7% tot 12% verkleind. Dat is alsof je een zware koffer 10% lichter maakt door dubbele sokken te verwijderen.
Snelheid: Het programma wordt niet trager. Soms zelfs sneller, omdat de computer minder ruimte hoeft te scannen (net als een kleinere garage die sneller te vinden is).
Veiligheid: Het programma breekt niet. De auteurs hebben bewezen dat deze "verplaatsing" wiskundig veilig is.

5. Waarom is dit speciaal?

Vroeger waren de gereedschappen om code te verkleinen (zoals de "IROutliner" of "FMSA") als een schaar die alleen rechte lijnen kon knippen. Als de dubbele stukken in een zigzagpatroon lagen, kon de schaar ze niet pakken.

Deze nieuwe methode is als een lasermes dat door de hele structuur kan snijden, ongeacht hoe krom of ingewikkeld de weg is. Het kan zelfs stukken uit verschillende functies samenvoegen die eerder onbereikbaar leken.

Samenvattend

Dit paper introduceert een slimme manier om computerprogramma's op te schonen. Ze gebruiken een speciale "landkaart" (GSA) om veilige, herhaalbare stukjes code te vinden, zelfs als die verspreid liggen over het hele programma. Ze knippen die stukjes uit en maken er één gemeenschappelijke versie van.

Het resultaat? Kleinerere bestanden, minder opslagruimte nodig, en soms zelfs snellere programma's, zonder dat de computer ooit "dwaalt" of fouten maakt. Het is alsof je een rommelige garage omtovert tot een strakke, efficiënte werkplaats, zonder dat je ooit je gereedschap kwijtraakt.

Each language version is independently generated for its own context, not a direct translation.

Hier is een gedetailleerde technische samenvatting van het paper "Idempotent Slices with Applications to Code-Size Reduction" in het Nederlands.

Titel: Idempotente Slices met Toepassingen voor Vermindering van Codegrootte

Auteurs: Rafael Alvarenga de Azevedo et al. (UFMG, Brazilië; Huawei, VK)
Context: LLVM Compiler-infrastructuur, Program Slicing, Code-Size Reduction.

1. Het Probleem

Bestaande technieken voor het reduceren van de codegrootte (zoals het samenvoegen van functies of het uitsnijden van codeblokken) hebben beperkingen wanneer het gaat om het identificeren van redundante code die niet-contigu is of zich binnen complexe controle-flow structuren bevindt.

Bestaande methoden: Eerdere werken (zoals die van Guimaraes en Pereira) gebruikten een informeel concept van "idempotente slices" om evaluatie van 'eager' naar 'lazy' om te zetten. Dit algoritme faalt echter in twee belangrijke scenario's:
1. Het werkt niet correct op programma's die niet voldoen aan de "conventionele" Static Single Assignment (CSSA) eigenschap (bijv. variabelen met overlappende live-ranges via $\phi$ -functies).
2. Het faalt bij controle-flow grafieken (CFG's) die geen "hammock"-structuur hebben (d.w.z. grafieken die niet eenvoudig kunnen worden ontbonden in single-entry/single-exit regio's).
Het doel: Een robuust, sound (correct) en efficiënt algoritme ontwikkelen om idempotente achterwaartse slices te extraheren, zelfs in complexe CFG's, om deze te gebruiken voor code-size reduction door redundante slices te samenvoegen.

2. Methodologie

De auteurs introduceren een nieuwe aanpak gebaseerd op Idempotente Achterwaartse Slices in Gated Static Single Assignment (GSA) vorm.

A. Definitie van Idempotente Slices

Een idempotente achterwaartse slice is een maximaal subprogramma dat een specifieke waarde berekent, met de volgende eigenschappen:

Single-Entry: De slice vormt een regio met één ingangspunt.
Idempotentie: Het uitvoeren van de slice meerdere keren met dezelfde invoerwaarden levert exact dezelfde resultaten op en verandert de waarneembare staat van het programma niet (geen zij-effecten, geen uitzonderingen, alleen lezen van immutable geheugen).
Verschil met traditionele slicing: In tegenstelling tot dichte slices (die alle instructies beïnvloeden die de waarde bepalen), is een idempotente slice een referentieel transparante functie die één waarde definieert. Het mag de loop waarin de criterium-variabele is gedefinieerd niet verlaten, anders zou het meerdere waarden berekenen.

B. De Rol van GSA (Gated SSA)

Om de beperkingen van eerdere werken te overwinnen, converteren de auteurs het programma naar Gated Static Single Assignment (GSA) vorm (volgens Tu en Padua).

In standaard SSA worden $\phi$ -functies gebruikt om waarden te samenvoegen, maar de controle-predicaten die bepalen welke waarde wordt gekozen, zijn impliciet.
GSA vervangt $\phi$ $ϕ$ -functies door expliciete poort-instructies:
- $\gamma$ -instructies: Voor samenvoegpunten (vervangen $\phi$ ), gekoppeld aan een Booleaanse predicaat die het pad beschrijft.
- $\mu$ -instructies: Voor loopkoppen.
- $\eta$ -instructies: Voor het "gaten" van waarden bij het verlaten van een loop of conditie.
Door deze expliciete controle-afhankelijkheden te hebben, kan het algoritme correcte slices extraheren zonder de noodzaak van een hammock-structuur of CSSA.

C. Het Algoritme

Het proces verloopt in vier stappen:

Identificatie: Een achterwaartse doorloop van de afhankelijkheidsgrafiek (in GSA vorm) start vanaf een criterium-variabele. De doorloop stopt bij:
- Functieparameters (intra-procedureel).
- $\mu$ -instructies op dezelfde loopdiepte (om te voorkomen dat de slice de loop verlaat).
Uitsnijden (Outlining): De geïdentificeerde instructies worden gekloond naar een nieuwe functie. De controle-flow binnen de slice wordt gereconstrueerd met behulp van "Transposition" (behoud van interne randen) en "Attraction" (herleiding van externe randen naar de eerste dominator binnen de slice).
Identificatie van Gemeenschappelijke Slices: Uitgelichte functies worden vergeleken op isomorfie (structuur en instructies) met behulp van LLVM's mergefunc pass.
Samenvoegen en Kostenmodel: Als twee of meer slices identiek zijn, worden ze samengevoegd tot één functie. Een kostenmodel bepaalt of dit voordelig is voor de codegrootte (gebaseerd op instructieaantal, parameters en aantal calls).

3. Belangrijkste Bijdragen

Formalisatie: De eerste formele definitie en correcte algoritme voor het extraheren van idempotente achterwaartse slices in GSA-vorm, die werkt op algemene controle-flow grafieken.
Soundness: Het bewijzen dat correcte slices kunnen worden geëxtraheerd uit GSA-programma's, zelfs zonder CSSA-eigenschappen of hammock-structuren.
Implementatie: Een robuuste implementatie in LLVM 17.0.6 die het volledige LLVM-testsuite (2007 programma's) aankan.
Code-Size Reduction (SBCR): Een nieuwe optimalisatie (Slice-Based Code-Size Reduction) die niet-contigu en niet-geordende instructies kan samenvoegen, zelfs binnen dezelfde functie, wat een uniek voordeel biedt ten opzichte van bestaande tools zoals IROutliner of FMSA.

4. Resultaten

De auteurs evalueerden hun aanpak op het LLVM-testsuite (2007 programma's) vergeleken met IROutliner en FMSA (Function Merging by Sequence Alignment).

Codegrootte:
- Voor programma's die baat hebben bij de optimalisatie, bereikte SBCR een geometrisch gemiddelde reductie van -7,24% in de .text sectie (bij 29 programma's).
- In specifieke benchmarks zoals AMGmk werd een reductie van -12,49% bereikt (bovenop de standaard -Os optimalisaties).
- SBCR is complementair aan andere technieken; het vindt redundante patronen die andere tools missen, en vice versa.
Uitvoeringstijd: Er is geen statistisch significant verlies in runtime (gemiddelde variatie +0,06%). In sommige gevallen verbeterde de prestatie door betere instructie-cache-localiteit.
Compilatietijd: De optimalisatie voegt gemiddeld 4,22% compilatie- overhead toe. Dit is acceptabel gezien de code-reductie.
Complexiteit: Hoewel het algoritme theoretisch $O(N^2)$ is (waarbij $N$ het aantal instructies is), gedraagt het zich in de praktijk nagenoeg lineair ( $O(N)$ ) omdat de meeste slices klein zijn en slechts een klein aantal voldoet aan het kostenmodel.
Combinatie: Het combineren van SBCR met IROutliner en FMSA levert de grootste reducties op (tot -14,43% instructie-aantal in de beste volgorde).

5. Betekenis en Conclusie

Dit paper introduceert een fundamenteel nieuwe manier om redundantie in code te benaderen: niet als contigu blokken, maar als semantisch coherente, idempotente berekeningen.

Innovatie: Het gebruik van GSA vorm maakt het mogelijk om slices te extraheren in situaties waar eerdere methoden faalden (bijv. complexe loops en niet-SSA-compatibele structuren).
Praktische impact: De techniek biedt een krachtig middel voor embedded systemen en andere domeinen waar codegrootte kritiek is, zonder de uitvoeringstijd significant te beïnvloeden.
Toekomst: De auteurs zien idempotente slices als een nieuwe abstractie voor het elimineren van redundantie en plannen verdere verfijning van kostenmodellen en integratie met profiel-gestuurde optimalisatie (PGO).

De implementatie is open source beschikbaar via de GitHub-repository van de auteurs.