Joint Hardware-Workload Co-Optimization for In-Memory Computing Accelerators

Deze paper introduceert een gezamenlijk hardware-werklast co-optimisatiekader op basis van een geoptimaliseerd evolutionair algoritme dat generaliseerbare IMC-versnellers ontwerpt die meerdere neurale netwerken efficiënt ondersteunen en zo de prestaties aanzienlijk verbeteren ten opzichte van werklast-specifieke ontwerpen.

Olga Krestinskaya, Mohammed E. Fouda, Ahmed Eltawil, Khaled N. Salama

Gepubliceerd 2026-03-05
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een superkeuken bouwt voor een groot restaurant.

In de wereld van kunstmatige intelligentie (AI) zijn neurale netwerken (de "recepten") enorm complex en verschillend. Sommige gerechten zijn kleine salades (simpele AI-modellen), andere zijn enorme buffetten met duizenden ingrediënten (grote AI-modellen).

Het probleem:
Tot nu toe bouwden keukenbouwers (de hardware-ontwerpers) hun keukens specifiek voor één gerecht. Als je een keuken bouwt die perfect is voor het maken van pizza, is die misschien niet zo goed voor het maken van sushi. Als je een keuken bouwt voor de grootste buffet, is die vaak overkill en inefficiënt voor de kleine salades. Dit is als een keuken die alleen maar grote potten heeft: je kunt er een klein kopje thee in zetten, maar het is zonde van de ruimte en energie.

De oplossing uit dit papier:
De auteurs van dit onderzoek hebben een nieuwe manier bedacht om een "Alles-in-één Superkeuken" te ontwerpen. Ze noemen dit Joint Hardware-Workload Co-Optimization.

In plaats van te vragen: "Wat is de beste keuken voor pizza?", vragen ze: "Wat is de beste keuken die zowel pizza, sushi, soep als taart even goed kan maken?"

Hier is hoe ze dat doen, vertaald naar alledaagse taal:

1. De "Meesterkok" die alles probeert (Het Genetisch Algoritme)

Stel je voor dat je een kok hebt die duizenden verschillende keukenindelingen kan bedenken.

  • De oude methode: De kok probeert willekeurig een indeling, ziet dat hij een beetje goed is, en stopt. Soms is hij erg toevallig en mist hij de perfecte oplossing.
  • De nieuwe methode (deze paper): De kok gebruikt een slimme truc. Hij begint niet met willekeurige ideeën, maar kiest eerst de meest verschillende indelingen uit (zoals een keuken met alleen maar grote tafels, een met alleen maar kleine kookplaten, en een met een mix). Dit zorgt ervoor dat hij niet vastloopt in een "lokale valkuil" (een oplossing die goed lijkt, maar niet de allerbeste is).

Daarna laat hij deze keukenindelingen door vier fases gaan:

  1. Verkenning: "Laten we alles uitproberen, zelfs rare combinaties!"
  2. Overgang: "Oké, we zien wat werkt, laten we dat verfijnen."
  3. Convergentie: "We weten nu wat goed is, laten we de details perfectioneren."
  4. Finetuning: "Laat de laatste snufjes toevoegen voor de perfecte smaak."

2. De "Twee Soorten Keukens" (RRAM vs. SRAM)

De onderzoekers testen hun idee op twee verschillende soorten keukens (geheugentechnologieën):

  • RRAM (De "Opslagkast"): Hier moeten alle ingrediënten (de gewichten van het AI-model) tegelijk in de kast passen. Je kunt niets uitwisselen. Dit is goed voor snelheid, maar de kast moet groot zijn.
  • SRAM (De "Wisselkast"): Hier kun je ingrediënten in en uit de kast halen terwijl je kookt. Je hebt een kleinere kast nodig, maar je moet vaker lopen om nieuwe ingrediënten te halen (wat tijd kost).

Het slimme aan dit onderzoek is dat hun "Superkeuken" ontwerper voor beide soorten keukens de perfecte balans vindt, afhankelijk van wat je nodig hebt.

3. Waarom is dit zo belangrijk? (De "Gereedschapskist" vs. de "Speciale Schroevendraaier")

Vroeger bouwden mensen een speciale schroevendraaier voor elke schroef (één AI-model per hardware). Dat werkt goed, maar is duur en onpraktisch als je veel verschillende schroeven hebt.
Dit papier bouwt een multitool (een Zwitsers zakmes).

  • Het resultaat: De multitool is misschien niet exact even goed als de speciale schroevendraaier voor één specifieke schroef, maar hij is veel beter dan een slechte multitool.
  • De cijfers: De onderzoekers laten zien dat hun "multitool" tot 95% energie en tijd bespaart in vergelijking met de oude methoden die probeerden één grote taak te doen. Ze slagen erin om de kloof tussen "specifiek gereedschap" en "algemeen gereedschap" bijna volledig te dichten.

4. Kosten en Technologie (De "Bouwmaterialen")

Ze gaan zelfs nog een stap verder. Ze kijken niet alleen naar de keuken, maar ook naar waar je de keuken bouwt.

  • Moet je bouwen met goedkoop, oud materiaal (oude technologie)?
  • Of met duur, ultra-geavanceerd materiaal (nieuwe technologie)?
    Ze hebben een formule bedacht die kijkt naar: Hoeveel kost het om te bouwen? versus Hoe goed werkt het? Hierdoor kunnen ze de perfecte balans vinden tussen prijs en prestatie.

Samenvatting in één zin:

Deze onderzoekers hebben een slimme, geautomatiseerde ontwerper bedacht die een universele AI-chip bouwt die niet alleen voor één taak is gemaakt, maar die voor veel verschillende taken even goed werkt, waardoor we minder energie verbruiken, minder geld uitgeven en snellere AI-systemen krijgen.

Het is alsof ze de manier hebben gevonden om één auto te bouwen die zowel een raceauto, een vrachtwagen als een gezinsauto kan zijn, zonder dat je hoeft te kiezen welke je wilt hebben.