The Price of Prompting: Profiling Energy Use in Large Language Models Inference

Dit paper introduceert MELODI, een raamwerk en bijbehorende dataset voor het monitoren en analyseren van het energieverbruik bij inferentie van grote taalmodellen, waarbij wordt aangetoond dat promptkenmerken een aanzienlijke invloed hebben op de energie-efficiëntie en de noodzaak onderstreept wordt voor duurzamere implementaties.

Erik Johannes Husom, Arda Goknil, Lwin Khin Shar, Sagar Sen

Gepubliceerd 2026-03-04
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

De Prijs van een Vraag: Hoeveel Energie Kost het om een AI te laten Denken?

Stel je voor dat je een zeer slimme, maar ook zeer hongerige robot hebt. Deze robot is een Grote Taalmodel (LLM), zoals de AI's die we vandaag de dag gebruiken om teksten te schrijven, code te maken of vragen te beantwoorden.

Vroeger dachten we alleen aan de energie die nodig was om deze robot te leren (trainen). Maar nu, elke keer als jij een vraag stelt ("prompt") en de robot een antwoord geeft, eet hij weer een stukje van het elektriciteitsnet op. Dit noemen we inference (het "denken" van de AI).

De onderzoekers van dit paper hebben een nieuw gereedschap bedacht, genaamd MELODI, om precies te meten hoeveel "eten" (energie) deze robot nodig heeft voor elke vraag. Hier is wat ze hebben ontdekt, vertaald naar alledaagse taal:

1. Het Nieuwe Gereedschap: MELODI

Stel je voor dat je wilt weten hoeveel calorieën je verbrandt terwijl je loopt. Je zou een slim horloge op je pols doen en misschien een sensor op je schoenen.

  • Anderen keken vaak alleen naar het hele huis (het systeem) om te zien hoeveel stroom er verbruikt werd. Dat is onnauwkeurig, want als je ook nog de koelkast en de tv aan hebt, weet je niet hoeveel de loopband precies kostte.
  • MELODI is als een super-slim horloge dat alleen op de robot kijkt. Het meet precies hoeveel stroom de CPU (de hersenen) en de GPU (de spieren) van de AI gebruiken, terwijl het de rest van de computer negeert. Ze hebben zelfs een "buffer" (een kleine wachttijd) toegevoegd, zodat ze niet per ongeluk een stukje van de start of de stop missen, net zoals je een stopwatch niet te vroeg zou stoppen.

2. De Grote Ontdekkingen

A. De Grootte van de Robot maakt het Verschil
Het grootste verschil zit in de grootte van de AI.

  • Kleine modellen (zoals een slimme smartphone-app) zijn als een fiets: ze verbruiken weinig energie.
  • Grote modellen (met 70 miljard "neuronen") zijn als een vrachtwagen. Ze verbruiken 100 keer meer energie per woord dat ze genereren dan de kleine modellen.
  • Conclusie: Als je een simpel vraagje hebt, gebruik dan een kleine robot. Gebruik geen vrachtwagen om een postzegel te dragen.

B. Het Antwoord is Belangrijker dan de Vraag
Veel mensen denken: "Als ik een heel ingewikkelde, moeilijke vraag stel, kost dat meer energie."

  • Niet waar! De onderzoekers ontdekten dat de complexiteit van je vraag bijna geen invloed heeft op de energierekening.
  • Wat telt wel? De lengte van het antwoord.
  • Analogie: Het maakt niet uit of je vraagt "Wat is de lucht?" of "Leg uit waarom de lucht blauw is met een gedicht erbij". De energie wordt verbruikt door het schrijven van het antwoord. Hoe langer het antwoord (hoe meer woorden/token), hoe meer energie. Het antwoord is de "brandstof" die de motor laat draaien.

C. De Locatie van de Robot (Hardware)
Waar de AI draait, is ook belangrijk.

  • Een AI draaiend op een laptop is vaak minder efficiënt dan op een krachtige werkplek-computer of server.
  • Analogie: Het is alsof je probeert een zware last te dragen. Op een krachtige rugzak (werkplek) gaat het soepel. Op een klein, oud rugzakje (laptop) moet je veel meer moeite doen en zweten (meer energie verbruiken) om hetzelfde gewicht te tillen.

3. Kunnen we het Voorspellen?

Ja! De onderzoekers hebben een simpele formule bedacht die bijna perfect werkt (99,6% nauwkeurig).

  • Als je weet hoe lang het antwoord wordt, welke AI je gebruikt en op welke computer het draait, kun je precies voorspellen hoeveel stroom het kost.
  • Je hoeft niet te weten of je vraag moeilijk was. Als je het antwoord wilt beperken tot 50 woorden, bespaar je direct veel energie.

4. Waarom is dit belangrijk?

We gebruiken AI steeds meer. Als iedereen elke dag duizenden vragen stelt aan enorme AI-modellen, wordt de energierekening gigantisch en slecht voor het milieu.

De boodschap voor ons allemaal:

  1. Kies de juiste tool: Gebruik niet altijd de zwaarste AI voor simpele taken.
  2. Kort en krachtig: Vraag om korte antwoorden. "Geef me 3 tips" kost minder dan "Geef me een essay van 5 pagina's".
  3. Wees bewust: Elke keer dat je een AI iets laat schrijven, verbruikt het stroom. Door slimme keuzes te maken (korte antwoorden, juiste model), kunnen we de "prijs van het prompten" verlagen.

Kortom: MELODI is de energiemeter die ons laat zien dat we niet alleen moeten kijken naar wat we vragen, maar vooral naar hoe lang het antwoord is en welke robot we er voor inzetten.