Intelligence per Watt: Measuring Intelligence Efficiency of Local AI

Dit onderzoek introduceert de metriek 'intelligentie per watt' om aan te tonen dat lokale inferentie van kleine taalmodellen op krachtige apparaten steeds efficiënter wordt en een aanzienlijk deel van de vraag aan centrale cloudinfrastructuur kan overnemen.

Jon Saad-Falcon, Avanika Narayan, Hakki Orhun Akengin, J. Wes Griffin, Herumb Shandilya, Adrian Gamarra Lafuente, Medhya Goel, Rebecca Joseph, Shlok Natarajan, Etash Kumar Guha, Shang Zhu, Ben Athiwaratkun, John Hennessy, Azalia Mirhoseini, Christopher Ré

Gepubliceerd 2026-02-27
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

🧠 De Kernvraag: Kan je laptop de "supercomputer" vervangen?

Stel je voor dat de wereldwijde vraag naar slimme AI (zoals ChatGPT) een enorme drukte is op een superhighway. Tot nu toe moeten al die auto's (vragen) naar één gigantisch, duur en energievretend parkeergarage in de cloud rijden om daar hun werk te laten doen. Deze garage raakt overvol, het kost veel geld en stroom, en de files worden steeds langer.

De onderzoekers van dit papier stellen een nieuw idee voor: Waarom rijden we niet met de auto's naar huis?

Ze kijken of we de slimme AI-taken kunnen verplaatsen naar onze eigen laptops en telefoons (de "lokale" apparaten). Maar er is een probleem: onze laptops hebben minder kracht en minder batterij dan die grote datacenters.

📏 De Nieuwe Maatstaf: "Intelligentie per Watt"

Hoe meet je of dit een goed idee is? Je kunt niet alleen kijken naar hoe slim het antwoord is, en je kunt niet alleen kijken naar hoe snel het gaat. Je moet kijken naar de efficiëntie.

De auteurs introduceren een nieuwe maatstaf: Intelligentie per Watt (IPW).

  • De Analogie: Denk aan een auto. Je wilt niet alleen weten hoe snel hij kan rijden (snelheid), maar ook hoeveel kilometer hij rijdt op één liter benzine (efficiëntie).
  • In dit onderzoek: Hoeveel "slim antwoord" krijg je voor elke eenheid stroom die je verbruikt? Als je laptop een antwoord geeft dat net zo goed is als de supercomputer, maar met 10 keer minder stroom, dan wint de laptop.

🔍 Wat hebben ze ontdekt? (De Drie Grote Verrassingen)

De onderzoekers hebben een enorme test gedaan met 1 miljoen echte vragen (van kattenplaatjes maken tot wiskundige raadsels) en 20 verschillende AI-modellen op 8 verschillende soorten hardware (van Apple Macs tot enorme server-chips).

1. Je laptop kan al het meeste werk doen 🏠

Vroeger dachten we dat alleen de "giganten" (de grootste AI-modellen) goed werk leverden. Maar nu blijkt dat kleine modellen (die op je laptop passen) 88,7% van alle vragen correct kunnen beantwoorden!

  • Creatieve taken (zoals een verhaal schrijven of een idee bedenken): Je laptop doet dit vaak beter dan 90% van de tijd.
  • Technische taken (zoals complexe engineering): Hier is het nog iets lastiger (ongeveer 68%), maar dat is nog steeds heel indrukwekkend.
  • Conclusie: Voor bijna elke dagelijkse vraag hoef je niet meer naar de cloud te reizen.

2. De "Superkracht" groeit razendsnel 🚀

Tussen 2023 en 2025 is er een enorme sprong gemaakt.

  • De Analogie: Stel je voor dat je in 2023 een fiets had die 10 km/h reed. In 2025 heb je ineens een elektrische scooter die 53 km/h haalt, terwijl hij net zo veel batterij verbruikt.
  • De Feit: De "Intelligentie per Watt" is 5,3 keer beter geworden in twee jaar tijd. Dit komt door twee dingen:
    1. De AI-modellen zelf zijn slimmer geworden (beter leren).
    2. De hardware (chips in je laptop) is efficiënter geworden.
  • In 2023 konden lokale apparaten maar 23% van de vragen goed beantwoorden. In 2025 is dat gestegen naar 71%.

3. De "Slimme Router" bespaart enorm 🛣️

Wat als we een slimme verkeersleider hebben die elke vraag kijkt en beslist: "Is dit een simpele vraag? Dan stuur ik hem naar je laptop. Is het een super-moeilijke vraag? Dan stuur ik hem naar de cloud."?

  • Als we dit slim doen, kunnen we 60% tot 80% besparen op energie, rekenkracht en kosten.
  • De Analogie: Het is alsof je voor een simpele boodschap (melk halen) niet met een vrachtwagen gaat, maar met je fiets. Alleen voor de zware lasten (een piano verhuizen) gebruik je de vrachtwagen.
  • Zelfs als de verkeersleider niet 100% perfect is (bijvoorbeeld 80% goed), bespaar je al bijna net zoveel als met een perfecte planner.

🌍 Waarom is dit belangrijk?

  1. Minder stroomverbruik: Datacenters verbruiken nu al zoveel stroom dat het de netten op de rand van de afbraak brengt. Lokale AI helpt de druk te verlagen.
  2. Sneller en privaat: Antwoorden komen direct van je eigen apparaat, zonder vertraging en zonder dat je data naar een centraal punt hoeft te reizen.
  3. Toekomst: De onderzoekers zeggen dat we nu op een kantelpunt staan. Net zoals computers vroeger van grote mainframes naar je eigen bureau verhuisden (door efficiëntie), gebeurt dat nu weer met AI.

🏁 Samenvatting in één zin

Dit onderzoek bewijst dat onze eigen laptops en telefoons snel genoeg en slim genoeg worden om het grootste deel van de AI-werklast van de dure, energievretende datacenters over te nemen, mits we slimme routes kiezen om de vragen te verdelen.

De boodschap: De toekomst van AI is niet alleen in de wolken, maar ook in je broekzak. En dat is goed voor je portemonnee én voor het milieu.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →