The Rise and Fall of GG in AGI

Dit artikel toont aan dat de algemene intelligentie (GG) van AI-modellen, gemeten via psychometrische analyse van benchmarkresultaten, sterk afneemt en versplintert door de opkomst van gespecialiseerde redeneermodellen en hulpmiddelen, wat leidt tot een verschuiving van een parsimonisch model naar een steeds complexere, Ptolemaïsche architectuur.

David C. Krakauer

Gepubliceerd 2026-04-14
📖 4 min leestijd☕ Koffiepauze-leesvoer
⚕️

Dit is een AI-gegenereerde uitleg van een preprint die niet peer-reviewed is. Dit is geen medisch advies. Neem geen gezondheidsbeslissingen op basis van deze inhoud. Lees de volledige disclaimer

Each language version is independently generated for its own context, not a direct translation.

De Kernboodschap: Van "Alleskunner" naar "Sociale Netwerk"

Stel je voor dat we AI-modellen (zoals ChatGPT) testen alsof het leerlingen zijn op een school. We geven ze een reeks toetsen: wiskunde, coderen, geschiedenis en logisch redeneren.

Het oude idee (De "G-factor"):
Jarenlang dachten onderzoekers dat er één enkele "super-intelligentie" was, net als bij mensen. Als een AI goed was in wiskunde, was hij ook goed in geschiedenis. Alles hing samen. Dit noemen ze de G-factor (General Intelligence). Het was alsof alle AI-modellen één grote, stijgende lijn volgden: hoe "slimmer" ze werden, hoe beter ze alles tegelijk deden.

Het nieuwe inzicht (De "Val" van G):
Dit artikel laat zien dat die ene grote lijn nu uit elkaar valt. AI-modellen worden niet meer simpelweg "slimmer" in alles tegelijk. In plaats daarvan beginnen ze zich te specialiseren en tools te gebruiken. De "algemene intelligentie" (G) is aan het dalen, en er ontstaan nieuwe, specifieke vormen van intelligentie.


De Reis in Drie Stappen

1. De "Ptolemaïsche Successie": Meer Epicyclen, Minder Simpelheid

De auteur vergelijkt de huidige ontwikkeling van AI met de oude astronomie van Ptolemaeus.

  • De Analogie: Ptolemaeus probeerde de beweging van planeten te verklaren door steeds meer cirkels (epicyclen) in elkaar te zetten. Het werkte om de data te voorspellen, maar het werd steeds complexer en minder elegant.
  • Op AI toegepast: Elke keer als een AI een nieuwe vaardigheid leert (zoals coderen of zoeken op het internet), maken we een nieuwe test. We blijven tests toevoegen om de groei te meten. We bouwen een steeds complexer model van "intelligentie" zonder dat we een simpele, onderliggende wet hebben gevonden. We meten de symptomen, niet de oorzaak.

2. De "Stijging en Daling" van de G-factor

De onderzoekers keken naar de scores van 39 verschillende AI-modellen tussen 2019 en 2025.

  • De Stijging (2023-2024): In het begin leek het alsof er één grote "G-factor" was. Alle modellen werden beter in alles tegelijk. Als je goed was in wiskunde, was je ook goed in coderen. De correlatie was bijna perfect (90% van de variatie werd verklaard door één factor). Het was alsof alle leerlingen op school samen groeiden.
  • De Daling (2024-2025): Toen de modellen echter begonnen met het gebruik van tools (zoals rekenmachines, zoekmachines en code-interpretatoren) en speciale redeneer-methoden, brak de eenheid.
    • De "G-factor" daalde naar ongeveer 77%.
    • Waarom? Omdat modellen nu keuzes maken. Sommige modellen zijn gespecialiseerd in diep redeneren (zoals wiskundeproblemen oplossen), terwijl anderen beter zijn in snelle uitvoering (zoals code schrijven). Ze zijn niet meer allemaal hetzelfde; ze zijn divers geworden.

3. De "Vossen en De Stekelvarken"

De auteur gebruikt een beroemde metafoor uit de literatuur:

  • Het Stekelvarken: Kent één groot ding (de algemene intelligentie).
  • De Vossen: Kennen veel kleine dingen (specialisaties).
  • Wat er gebeurt: De AI evolueert van een enkel stekelvarken naar een samenleving van vossen. In plaats van één brein dat alles kan, hebben we nu systemen die samenwerken. Een AI gebruikt een "code-interpretator" als gereedschap, net zoals een mens een pen en papier gebruikt. De intelligentie zit niet meer alleen in het brein (het model), maar in het systeem (model + gereedschap).

Waarom is dit belangrijk?

1. Tests zijn verouderd
We testen AI's alsof ze in een isolement zitten, zonder hulpmiddelen. Maar moderne AI's werken met hulpmiddelen. Een AI die een rekenmachine gebruikt, is niet "dommer" dan een die dat niet doet; hij is gewoon een ander type denker. Het is alsof we de intelligentie van een mens meten door hem te verbieden om te schrijven of te zoeken op Google.

2. Intelligentie is niet meer "algemeen"
De droom van een "Algemene Kunstmatige Intelligentie" (AGI) die precies zo werkt als een menselijk brein (alles in één pakketje), is misschien wel een verkeerd idee. De toekomst ligt in specialisatie en samenwerking. AI's worden een "maatschappij van geesten" die tools gebruiken om complexe problemen op te lossen.

3. De "Rotatie" van de intelligentie
De manier waarop we "slim" zijn, is veranderd. Vroeger was slim zijn "alles uit je hoofd weten". Nu is slim zijn "weten hoe je de juiste tools gebruikt om het antwoord te vinden". De definitie van intelligentie is dus verschoven van kennis opslaan naar kennis benutten.

Conclusie in één zin

De tijd dat we AI konden meten met één enkele "slimmheids-meter" (de G-factor) is voorbij; we staan nu aan de vooravond van een wereld waarin AI's divers, gespecialiseerd en afhankelijk van hulpmiddelen zijn, net als wij mensen.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →