Death of the Novel(ty): Beyond n-Gram Novelty as a Metric for Textual Creativity

Dit onderzoek toont aan dat n-gram-nieuwheid als enige maatstaf voor tekstuele creativiteit ontoereikend is, omdat het de essentie van creativiteit (nieuwheid én geschiktheid) niet volledig vangt en bij AI-gegenereerde teksten vaak correleert met een gebrek aan pragmatiek, waardoor menselijke evaluatie of geavanceerde LLM-judges noodzakelijk zijn voor een nauwkeurige beoordeling.

Arkadiy Saakyan, Najoung Kim, Smaranda Muresan, Tuhin Chakrabarty

Gepubliceerd 2026-03-04
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

De Dood van de "Nieuwheid": Waarom een tekst niet pas creatief is als hij nog nooit gelezen is

Stel je voor dat je een nieuwe taart bakt. Als je de taart maakt met ingrediënten die nog nooit iemand heeft gebruikt, noemen we dat misschien wel "nieuw". Maar als die taart eruitziet als een modderpoel en smaakt als zeep, is hij dan echt een goed, creatief recept? Waarschijnlijk niet.

Dit is precies het probleem waar dit onderzoek over gaat. Wetenschappers hebben lang gedacht dat je de creativiteit van een tekst (geschreven door een mens of een AI) kon meten door te kijken naar hoe "nieuw" de woorden waren. Als een zin nog nooit eerder in de hele wereld op internet had gestaan, dachten ze: "Wauw, dat is creatief!"

Deze studie, geschreven door onderzoekers van universiteiten zoals Columbia en Boston, zegt echter: "Nee, dat is niet genoeg."

Hier is wat ze hebben ontdekt, vertaald naar alledaagse taal:

1. De "Nieuwheids-meter" is kapot

Vroeger gebruikten onderzoekers een soort "n-gram nieuwheids-meter". Dit is een computerprogramma dat kijkt of een zin of woordcombinatie al eerder voorkwam in de enorme databanken waar AI's van hebben geleerd.

  • De oude gedachte: Hoe nieuwer de zin, hoe creatiever.
  • De nieuwe ontdekking: De onderzoekers vroegen 26 echte schrijvers (professionals) om teksten te lezen en te beoordelen. Ze ontdekten iets verrassends: 91% van de "super-nieuwe" zinnen die door de computer als creatief werden gemarkeerd, werd door de menselijke schrijvers juist gezien als onzin of slecht geschreven.

Het is alsof je iemand een auto geeft die nog nooit eerder is gebouwd, maar die geen wielen heeft. De auto is wel "nieuw", maar hij rijdt niet.

2. Creatie heeft twee vleugels: Nieuwheid én Zin

Volgens de psychologie van creativiteit moet een creatief werk twee dingen zijn:

  1. Nieuw: Het moet origineel zijn.
  2. Geschikt (Pragmatisch): Het moet ergens zinvol zijn en in de context passen.

De onderzoekers ontdekten dat AI's (zoals OLMo en OLMo-2) vaak de balans verliezen. Als ze proberen om zo "nieuw" mogelijk te klinken, beginnen ze zinnen te maken die klinken als een droom die je niet kunt onthouden. Ze zijn origineel, maar ze maken geen zin.

  • Voorbeeld: "En zei de ochtendzegeningen in een fluistering die de stoelen verlegen maakte."
    • Dit klinkt heel nieuw en mysterieus.
    • Maar het maakt geen zin. Stoelen worden niet verlegen. Een menselijke schrijver zou dit niet als creatief zien, maar als een fout.

3. Mensen zijn nog steeds de koningen van creativiteit

De onderzoekers lieten ook de nieuwste, krachtigste AI's (zoals GPT-5 en Claude) teksten schrijven. Ze ontdekten dat deze AI's veel minder vaak echte, creatieve zinnen produceerden dan mensen. Mensen weten instinctief wanneer een metafoor werkt en wanneer het gewoon gek klinkt. AI's proberen vaak te hard om "anders" te zijn, waardoor ze de logica verliezen.

4. Kunnen AI's zichzelf beoordelen?

De onderzoekers vroegen zich af: "Kunnen we een slimme AI vragen om te beoordelen of een tekst creatief is?"
Ze testten dit. De slimste AI's konden redelijk goed zien wat een "nieuwe" zin was (zoals een mens), maar ze hadden veel moeite om te zien wat een zin was die geen zin maakte. Ze waren goed in het vinden van de pareltjes, maar slecht in het vinden van de modder.

De Grote Conclusie: Stop met alleen naar "Nieuwheid" te kijken

De boodschap van dit paper is simpel:
We mogen niet alleen kijken naar hoe zeldzaam een tekst is. Als we dat doen, belonen we AI's voor het maken van onzin.

De analogie van de tuin:
Stel je creativiteit voor als een tuin.

  • N-gram nieuwheid kijkt alleen naar hoe zeldzaam de bloemen zijn. Als je een bloem vindt die nog nooit iemand heeft gezien, is hij "nieuw".
  • Echte creativiteit kijkt of de bloem ook goed groeit in de aarde, of hij water nodig heeft en of hij er mooi uitziet in de rest van de tuin.

Deze studie zegt: "Kijk niet alleen naar hoe zeldzaam de bloem is. Kijk of hij ook echt een bloem is en of hij in de tuin past."

Als we dit niet doen, riskeren we dat de wereld vol komt te staan met teksten die klinken als een vreemde droom, maar die niemand echt begrijpt of waardeert. Creativiteit is niet alleen het vinden van iets nieuws; het is het vinden van iets nieuws dat werkt.