Beyond Via: Analysis and Estimation of the Impact of Large Language Models in Academic Papers

Deze studie analyseert hoe het gebruik van grote taalmodellen de woordkeuze in academische papers beïnvloedt, waarbij wordt vastgesteld dat huidige detectiemodellen moeite hebben om specifieke modellen te onderscheiden en dat het gebruik van deze tools in de praktijk heterogeen en dynamisch is.

Mingmeng Geng, Yuhang Dong, Thierry Poibeau

Gepubliceerd 2026-03-27
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

🧐 De Digitale "Handtekening" van AI in Wetenschappelijke Papers

Stel je voor dat wetenschappelijke papers (zoals die op arXiv) een enorme bibliotheek zijn waar onderzoekers hun werk neerleggen. Vroeger schreven mensen deze artikelen volledig zelf, met hun eigen stijl en woordkeuze. Maar nu, met de komst van Grote Taalmodellen (LLMs) zoals ChatGPT, Claude en Gemini, is er een nieuwe schrijver in de bibliotheek: de robot.

De auteurs van dit artikel (Mingmeng Geng en collega's) hebben gekeken of ze de "geur" van deze robots kunnen ruiken in de teksten. Ze hebben niet gekeken naar de inhoud van de wetenschap, maar naar de woorden die gebruikt worden.

1. De "Via" en "Beyond" Epidemie

Stel je voor dat je een groep vrienden ziet die allemaal plotseling dezelfde rare zinnen gaan gebruiken. Bijvoorbeeld: "Ik ben via de trein gekomen" of "Dit onderzoek gaat beyond de grenzen".

  • Wat ze ontdekten: De robots hebben een voorliefde voor bepaalde woorden. Woorden als "via" en "beyond" komen veel vaker voor in titels van papers die door AI zijn geschreven of bewerkt.
  • Het effect: Sinds 2025 zie je deze woorden ook steeds vaker in echte menselijke papers. Het is alsof de robots een mode hebben bedongen die nu door de hele bibliotheek wordt overgenomen. Mensen kopiëren onbewust de stijl van de machines.

2. De Verdwenen "De" en "Van"

Aan de andere kant zijn er woorden die de robots niet leuk vinden. Woorden als "the" en "of" (in het Engels) zijn heel gewoon voor mensen, maar robots vinden ze soms saai of overbodig.

  • De analogie: Het is alsof een robot een schilderij maakt en besluit dat de lucht (die meestal blauw is) te saai is, dus hij laat hem wit. In de abstracts (samenvattingen) van papers zien we dat het gebruik van deze simpele woorden daalt. De robots maken de zinnen "strakker", maar op een manier die voor ons menselijk oog net iets te perfect en onnatuurlijk voelt.

3. De Robot is niet altijd dezelfde

Een belangrijk punt is dat niet alle robots hetzelfde praten.

  • Vergelijking: Stel je voor dat je drie verschillende vertalers hebt: één uit Parijs, één uit Berlijn en één uit Tokio. Als je ze allemaal vraagt om een verhaal te vertellen, zullen ze allemaal hetzelfde verhaal vertellen, maar met verschillende woorden en zinsopbouw.
  • Het onderzoek: De auteurs hebben gekeken naar modellen van OpenAI (GPT), DeepSeek, Google (Gemini) en Anthropic (Claude). Ze ontdekten dat elk model zijn eigen "handtekening" heeft.
    • Sommige modellen houden van woorden als "furthermore" (overigens).
    • Andere modellen gebruiken woorden als "together" (samen) of "delve" (duiken in) op een manier die typisch is voor hun versie.
    • Maar: Naarmate de robots slimmer worden, beginnen ze op elkaar te lijken. Het is alsof ze allemaal naar dezelfde school gaan en steeds meer op elkaar gaan lijken.

4. Kunnen we ze onderscheiden? (De Detectie)

De onderzoekers hebben geprobeerd een computerprogramma te bouwen dat kan zeggen: "Dit stukje tekst is geschreven door een mens, en dit door een GPT-5."

  • Het resultaat: Dat is lastiger dan gedacht.
    • Als je vraagt: "Is dit mens of AI?", werkt het redelijk goed (ongeveer 80-90% zekerheid).
    • Maar als je vraagt: "Welke specifieke AI heeft dit geschreven?", raken de programma's in de war. De robots lijken zo veel op elkaar dat de "detective" vaak de verkeerde verdachte aanwijst.
  • De les: Het is heel moeilijk om te zeggen welke specifieke machine een tekst heeft gemaakt, omdat ze steeds meer op elkaar gaan lijken.

5. Hoeveel AI zit er nu in de bibliotheek?

Omdat het moeilijk is om elke tekst één voor één te checken, hebben de auteurs een slimme truc gebruikt. Ze kijken naar de statistieken.

  • De analogie: Stel je voor dat je een grote pot met rode en blauwe kralen hebt. Als je ziet dat er plotseling veel meer rode kralen in zitten dan er normaal zouden moeten zijn (gebaseerd op een lijn die je in het verleden hebt getrokken), weet je dat er iemand nieuwe rode kralen heeft gegooid.
  • De bevinding: Ze hebben berekend dat het gebruik van AI in academische papers snel groeit. Vooral sinds 2023/2024 is er een duidelijke "krimp" in het gebruik van menselijke woorden en een "groei" in robot-woorden. Het is een dynamisch proces: de robots veranderen, en de mensen veranderen mee.

🎯 Conclusie in één zin

Dit onderzoek laat zien dat AI niet alleen teksten schrijft, maar ook de taal van de wetenschap zelf aan het veranderen is. We zien een nieuwe "robot-stijl" ontstaan die steeds meer door mensen wordt overgenomen, en het wordt steeds moeilijker om te zien wie er eigenlijk aan het stuur zit: de mens of de machine.

Het is alsof de bibliotheek langzaam verandert van een plek waar mensen praten, naar een plek waar mensen en robots samen een nieuwe, hybride taal spreken.

Verdrinkt u in papers in uw vakgebied?

Ontvang dagelijkse digests van de nieuwste papers die bij uw onderzoekswoorden passen — met technische samenvattingen, in uw taal.

Probeer Digest →