Large Language Models Readability Classification: A… — Begrijpelijke uitleg

Oorspronkelijke auteurs: Corrale de Matos, H. G., Wasmann, J.-W. A., Catalani Morata, T., de Freitas Alvarenga, K., Bornia Jacob, L. C.

Gepubliceerd 2026-03-02

📖 4 min leestijd☕ Koffiepauze-leesvoer

Bekijk op medRxiv ↗PDF ↗

CC BY 4.0

Oorspronkelijke auteurs: Corrale de Matos, H. G., Wasmann, J.-W. A., Catalani Morata, T., de Freitas Alvarenga, K., Bornia Jacob, L. C.

Oorspronkelijk artikel gelicentieerd onder CC BY 4.0 (https://creativecommons.org/licenses/by/4.0/). ⚕️ Dit is een AI-gegenereerde uitleg van een preprint die niet peer-reviewed is. Dit is geen medisch advies. Neem geen gezondheidsbeslissingen op basis van deze inhoud. Lees de volledige disclaimer

De Kernboodschap: Zelfs slimme robots praten niet allemaal even makkelijk

Stel je voor dat je een heel belangrijke medische vraag stelt, bijvoorbeeld over gehoorverlies. Je wilt een antwoord dat niet alleen waar is, maar ook begrijpelijk voor een gemiddelde mens. Je vraagt dit aan zeven verschillende, super-slimme kunstmatige intelligenties (zoals ChatGPT, Claude, Gemini, etc.).

Dit onderzoek kijkt naar twee verrassende dingen:

De robots zijn niet allemaal even goed in 'simpel praten'.
De meetlat om te zien hoe 'simpel' iets is, werkt ook niet altijd hetzelfde.

1. De Robots en de "Wikipedia-Bril"

De situatie:
De onderzoekers gaven de robots twee taken.

Taak A (De basis): "Vertel me wat je weet over gehoorverlies."
Taak B (Met Wikipedia): "Vertel me wat je weet over gehoorverlies, maar kijk eerst in Wikipedia voor de feiten."

Het resultaat (De vergelijking):

Zonder Wikipedia: Alle robots praten ongeveer even makkelijk. Het is alsof ze allemaal een standaard uniform dragen. Ze zijn allemaal redelijk begrijpelijk.
Met Wikipedia: Zodra ze de instructie kregen om naar Wikipedia te kijken, ging het mis. De robots werden heel verschillend.
- Sommige robots (zoals een bepaalde versie van ChatGPT) bleven heel simpel praten, alsof ze de moeilijke woorden uit Wikipedia eruit haalden.
- Andere robots (zoals een bepaalde versie van Copilot) begonnen te klinken als een professor die net een boek heeft gelezen. Ze gebruikten heel moeilijke woorden en zinnen, zelfs als ze dezelfde informatie uit Wikipedia haalden.

De les:
Het is alsof je zeven verschillende koks dezelfde ingrediënten (Wikipedia) geeft om een soep te maken.

De ene kok maakt een romige, lichte soep die iedereen kan drinken.
De andere kok maakt een soep met hele grote, harde stukken groente die je niet kunt kauwen.
Conclusie: Het feit dat een robot "gebaseerd is op feiten" (Wikipedia) betekent niet automatisch dat het antwoord voor een patiënt makkelijk te begrijpen is. Soms maakt het juist moeilijker!

2. De Meetlat is Verwarrend

De onderzoekers gebruikten vijf verschillende "meetlatten" (wiskundige formules) om te zien hoe moeilijk een tekst is. Denk aan deze meetlatten als vijf verschillende weegschalen.

Meetlat 1 (FRE): Kijkt naar zinslengte en woordlengte.
Meetlat 2 (SMOG): Telt woorden met veel lettergrepen.
Meetlat 3, 4, 5: Kijken naar andere dingen, zoals het aantal letters per woord.

Het probleem:
Als je dezelfde tekst op deze vijf schalen legt, geven ze verschillende resultaten.

Schaal 1 zegt: "Dit is makkelijk, een 10-jarige kan dit lezen."
Schaal 2 zegt: "Dit is erg moeilijk, dit is voor een doctorandus."

De les:
Je kunt niet zomaar één meetlat kiezen en zeggen: "Oké, dit is de waarheid." Het is alsof je je gewicht meet op een schaal die je in de badkamer hebt, en dan op een schaal in de sportschool. Ze geven verschillende getallen. Als je wilt weten of een medisch advies goed is, moet je alle vijf de schalen gebruiken, niet alleen één.

Waarom is dit belangrijk voor jou?

Stel je voor dat je een medisch advies krijgt van een app of een chatbot.

Als de app te moeilijk is (te veel moeilijke woorden), begrijp je het niet. Je gaat dan misschien niet naar de dokter, terwijl je dat wel moet doen.
Als de app te makkelijk is, maar onjuist, is het ook gevaarlijk.

Deze studie zegt: "Pas op!"
Zelfs als we zorgen dat de informatie waar is (door Wikipedia te gebruiken), kunnen we per ongeluk zorgen dat de informatie onbegrijpelijk wordt. En omdat elke robot (LLM) anders werkt, moet je voor elke nieuwe robot opnieuw controleren of de taal nog wel begrijpelijk is.

Samenvattend in één zin:

Het is niet genoeg om te vragen of een robot het antwoord kent; je moet ook controleren of de robot het antwoord uitlegt in een taal die jij kunt begrijpen, want elke robot doet dat op zijn eigen, soms heel moeilijke, manier.

Large Language Models Readability Classification: A Variability Analysis of Sources and Metrics

De Kernboodschap: Zelfs slimme robots praten niet allemaal even makkelijk

1. De Robots en de "Wikipedia-Bril"

2. De Meetlat is Verwarrend

Waarom is dit belangrijk voor jou?

Samenvattend in één zin:

Titel: Classificatie van leesbaarheid door Large Language Models: Een variabiliteitsanalyse van bronnen en metrics

1. Probleemstelling

2. Methodologie

3. Belangrijkste Resultaten

A. Variabiliteit tussen Modellen (H1)

B. Variabiliteit tussen Metrics (H2)

4. Kernbijdragen en Innovatie

5. Betekenis en Implicaties

Large Language Models Readability Classification: A Variability Analysis of Sources and Metrics

De Kernboodschap: Zelfs slimme robots praten niet allemaal even makkelijk

1. De Robots en de "Wikipedia-Bril"

2. De Meetlat is Verwarrend

Waarom is dit belangrijk voor jou?

Samenvattend in één zin:

Titel: Classificatie van leesbaarheid door Large Language Models: Een variabiliteitsanalyse van bronnen en metrics

1. Probleemstelling

2. Methodologie

3. Belangrijkste Resultaten

A. Variabiliteit tussen Modellen (H1)

B. Variabiliteit tussen Metrics (H2)

4. Kernbijdragen en Innovatie

5. Betekenis en Implicaties

Meer zoals dit