NOTAI.AI: Explainable Detection of Machine-Generated Text via Curvature and Feature Attribution

Each language version is independently generated for its own context, not a direct translation.

Hier is een uitleg van het paper over NOTAI.AI, vertaald naar begrijpelijk Nederlands met behulp van alledaagse metaforen.

🕵️‍♂️ NOTAI.AI: De Detective die niet alleen zegt "Wie", maar ook "Waarom"

Stel je voor dat je een brief ontvangt. Je vraagt je af: "Is dit geschreven door een mens of door een computer (een AI)?" Vroeger waren er systemen die alleen een cijfer gaven, bijvoorbeeld "85% kans dat dit een AI is". Dat is als een leraar die alleen een cijfer op je toets zet zonder de fouten aan te geven. Je weet dan niet waarom je die punten hebt verloren.

NOTAI.AI is een nieuw systeem dat doet alsof het een detective is. Het kijkt niet alleen naar het antwoord, maar legt ook uit waarom het tot die conclusie komt. Het combineert drie verschillende soorten "sporen" om de waarheid te vinden.

🧩 De drie detectivesporen (De 17 kenmerken)

Het systeem gebruikt 17 verschillende manieren om te kijken of tekst echt of nep is. We kunnen deze indelen in drie teams:

De Wiskundige (De "Kromme Lijn"):
- De metafoor: Stel je voor dat je een berg beklimt. Een mens wandelt soms een beetje slordig, maakt kleine omwegen en stapt onregelmatig. Een AI loopt echter vaak als een perfect gepolijste glijbaan: heel glad en voorspelbaar.
- Wat het doet: NOTAI.AI meet de "kromming" van de tekst. Als de tekst te glad en te perfect is (zoals een AI), slaat het alarm. Dit heet Conditional Probability Curvature.
De Taalkundige (De "Stijl"):
- De metafoor: Een mens gebruikt soms rare zinnen, herhaalt woorden per ongeluk, of gebruikt heel veel uitdrukkingen die we "koffieklap" noemen. Een AI is vaak te beleefd, te herhalend of gebruikt woorden die te "standaard" klinken.
- Wat het doet: Het telt zinnen, kijkt naar de woordenschat (hoe rijk is de taal?) en let op leestekens. Is de tekst saai en herhalend? Dan is het waarschijnlijk een AI.
De Neuronale Expert (De "Gevoelige Neus"):
- De metafoor: Dit is een andere, slimme computer die zelf veel heeft gelezen. Het heeft een "gevoel" voor tekst. Als het iets leest dat klinkt als iets dat een AI zou schrijven, zegt het: "Hey, dit ruikt verdacht."
- Wat het doet: Een speciaal getraind model (ModernBERT) geeft een score op basis van hoe de tekst klinkt in de "oorsprong" van de taal.

🧠 De Hoofddetective (De "Meta-classifier")

Al deze drie teams sturen hun bevindingen naar één hoofddetective: een XGBoost-model.

De analogie: Denk aan een jury. De Wiskundige, de Taalkundige en de Neuronale Expert geven allemaal hun mening. De hoofddetective luistert naar iedereen, weegt de bewijzen af en neemt de uiteindelijke beslissing.
Het resultaat: Omdat het systeem naar alle sporen tegelijk kijkt, is het veel slimmer dan als je maar naar één spoor zou kijken.

💡 De "Waarom"-machine (Uitlegbaarheid)

Dit is het belangrijkste deel van NOTAI.AI. Veel andere systemen zeggen alleen: "Dit is een AI." Maar NOTAI.AI zegt: "Dit is een AI, en hier is waarom:"

SHAP (De Scorekaart): Het systeem gebruikt een wiskundige methode (SHAP) om te berekenen welk spoor het zwaarst heeft gewogen.
De Vertaler (LLM): Wiskundige scores zijn saai voor gewone mensen. Daarom gebruikt NOTAI.AI een slimme taalcomputer (een LLM) om die scores om te zetten in gewone, menselijke zinnen.
- Voorbeeld: In plaats van "SHAP-waarde van kromming is 0.45", zegt het systeem: "De tekst is te glad en te voorspelbaar, wat typisch is voor een computer."

🌐 De Interactieve Speelplaats

Het systeem is niet alleen een stuk code; het is een webapplicatie die je kunt gebruiken.

Wat kun je doen? Je plakt je tekst in een vakje.
Wat zie je? Je krijgt een score (Mens vs. AI) en een lijstje met de belangrijkste redenen.
De "Ablatie"-functie: Dit is een coole optie. Je kunt in de interface zelf kiezen om bepaalde sporen uit te schakelen (bijvoorbeeld: "Wat als we de 'kromme lijn' negeren?"). Dan zie je direct hoe de beslissing verandert. Het is alsof je de detective vraagt: "Wat als we dit bewijs niet meenemen?"

🏆 Wat leert dit ons?

De onderzoekers hebben getest of dit werkt. Ze hebben een dataset gebruikt die ze eerlijk hebben gemaakt (evenveel menselijke als AI-teksten).

Resultaat: Het systeem is extreem goed (96% nauwkeurig).
De les: Als je verschillende soorten bewijzen combineert (wiskunde, stijl en neurale netwerken), krijg je een veel betrouwbaarder resultaat dan als je maar één methode gebruikt.

🚀 Conclusie

NOTAI.AI is een hulpmiddel dat ons helpt om de waarheid te vinden in een wereld vol AI-teksten. Het is niet alleen slim, maar ook eerlijk en transparant. Het laat je zien waarom het een beslissing neemt, zodat jij als gebruiker zelf kunt oordelen, in plaats van blindelings op een computer te vertrouwen.

Het is alsof je niet alleen een diagnose krijgt van een dokter, maar ook een duidelijke uitleg over welke symptomen tot die diagnose hebben geleid.

NOTAI.AI: Explainable Detection of Machine-Generated Text via Curvature and Feature Attribution

🕵️‍♂️ NOTAI.AI: De Detective die niet alleen zegt "Wie", maar ook "Waarom"

🧩 De drie detectivesporen (De 17 kenmerken)

🧠 De Hoofddetective (De "Meta-classifier")

💡 De "Waarom"-machine (Uitlegbaarheid)

🌐 De Interactieve Speelplaats

🏆 Wat leert dit ons?

🚀 Conclusie

Probleemstelling

Methodologie: NOTAI.AI

Belangrijkste Resultaten

Bijdragen en Significantie

NOTAI.AI: Explainable Detection of Machine-Generated Text via Curvature and Feature Attribution

🕵️‍♂️ NOTAI.AI: De Detective die niet alleen zegt "Wie", maar ook "Waarom"

🧩 De drie detectivesporen (De 17 kenmerken)

🧠 De Hoofddetective (De "Meta-classifier")

💡 De "Waarom"-machine (Uitlegbaarheid)

🌐 De Interactieve Speelplaats

🏆 Wat leert dit ons?

🚀 Conclusie

Probleemstelling

Methodologie: NOTAI.AI

Belangrijkste Resultaten

Bijdragen en Significantie

Meer zoals dit

Speculative Decoding Scaling Laws (SDSL): Throughput Optimization Made Simple

Summarize Before You Speak with ARACH: A Training-Free Inference-Time Plug-In for Enhancing LLMs via Global Attention Reallocation

DeReason: A Difficulty-Aware Curriculum Improves Decoupled SFT-then-RL Training for General Reasoning

MDER-DR: Multi-Hop Question Answering with Entity-Centric Summaries

Markovian Generation Chains in Large Language Models