Hate Speech Detection using Large Language Models with Data Augmentation and Feature Enhancement

Each language version is independently generated for its own context, not a direct translation.

Hate Speech Detecteren: Een Simpele Uitleg in het Nederlands

Stel je voor dat het internet een gigantisch, drukke markt is. Op deze markt verkopen de meeste mensen mooie producten (normale berichten), maar er zijn ook een paar mensen die giftige spullen verkopen (haatberichten). Het probleem is dat deze giftige verkopers zich vaak verstoppen, vermommen of heel slim praten, zodat de bewakers (de moderatoren) ze niet direct zien.

De auteurs van dit onderzoek, een team van Monash University in Australië, hebben gekeken hoe we deze giftige verkopers het beste kunnen opsporen. Ze hebben verschillende "detectiemethoden" getest, variërend van simpele regels tot super-slimme kunstmatige intelligentie (AI).

Hier is wat ze hebben ontdekt, vertaald naar alledaagse taal:

1. De Drie Helden in de Strijd

De onderzoekers hebben drie soorten "detectives" tegen elkaar laten strijden:

De Oude Varken (Delta TF-IDF): Dit is een simpele, traditionele methode. Het kijkt alleen naar welke woorden vaak voorkomen. Het is als een bewaker die alleen let op woorden als "slecht" of "haat". Als je die woorden niet gebruikt, ziet hij je niet.
De Slimme Studenten (Transformer-modellen zoals BERT en RoBERTa): Dit zijn slimme AI's die context begrijpen. Ze weten dat "wat een mooi weer" soms sarcastisch kan zijn. Ze lezen de hele zin en begrijpen de nuance.
De Super-Genie (gpt-oss-20b): Dit is een zeer grote, moderne AI. Het is als een detective die alles heeft gelezen, alles begrijpt en zelfs de subtiele gedachten achter de woorden kan lezen.

2. De Uitdaging: Vermommingen

De markt heeft twee soorten gevaar:

Duidelijk Giftig: Iemand schreeuwt hardop dat hij haat. Dit is makkelijk te zien (zoals op het forum Stormfront).
Verborgen Giftig: Iemand gebruikt code, sarcasme of subtiele hints om haat te verspreiden zonder de regels te overtreden (zoals in de Hate Corpus). Dit is veel moeilijker te vangen.

3. De Trucs om Beter te Worden (Data Augmentatie & Feature Enhancement)

Omdat er veel minder giftige verkopers zijn dan normale mensen (een onevenwichtige verdeling), moeten de detectives getraind worden om de kleine groep beter te zien. De onderzoekers hebben vier trucs getest:

De Fotokopie-truc (SMOTE): Ze maken kunstmatige voorbeelden van haatberichten om de AI meer te laten oefenen.
- Resultaat: Dit werkte soms goed, maar soms maakte het de AI alleen maar verward, vooral bij de subtiele, verborgen haat. Het was alsof je iemand te veel voorbeelden van een specifiek type misdrijf geeft, waardoor hij denkt dat alles dat type misdrijf is.
De Grammatica-bril (POS Tagging): Ze gaven de AI een bril die let op de grammatica (werkwoorden, bijvoeglijke naamwoorden, etc.).
- Resultaat: Dit was een veilige, stabiele truc. Het hielp een beetje, maar veranderde de wereld niet. Het was als een extra paar brillenglazen: handig, maar geen wondermiddel.
De Vermommingstruc (Data Augmentatie): Ze veranderden de zinnen in de training: ze voegden fouten toe, veranderden woorden in synoniemen of herschreven zinnen, maar hielden de boodschap hetzelfde.
- Resultaat: Dit was de grootste verrassing! De simpele "Oude Varken" (Delta TF-IDF) werd hierdoor een superheld. Op het forum Stormfront (waar de haat heel duidelijk is) schoot deze simpele methode omhoog naar 98,2% nauwkeurigheid. De super-slimme AI's (zoals gpt-oss-20b) deden het ook goed, maar ze waren al zo slim dat deze truc minder extra voordeel gaf.

4. De Grote Winnaar

Wie won de wedstrijd?

De Super-Genie (gpt-oss-20b) was overal het beste. Het had de hoogste scores op bijna alle tests. Het begrijpt de context het allerbeste.
De Slimme Studenten (RoBERTa) deden het ook uitstekend en zijn veel sneller en goedkoper om te draaien. Een prima alternatief als je niet de zwaarste computerkracht hebt.
De Oude Varken deed het slecht op zijn eentje, maar met de juiste "vermommingstruc" (data augmentation) kon hij op simpele taken bijna net zo goed zijn als de slimme AI's.

5. De Belangrijkste Les

De belangrijkste conclusie is dat er geen "one size fits all" oplossing is.

Als je duidelijke haat moet opsporen (zoals scheldwoorden), werkt zelfs een simpele methode heel goed, zeker als je de training slim maakt.
Als je verborgen, subtiele haat moet opsporen, heb je echt de slimme AI's nodig die context begrijpen.
Het hangt er altijd van af: wat voor soort "markt" (dataset) heb je en welke "detective" (model) gebruik je?

Kortom: Om haat op het internet te vangen, heb je niet alleen een sterke AI nodig, maar ook de juiste trainingsmethode. Soms helpt het om de simpele methoden slim te maken, en soms moet je gewoon de slimste AI van de stad inhuren. En ja, het is nog steeds heel moeilijk om degenen te vangen die zich heel slim verstoppen!

Hate Speech Detection using Large Language Models with Data Augmentation and Feature Enhancement

1. De Drie Helden in de Strijd

2. De Uitdaging: Vermommingen

3. De Trucs om Beter te Worden (Data Augmentatie & Feature Enhancement)

4. De Grote Winnaar

5. De Belangrijkste Les

Probleemstelling

Methodologie

Belangrijkste Bijdragen

Resultaten

Betekenis en Conclusie

Hate Speech Detection using Large Language Models with Data Augmentation and Feature Enhancement

1. De Drie Helden in de Strijd

2. De Uitdaging: Vermommingen

3. De Trucs om Beter te Worden (Data Augmentatie & Feature Enhancement)

4. De Grote Winnaar

5. De Belangrijkste Les

Probleemstelling

Methodologie

Belangrijkste Bijdragen

Resultaten

Betekenis en Conclusie

Meer zoals dit

The Structure of Service Level Agreement of Slice-based 5G Network

Digital currency hardware wallets and the essence of money

Adaptive aggregation of Monte Carlo augmented decomposed filters for efficient group-equivariant convolutional neural network

Positionality in Σ_0^2 and a completeness result

Slightly Non-Linear Higher-Order Tree Transducers