Development of a natural language processing application to extract and categorize mentions of violence from mental healthcare records text

Deze studie ontwikkelde en valideerde een succesvol NLP-model op basis van BERT dat vrij tekst uit psychiatrische elektronische patiëntendossiers analyseert om diverse vormen van geweld en gerelateerde contextuele factoren te extraheren en te categoriseren, hoewel het detecteren van tijdsaspecten minder goed lukte.

Li, L., Sondh, S., Sondh, H. K., Stewart, R., Roberts, A.

Gepubliceerd 2026-03-26
📖 5 min leestijd🧠 Diepgaand
⚕️

Dit is een AI-gegenereerde uitleg van een preprint die niet peer-reviewed is. Dit is geen medisch advies. Neem geen gezondheidsbeslissingen op basis van deze inhoud. Lees de volledige disclaimer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat de medische dossiers van mensen met psychische problemen een enorme, onleesbare bibliotheek zijn. In deze bibliotheek staan duizenden verhalen geschreven in vrije tekst, vol met nuances en gevoelens. Vaak vertellen patiënten hierin over geweld dat ze hebben meegemaakt of zelf hebben gepleegd, maar deze verhalen zijn niet als een simpele 'ja/nee'-vakje opgeslagen. Ze zijn verstopt in zinnen als "De patiënt vertelde over een onrustige jeugd waarin er vaak werd geslagen" of "Er is sprake van financiële controle door de partner".

De onderzoekers van dit paper wilden een slimme digitale bibliothecaris bouwen die deze verstoppe verhalen kan vinden, begrijpen en sorteren.

Hier is hoe ze dat deden, vertaald naar alledaagse taal:

1. Het Probleem: De Naald in de Hooiberg

In de digitale dossiers (EHR) van een grote geestelijke gezondheidszorg in Zuid-Londen staan veel verhalen over geweld. Maar computers zijn niet slim genoeg om automatisch te zien wat er echt gebeurt. Ze zien alleen woorden, maar niet de context.

  • Voorbeeld: Als er staat "geen geweld", denkt een simpele computer misschien dat het om geweld gaat. Als er staat "ik ben bang dat hij mij zal slaan", is dat een dreiging, geen daad.
  • Het doel: Ze wilden een computerprogramma maken dat niet alleen ziet dat er over geweld wordt gesproken, maar ook begrijpt:
    • Wat voor soort geweld? (Lichamelijk, seksueel, emotioneel, of financieel?)
    • Wie is wie? (Is de patiënt het slachtoffer, de dader, of een getuige?)
    • Waar en wanneer? (Thuis of ergens anders? Vroeger of nu?)
    • Is het echt gebeurd of is het een dreiging/gedachte?

2. De Oplossing: De "Super-Lesboek" (NLP & BERT)

Om dit te doen, gebruikten ze een technologie die NLP (Natural Language Processing) heet. Je kunt dit zien als een zeer slimme robot die leest alsof hij een mens is. Ze gebruikten een specifiek type robot genaamd BERT.

Stel je BERT voor als een student die een super-lesboek heeft gekregen.

  • Het lesboek: De onderzoekers namen 6.500 stukjes tekst uit de dossiers en lieten twee menselijke experts deze stukjes handmatig labelen. Ze maakten een streng regelsysteem (een "codeboek") waarin precies stond wat "emotioneel geweld" is versus "financieel geweld", en wat het verschil is tussen een "dader" en een "slachtoffer".
  • De training: De robot (BERT) kreeg 90% van deze gelabelde stukjes om te studeren. Hij leerde patronen: "Ah, als het woord 'manipulatie' staat en er staat 'partner' bij, dan is het waarschijnlijk emotioneel geweld thuis."
  • De examen: Daarna kregen ze de robot een examen (de overige 10% van de data) waar hij nog nooit van had gehoord, om te zien of hij het echt begrepen had.

3. De Resultaten: Een Slimme, maar Niet Perfecte Robot

De robot deed het verrassend goed, maar had ook zijn zwakke plekken.

Wat ging er fantastisch?

  • Het detecteren van emoties en geld: De robot was heel goed in het vinden van verhalen over emotionele mishandeling (F1-score 0.89) en financiële mishandeling (0.88). Hij kon bijvoorbeeld goed zien als iemand werd gecontroleerd op zijn geld of constant werd uitgescholden.
  • Rolherkenning: Hij kon heel goed onderscheid maken tussen iemand die geweld pleegde (dader) en iemand die het onderging (slachtoffer).
  • Huiselijk geweld: Hij herkende goed of het geweld thuis plaatsvond.

Waar struikelde de robot?

  • Tijdsreizen: De robot had moeite met het bepalen wanneer het geweld plaatsvond. Als er staat "ik werd als kind mishandeld", is dat duidelijk. Maar als de tekst vaag is, of als artsen in het verleden-tijd schrijven over iets dat nu gebeurt, raakt de robot de draad kwijt. Hij kon niet goed zeggen of het "vandaag" of "10 jaar geleden" was.
  • Getuigen: Er waren te weinig voorbeelden in de data waarin iemand alleen een getuige was van geweld (bijvoorbeeld: "Ik zag mijn moeder slaan"). Omdat de robot dit zelden zag in zijn lesboek, kon hij dit niet goed herkennen.
  • Seksueel geweld: Hij vond dit wel, maar miste soms de details (hij zag het niet altijd als hij er was).

4. Waarom is dit belangrijk? (De "Gouden Sleutel")

Vroeger waren onderzoekers als detectives die blindelings in een donkere kamer moesten zoeken naar bewijs. Ze moesten handmatig duizenden dossiers doorbladeren om te zien of geweld een rol speelde bij psychische klachten.

Met deze nieuwe "slimme bibliothecaris" kunnen onderzoekers nu:

  • Grote patronen zien: Ze kunnen in één klap kijken naar honderdduizenden dossiers om te zien: "Is er een link tussen financiële mishandeling en depressie?" of "Hoe vaak komt het voor dat slachtoffers van huiselijk geweld ook daders worden?"
  • Betere zorg: Het helpt artsen om sneller te zien of een patiënt in gevaar is, zodat ze beter kunnen helpen.

Conclusie

De onderzoekers hebben een krachtig nieuw gereedschap gebouwd dat de "ruis" in medische dossiers omzet in heldere data. Het is alsof ze een bril hebben gemaakt die ons laat zien wat er echt gebeurt in de verhalen van patiënten, waardoor we beter kunnen begrijpen hoe geweld en psychische gezondheid met elkaar verweven zijn. De robot is nog niet perfect (vooral de tijdreizen gaat hem nog niet af), maar hij is een enorme stap vooruit in het helpen van mensen en het verbeteren van onderzoek.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →