Extracting patient reported cannabis use and reasons for use from electronic health records: a benchmarking study of large language models

Deze benchmarkstudie toont aan dat het combineren van een fijngefineerd klinisch taalmodel en LLM-based classifiers een nauwkeurige en schaalbare methode biedt om cannabisgebruik en de redenen daarvoor uit niet-gestructureerde elektronische gezondheidsdossiers van patiënten met auto-immuunreumatische aandoeningen te extraheren.

Wang, Y., Bozkurt, S., Le, N., Alagappan, A., Huang, C., Rajwal, S., Lewis, A., Kim, J., Falasinnu, T.

Gepubliceerd 2026-03-09
📖 4 min leestijd☕ Koffiepauze-leesvoer
⚕️

Dit is een AI-gegenereerde uitleg van een preprint die niet peer-reviewed is. Dit is geen medisch advies. Neem geen gezondheidsbeslissingen op basis van deze inhoud. Lees de volledige disclaimer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat een ziekenhuis een enorme bibliotheek heeft, maar in plaats van boeken, zitten de patiëntgegevens in duizenden losse, handgeschreven briefjes. Artsen schrijven hierin alles op: wat ze zien, wat patiënten vertellen, en ook of ze medicinale cannabis gebruiken. Het probleem? Deze briefjes liggen door elkaar, zijn vaak onleesbaar voor computers, en niemand heeft de tijd om ze één voor één te lezen om te weten hoeveel mensen cannabis gebruiken en waarom.

Dit onderzoek is als een slimme zoektocht met robot-assistenten om die briefjes te ordenen.

Hier is wat de onderzoekers hebben gedaan, vertaald naar simpele taal:

1. Het Probleem: De "Naald in de Hooiberg"

De onderzoekers wilden weten: Gebruiken mensen met pijnlijke gewrichtsaandoeningen (zoals reuma) cannabis? En doen ze dat voor pijn, slapeloosheid of misselijkheid?
De informatie zat verstopt in de ongestructureerde notities van artsen. Het was als zoeken naar specifieke zinnen in een berg van miljoenen bladzijden tekst.

2. De Oplossing: De Robot-Librarijers (LLM's)

In plaats van mensen te laten lezen, gebruikten ze Grote Taalmodellen (LLM's). Denk hierbij aan super-intelligente robot-librarijers die snel kunnen lezen en begrijpen wat er staat.
De onderzoekers testten verschillende soorten robots:

  • De "Alleskunner": Grote, krachtige robots die alles kunnen (zoals GPT of Gemini). Ze zijn slim, maar soms wat wazig of onvoorspelbaar.
  • De "Gespecialiseerde Specialist": Een robot die speciaal is getraind op medische teksten (GatorTron). Deze is misschien niet zo groot, maar kent de medische taal als geen ander.

3. De Test: Wie is de beste?

De onderzoekers gaven de robots een proefexamen met handgeschreven briefjes die al door experts waren bekeken. Ze moesten twee dingen doen:

  1. Vaststellen: Gebruikt de patiënt cannabis? (Ja/Nee/Vroeger/Nooit).
  2. Begrijpen: Waarom? (Voor pijn, slaap, stress, etc.).

De resultaten waren verrassend:

  • Voor het vaststellen of iemand cannabis gebruikt, won de gespecialiseerde medische robot (GatorTron). Hij was als een ervaren detective die precies weet waar hij moet zoeken. Hij maakte weinig fouten en was heel betrouwbaar.
  • Voor het begrijpen van de reden (waarom?), won de grote, slimme robot (GPT-OSS-20B). Dit is een moeilijker vraag, omdat artsen soms vaag schrijven ("Patiënt gebruikt het voor..."). De grote robot kon de context beter "voelen" en begrijpen, net als een mens die een verhaal leest.

4. De Ontdekking: Wat leerden we?

Toen ze de beste robots op de hele bibliotheek lieten werken, ontdekten ze interessante trends tussen 2015 en 2024:

  • Meer gebruik: Steeds meer mensen met gewrichtsziekten gebruiken cannabis. Het aantal is bijna verdubbeld.
  • De reden: De belangrijkste reden is altijd pijn. Maar sinds een paar jaar is slapeloosheid de tweede reden. Mensen gebruiken het dus steeds vaker om te slapen.
  • Pijn en Cannabis: Interessant genoeg hadden mensen die cannabis gebruikten in het begin van de periode vaak meer pijn dan degenen die het niet gebruikten. Later veranderde dit patroon. Dit betekent waarschijnlijk dat mensen cannabis proberen omdat ze veel pijn hebben, en niet dat de cannabis ze pijn geeft.

5. Waarom is dit belangrijk?

Vroeger was het bijna onmogelijk om dit soort informatie uit ziekenhuisnotities te halen zonder duizenden mensen te laten typen. Nu hebben we een snel, schaalbaar systeem.
Het is alsof we van handmatig zoeken met een vergrootglas zijn overgestapt op een luchtfoto met een zoekmachine. Hierdoor kunnen artsen en onderzoekers beter begrijpen hoe patiënten hun pijn zelf proberen te managen, zonder dat ze uren hoeven te typen.

Kort samengevat:
De onderzoekers hebben bewezen dat je slimme computers kunt gebruiken om te lezen wat artsen schrijven over cannabis. Een gespecialiseerde computer is het beste om te weten of iemand het gebruikt, en een grote, slimme computer is het beste om te weten waarom. Dit helpt ons om beter inzicht te krijgen in hoe mensen met chronische pijn hun leven proberen te verbeteren.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →