Automated Extraction of Cancer Registry Data from Pathology Reports: Comparing LLM-Based and Ontology-Driven NLP Platforms

Deze studie toont aan dat een op LLM gebaseerd platform (Brim Analytics) bij het automatisch extraheren van kankerregistergegevens uit pathologierapporten over het algemeen hogere nauwkeurigheid bereikt dan een op ontologie gebaseerd systeem (DeepPhe), met name bij het vastleggen van de T-stadium, terwijl beide systemen snelle verwerkingstijden behalen.

McPhaul, T., Kreimeyer, K., Baris, A., Botsis, T.

Gepubliceerd 2026-03-23
📖 5 min leestijd🧠 Diepgaand
⚕️

Dit is een AI-gegenereerde uitleg van een preprint die niet peer-reviewed is. Dit is geen medisch advies. Neem geen gezondheidsbeslissingen op basis van deze inhoud. Lees de volledige disclaimer

Each language version is independently generated for its own context, not a direct translation.

De Grote Uitdaging: Het Vertalen van een Chaos

Stel je voor dat een ziekenhuis een enorme bibliotheek heeft, maar in plaats van nette boeken met inhoudsopgaven, zitten de meeste boeken vol met handgeschreven krabbels, verschillende lettertypes en eigenzinnige zinnen. Dit zijn de pathologieverslagen van kankerpatiënten.

Voor onderzoekers en artsen is het cruciaal om uit deze "krabbels" specifieke feiten te halen: Is de tumor groot? Heeft hij zich verspreid? Wat voor soort kanker is het? Vandaag de dag moeten mensen (speciaal getrainde registrateurs) deze verslagen één voor één lezen en de informatie handmatig overtypen in een digitaal systeem. Dit is als het handmatig overschrijven van duizenden krabbels: het kost veel tijd, is vermoeiend en mensen maken soms fouten door vermoeidheid.

De onderzoekers van de Johns Hopkins Universiteit wilden weten of moderne kunstmatige intelligentie (AI) dit werk sneller en beter kan doen dan mensen. Ze testten twee verschillende "robots" die deze krabbels moeten lezen en vertalen naar nette, gestructureerde data.

De Twee Kandidaten: De Slimme Vertaler vs. De Woordenboek-Check

De onderzoekers stelden twee verschillende systemen tegen elkaar:

  1. Brim Analytics (De Slimme Vertaler):

    • Hoe het werkt: Dit systeem gebruikt een LLM (een groot taalmodel, vergelijkbaar met de technologie achter ChatGPT). Het is als een zeer slimme, goed opgeleide vertaler die de context begrijpt. Als er staat "kop van de alvleesklier" of "cephalisch deel", weet deze robot dat het hetzelfde is.
    • De aanpak: Mensen geven de robot duidelijke instructies (regels) over wat er precies gezocht moet worden. De robot leest dan het verslag en past deze regels toe.
  2. DeepPhe (De Woordenboek-Check):

    • Hoe het werkt: Dit is een ouderwetser, maar bewezen systeem dat werkt met een ontologie (een enorme, strikte woordenlijst van medische termen).
    • De aanpak: Het systeem zoekt in het verslag naar woorden die precies in zijn woordenlijst staan. Als het woord niet exact in de lijst staat, of als de zin te ingewikkeld is, raakt het de draad kwijt. Het is als iemand die alleen zinnen begrijpt als ze exact overeenkomen met een vooraf geschreven script.

De Proef: De "Alvleesklier" en de "Borst"

Om te testen hoe goed deze robots waren, gaven de onderzoekers ze 330 verslagen van alvleesklierkanker en 34 verslagen van borstkanker. Ze gebruikten verslagen van de afgelopen 19 jaar, variërend van oude, rommelige handgeschreven notities tot moderne, gestructureerde formulieren.

De resultaten:

  • Brim Analytics (De Slimme Vertaler) won overtuigend.

    • Bij alvleesklierkanker haalde hij een gemiddelde score van 96,7%. Hij maakte nauwelijks fouten, zelfs bij de moeilijke dingen zoals het bepalen van de tumorgrootte (T-stadium).
    • Het mooie was: hij deed het bijna even goed bij borstkanker (93,7%), zonder dat ze hem daar speciaal voor hadden getraind. Hij kon de regels dus "algemeen" toepassen.
    • Snelheid: Hij had ongeveer 0,9 seconde nodig per verslag.
  • DeepPhe (De Woordenboek-Check) had het moeilijker.

    • Hij deed het goed bij het tellen van lymfeklieren (N-stadium), maar faalde bij het bepalen van de tumorgrootte (T-stadium), vooral bij borstkanker (slechts 70,6% goed).
    • Het probleem: Hij neigde er vaak toe om te overdreven. Hij dacht dat een tumor groter was dan hij echt was, omdat hij niet goed kon omgaan met de verschillende manieren waarop artsen dat beschrijven.
    • Snelheid: Hij was iets langzamer, ongeveer 1,1 seconde per verslag, maar dat is nog steeds razendsnel.

De Leerlessen: Waarom de "Slimme Vertaler" wint

De onderzoekers ontdekten een belangrijk verschil in hoe de robots faalden:

  • DeepPhe maakte vaak fouten omdat hij te star was. Als een arts een woord gebruikte dat niet in de woordenlijst stond, of een zin op een andere manier schreef, gaf het systeem het op of maakte het een gok. Het was alsof hij probeerde een gesprek te voeren met iemand die alleen kan praten in exacte zinnen uit een boek.
  • Brim Analytics was flexibeler. Hij begreep dat "kop van de alvleesklier" en "rechterkant van de alvleesklier" hetzelfde betekenen. Hij maakte soms fouten door te voorzichtig te zijn (hij dacht soms dat een tumor kleiner was dan hij was), maar dat is in de medische wereld vaak veiliger dan het omgekeerde.

Wat betekent dit voor de toekomst?

Dit onderzoek laat zien dat we niet langer hoeven te wachten tot mensen handmatig duizenden verslagen uitschrijven.

  • De robot als assistent: De AI hoeft de mens niet te vervangen, maar kan als een "eerste pass" fungeren. De robot haalt de feiten eruit en vult het formulier voor. De menselijke registrateur hoeft dan alleen nog maar te kijken of de robot het goed heeft gedaan en eventuele twijfelgevallen te controleren.
  • Schaalbaarheid: Omdat de robots zo snel zijn (minder dan een seconde per verslag), kunnen ziekenhuizen duizenden patiënten in plaats van honderden verwerken. Dit betekent snellere data voor onderzoek en betere zorg voor patiënten.

Kortom: De "Slimme Vertaler" (Brim) heeft bewezen dat hij de chaos van handgeschreven medische verslagen kan omzetten in nette, betrouwbare data. Het is alsof we eindelijk een robot hebben die niet alleen kan lezen, maar ook echt begrijpt wat er staat, waardoor we de tijd kunnen besparen om ons te concentreren op de patiënten zelf.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →