Each language version is independently generated for its own context, not a direct translation.
Titel: De Slimme Vertalers voor Medische Rapporten (Zonder de Geheime Recepten)
Stel je voor dat artsen en ziekenhuizen elke dag duizenden medische rapporten schrijven. Deze rapporten zitten vol met goudmijnen aan informatie: diagnoses, medicijnen, en resultaten van scans. Maar er is een groot probleem: deze rapporten zijn vaak geschreven als een rommelig verhaal in vakjargon, niet als een nette lijst met gegevens. Voor computers is het alsof ze proberen een boek te lezen dat in een vreemde taal is geschreven en vol staat met krabbels.
Vroeger gebruikten computers simpele regels om deze informatie te halen, maar dat werkte vaak niet goed. Vervolgens kwamen er supersterke "AI-hersenen" (grote taalmodellen) die dit probleem konden oplossen. Maar de meeste van die slimme hersenen zijn geprivatiseerd. Dat betekent dat je ze moet huren van grote bedrijven, je de rapporten naar hun servers moet sturen (wat privacy-problemen geeft) en je niet weet hoe ze precies werken.
De Oplossing: Open-Source AI in Eigen Huis
De auteurs van dit onderzoek (van het Radboudumc in Nijmegen) wilden een oplossing die privacy-waardig, transparant en goedkoop is. Ze hebben gekeken naar open-source modellen. Denk hierbij niet aan een gesloten kast waar je niet bij mag, maar aan een open keuken waar iedereen het recept mag zien en zelf kan koken.
Ze hebben een nieuw gereedschap gebouwd, genaamd llm extractinator.
- De Metafoor: Stel je voor dat dit een slimme robot-assistent is die je in je eigen ziekenhuis kunt zetten. Je geeft hem een stapel medische rapporten en een lijstje met wat je wilt weten (bijv. "Is er een tumor?" of "Wat is de grootte?"). De robot leest het rapport en vult automatisch een nette tabel in.
Wat hebben ze ontdekt?
Ze hebben negen verschillende soorten "open-source hersenen" getest op 28 verschillende taken, allemaal in het Nederlands. Hier zijn de belangrijkste bevindingen, vertaald naar alledaagse taal:
Groot is niet altijd beter (maar wel vaak wel):
De grootste modellen (zoals Llama-3.3-70B) waren de slimsten, maar ze zijn ook zwaar en hebben krachtige computers nodig om te draaien. Interessant genoeg deden de iets kleinere modellen (met ongeveer 14 miljard "neuronen", zoals Phi-4 en Qwen-2.5) bijna net zo goed.- Analogie: Het is alsof je een Formule 1-auto (het grootste model) hebt die iets sneller is, maar een degelijke touringcar (het 14B model) doet het voor 95% van de rit net zo goed, terwijl hij veel minder benzine (rekenkracht) verbruikt. Voor ziekenhuizen met beperkte budgetten is de touringcar vaak de betere keuze.
Vertalen is een valstrik:
Een grote vraag was: "Zouden we de Nederlandse rapporten eerst naar het Engels moeten vertalen, omdat de AI's daar beter in zijn?"
Het antwoord was een hard NEE.- De Metafoor: Het is alsof je een complexe medische tekst laat vertalen door een machine, en dan pas aan de dokter vraagt. Bij het vertalen gaan subtiele nuances verloren of ontstaan er rare fouten. De AI presteerde veel slechter als ze eerst vertaalden.
- Conclusie: Je moet de AI direct in het Nederlands laten werken. "Native" is beter dan "vertaald".
Wat kunnen ze goed, en wat niet?
- Goed: Het halen van cijfers en feiten. Als er staat "de tumor is 3 cm groot", halen de AI's dit perfect. Ook het beantwoorden van ja/nee-vragen ging goed.
- Moeilijk: Het vinden van specifieke medische termen in een lange tekst (zoals het markeren van elk woord dat een ziekte is). Hier faalden de modellen een beetje.
- De "Grote Baan" (RoBERTa): Er was een oude, gespecialiseerde AI die wel getraind was op deze specifieke taken. Die deed het overall iets beter, maar die had wel duizenden voorbeelden nodig om te leren. De nieuwe open-source AI's deden het bijna net zo goed zonder ooit te hebben geoefend (dit noemen ze "zero-shot").
Waarom is dit belangrijk voor ons?
Dit onderzoek toont aan dat ziekenhuizen in Nederland (en andere landen met minder talen) niet afhankelijk hoeven te zijn van dure, buitenlandse tech-bedrijven om hun data te ordenen.
Met dit nieuwe gereedschap (llm extractinator) en de juiste open-source modellen kunnen ziekenhuizen:
- Hun eigen data veilig houden (binnen de muren van het ziekenhuis).
- Geen dure licentiekosten betalen.
- Toch gebruikmaken van de slimste technologie die er is.
Samenvattend:
De onderzoekers hebben een sleutel gebouwd die de deur opent naar de informatie in onze medische rapporten. Ze hebben bewezen dat je geen "geheime, dure sleutel" nodig hebt; een open, transparante sleutel werkt net zo goed, is veiliger voor de privacy van de patiënt, en werkt het beste als je hem direct in het Nederlands gebruikt.