Automated Histopathology Report Generation via Pyramidal Feature Extraction and the UNI Foundation Model

Deze paper presenteert een hiërarchisch visueel-taalframework dat het UNI-foundationmodel, meervoudige resolutie-patchselectie en BioGPT-tokenisatie combineert om diagnostische rapporten te genereren uit gigapixel histopathologie-afbeeldingen, waarbij de betrouwbaarheid wordt verhoogd door een retrieval-gebaseerde verificatiestap.

Ahmet Halici, Ece Tugba Cebeci, Musa Balci, Mustafa Cini, Serkan Sokmen

Gepubliceerd 2026-02-19
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat een patholoog (een arts die weefsels onder de microscoop bekijkt om kanker te diagnosticeren) geconfronteerd wordt met een gigantische foto. Deze foto, een 'Whole Slide Image' (WSI), is zo groot dat hij miljarden pixels telt. Het is alsof je probeert een heel landschap te bekijken door door een klein gaatje te kijken, maar dan in 40x vergroting.

Het probleem? Een computer moet van deze enorme foto een medisch verslag schrijven. Dat is als proberen een heel boek te schrijven terwijl je maar één woord per seconde kunt zien.

De auteurs van dit paper (van het bedrijf ViseurAI) hebben een slimme manier bedacht om dit op te lossen. Hier is hoe hun systeem werkt, vertaald naar alledaagse taal:

1. De Slimme Zoeker (De Piramide-strategie)

Stel je voor dat je een enorm veld met gras moet inspecteren op onkruid. Als je elk grassprietje één voor één bekijkt, duurt het eeuwen.
In plaats daarvan kijkt het systeem eerst van ver weg (zoals vanuit een helikopter). Het ziet waar de grote stukken gras zitten en waar het kale asfalt (de achtergrond) is. Het negeert het asfalt direct.
Daarna zoomt het langzaam in op de interessante stukken gras. Het kijkt niet naar alles, maar selecteert alleen de stukjes waar echt iets te zien is.

  • De truc: Ze gebruiken een 'piramide' van vergrotingen. Eerst kijken ze naar een klein plaatje, dan iets groter, en pas op het laatst heel dichtbij. Ze gebruiken ook slimme filters om te zien of de foto scherp is (niet wazig) en of de kleuren goed zijn (niet te donker of te licht). Alleen de beste stukjes worden geselecteerd.

2. De Expert die niet meer hoeft te leren (Het UNI-model)

Vroeger moest je een computer van nul af aan leren wat een kankercel is. Dat kostte jaren en enorme rekenkracht.
Deze auteurs gebruiken echter een reeds opgeleide expert: het 'UNI'-model.

  • De analogie: Stel je voor dat je een meester-architect hebt die al 100 miljoen gebouwen heeft bestudeerd en alles over bouwstijlen weet. Je hoeft die architect niet opnieuw te leren bouwen. Je geeft hem alleen de foto's van jouw specifieke huis en vraagt: "Wat zie jij hier?"
  • Omdat deze 'architect' al zo slim is, hoeven ze hem niet meer te trainen (hij is 'bevroren'). Ze gebruiken alleen zijn kennis. Dit bespaart enorm veel tijd en energie.

3. De Schrijver die medisch spreekt (De Decoder)

Nu heeft de computer de 'kennis' van de architect over de foto's, maar die moet nog in een verslag worden omgezet.
Ze gebruiken een speciale schrijver (een Transformer-decoder) die alleen de tekst schrijft.

  • De taal: Normale computers gebruiken woordenboeken voor alledaagse taal. Maar medische termen zijn lastig (bijv. "invasief ductaal carcinoom"). Als je die in gewone letters splitst, wordt het onzin.
  • De oplossing: Ze gebruiken een speciaal woordenboek voor medicijnen (BioGPT). Het is alsof de schrijver een medische vertaler is die precies weet hoe termen samengesteld moeten worden, zodat hij niet "kanker van de borst" schrijft, maar de juiste, professionele diagnose.

4. De Controleur (De Retriever)

Soms verzinnen computers dingen die klinken alsof ze waar zijn, maar niet kloppen (dit noemen ze 'hallucinaties'). In de geneeskunde is "goedaardig" vs. "kwaadaardig" een enorm groot verschil.
Om dit te voorkomen, hebben ze een controleur toegevoegd.

  • Hoe het werkt: Nadat de computer een verslag heeft geschreven, kijkt de controleur in een enorme bibliotheek met echte, goedgekeurde verslagen.
  • Als het nieuwe verslag heel erg lijkt op een verslag dat al in de bibliotheek staat (meer dan 85% gelijkenis), dan wordt het nieuwe verslag vervangen door het bewezen, echte verslag.
  • Als het een heel zeldzame ziekte is die niet in de bibliotheek staat, blijft het originele verslag staan, maar dan weet je dat het een 'nieuwe' interpretatie is.

Waarom is dit belangrijk?

Deze methode is als het bouwen van een efficiënte fabriek in plaats van een dure, energievretende supercomputer.

  • Het is snel: Omdat ze de zware 'architect' niet opnieuw hoeven te trainen.
  • Het is betrouwbaar: Door de controleur en de slimme selectie van de foto's.
  • Het werkt goed: In een internationale wedstrijd (REG 2025) haalde dit team de 8e plek van 24 teams, wat heel goed is, gezien ze een 'lichter' systeem gebruikten dan de zware concurrenten.

Kortom: Ze hebben een systeem gebouwd dat eerst slim selecteert wat belangrijk is, dan een expert raadpleegt die al alles weet, laat een medische schrijver het verslag maken, en tot slot een controleur laat checken of het klopt. Zo krijgen artsen sneller en nauwkeuriger hulp bij het diagnosticeren van kanker.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →