HealthFormer: Dual-level time-aware Transformers for irregular electronic health record events

Het paper introduceert HealthFormer, een dual-level Transformer-model dat onregelmatige elektronische patiëntendata verwerkt door zowel intra-gebeurtenis codecompositie als tijdsafhankelijkheden te modelleren via zelftoezichtende pretraining, wat resulteert in superieure prestaties bij het voorspellen van incidentele kanker ten opzichte van bestaande methoden.

Körösi-Szabo, P., Kovacs, G., Csiszarik, A., Forrai, B., Laki, J., Szocska, M., Kovats, T.

Gepubliceerd 2026-03-27
📖 5 min leestijd🧠 Diepgaand
⚕️

Dit is een AI-gegenereerde uitleg van een preprint die niet peer-reviewed is. Dit is geen medisch advies. Neem geen gezondheidsbeslissingen op basis van deze inhoud. Lees de volledige disclaimer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat het medische dossier van een patiënt niet als een lange, saaie lijst van cijfers en codes wordt geschreven, maar als een verhaal. Een verhaal met hoofdstukken, personages, en een tijdslijn die soms snel gaat en soms jaren stil staat.

Deze paper introduceert HealthFormer, een slimme computer die dit verhaal kan lezen, begrijpen en zelfs voorspellen wat er misschien gaat gebeuren. Hier is hoe het werkt, vertaald naar alledaags taal:

1. Het Probleem: Een rommelige bibliotheek

Stel je voor dat je een enorme bibliotheek binnenloopt (het ziekenhuisdossier). De boeken liggen door elkaar:

  • Soms staat er een heel dik boek (een ziekenhuisopname) met honderden pagina's.
  • Soms is het een klein briefje (een bezoekje aan de huisarts).
  • Soms ligt er een briefje van een jaar geleden, en dan weer eentje van gisteren.
  • En op één pagina staan soms tien verschillende dingen tegelijk: een diagnose, een medicijn, een operatie en een adres van het ziekenhuis.

Oude computersystemen zagen dit vaak als een grote, ongeordende hoop losse woorden (een "zak vol woorden"). Ze wisten niet dat die woorden op één pagina bij elkaar hoorden, en ze keken niet goed naar de tijd die tussen de bezoeken zat.

2. De Oplossing: HealthFormer, de slimme bibliothecaris

HealthFormer is een nieuw soort "bibliothecaris" (een AI-model) die twee dingen heel goed doet:

A. Hij leest per hoofdstuk (De "Intra-Event" Encoder)
Wanneer de bibliothecaris een bezoekje aan de huisarts ziet, kijkt hij niet alleen naar de losse woorden. Hij begrijpt dat de diagnose "hoofdpijn", het medicijn "paracetamol" en het ziekenhuis "Ziekenhuis X" samen één verhaal vormen. Hij vat deze losse stukjes samen tot één duidelijk idee: "Dit was een bezoekje aan de huisarts voor hoofdpijn."

B. Hij ziet de tijd (De "Inter-Event" Encoder)
Vervolgens kijkt hij naar de hele levensloop van de patiënt. Hij weet dat er een groot verschil is tussen twee bezoeken die een week uit elkaar liggen, en twee bezoeken die vijf jaar uit elkaar liggen.

  • De analogie: Stel je voor dat je een film kijkt. Als je de scènes in de verkeerde volgorde ziet, snap je het verhaal niet. HealthFormer gebruikt een speciale "tijdsbril" (een techniek genaamd ALiBI) die hem precies laat zien hoe lang het geleden is sinds de vorige scène. Hij begrijpt dat een gebeurtenis van 10 jaar geleden minder invloed heeft op de huidige situatie dan eentje van gisteren, maar dat hij die oude gebeurtenis toch niet mag vergeten.

3. De Oefening: Hoe leert hij dit?

Voordat HealthFormer echt gaat helpen met diagnose, moet hij eerst oefenen. De auteurs hebben hem laten oefenen met miljoenen anonieme dossiers uit Hongarije (over 10 jaar tijd!). Ze gaven hem vier taken:

  1. Het invuloefening: "Ik heb een woord uit een medisch verslag weggehaald. Kun jij raden welk woord het was?" (Dit leert hem wat woorden betekenen).
  2. Het type-raden: "Ik heb een heel hoofdstuk weggehaald. Kun jij raden wat voor soort bezoek dit was?" (Bijv. was het een operatie of een medicijnafgifte?).
  3. De toekomstvoorspelling: "Wat gebeurt er waarschijnlijk als volgende?" (Bijv. als iemand een maagzweer heeft, komt er dan een operatie?).
  4. Het tijds-raden: "Hoe lang duurde het voordat de volgende gebeurtenis plaatsvond?"

Door deze oefeningen te doen, leert de computer de structuur van ziektes en behandelingen. Hij leert bijvoorbeeld dat bepaalde diagnoses vaak samen voorkomen, net zoals je weet dat "regen" en "paraplu" vaak samen gaan.

4. Het Resultaat: Voorspellen van Kanker

Om te testen of het echt werkt, hebben ze HealthFormer getest op het voorspellen van twee soorten kanker: darmkanker en prostaatkanker. Ze gaven hem de medische geschiedenis van een patiënt en vroegen: "Krijgt deze persoon binnen 30, 60 of 90 dagen kanker?"

  • De oude manier (Logistieke regressie): Dit is als een simpele teller. Hij telt hoeveel medicijnen iemand heeft gebruikt en hoe oud ze zijn. Dit werkt okay, maar mist de diepte.
  • HealthFormer: Deze AI zag de patronen. Hij zag niet alleen dat iemand medicijn X nam, maar hoe dat samenhangt met eerdere bezoeken en hoe lang het geleden was.

De uitslag: HealthFormer deed het veel beter dan de simpele teller.

  • Voor prostaatkanker had hij een voorspellingsvermogen van 94% (op 30 dagen).
  • Voor darmkanker was het 81%.
    Dit betekent dat hij veel eerder en nauwkeuriger kan waarschuwen dan de huidige standaardmethodes.

Waarom is dit belangrijk?

  1. Hij is flexibel: Je hoeft geen nieuwe computer te bouwen voor elke ziekte. Je kunt dezelfde "bibliothecaris" gebruiken om kanker te voorspellen, en daarna gewoon een klein beetje "finetunen" om hartproblemen te voorspellen.
  2. Hij begrijpt de context: Hij ziet niet alleen losse feiten, maar het hele verhaal van de patiënt.
  3. Hij is transparant: Omdat hij werkt met duidelijke "hoofdstukken" (bezoeken), kunnen artsen later terugkijken en zien: "Ah, de AI vond dit belangrijk omdat de patiënt 3 jaar geleden dit specifieke bezoek had."

Kortom: HealthFormer is als een super-intelligente arts-assistent die duizenden medische dossiers heeft gelezen, de tijdlijn perfect begrijpt, en nu kan helpen om ziektes eerder te zien aankomen, zodat we beter kunnen behandelen.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →