MARIA: a Multimodal Transformer Model for Incomplete Healthcare Data

Het paper introduceert MARIA, een nieuw multimodaal transformer-model dat door het gebruik van een gemaskerd zelf-attentie-mechanisme in plaats van imputatie, robuust presteert bij het analyseren van onvolledige gezondheidsdata en hiermee bestaande methoden overtreft.

Camillo Maria Caruso, Paolo Soda, Valerio Guarrasi

Gepubliceerd 2026-03-13
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

MARIA: De slimme arts die niet bang is voor lege dossiers

Stel je voor dat je een zeer ervaren arts bent die een diagnose moet stellen. Om een goede diagnose te stellen, wil je natuurlijk alle informatie hebben: de bloeddruk, de röntgenfoto's, de bloedtesten en het verhaal van de patiënt. Maar wat gebeurt er als de patiënt zijn bloedtesten vergeten is in te leveren, of als de röntgenmachine op dat moment stuk is?

In de echte wereld is dit een enorm probleem. Medische dossiers zijn vaak onvolledig. Traditionele computersystemen (de "oude manier") doen dan vaak alsof ze de ontbrekende stukjes invullen met een gok. Ze zeggen: "Oké, de bloeddruk ontbreekt, maar omdat de meeste mensen met dit probleem een hoge bloeddruk hebben, vullen we die maar in." Het probleem is dat deze goks vaak verkeerd zijn en de arts (of computer) op het verkeerde been zetten.

De oplossing: MARIA

In dit paper introduceren de auteurs MARIA (Multimodal Attention Resilient to Incomplete datA). Je kunt MARIA zien als een super-slimme, moderne arts die een heel andere aanpak heeft.

In plaats van de lege plekken in het dossier te "invullen" met gissen, kijkt MARIA gewoon naar wat er wel is.

Hoe werkt het? De "Geknipte Foto" Analogie

Stel je voor dat je een puzzel moet maken om een ziekte te diagnosticeren.

  • De oude manier (Imputatie): Als een puzzelstukje ontbreekt, plakt de computer er een stukje van een andere puzzel op dat er misschien op lijkt. Soms klopt het, maar vaak zie je de puzzel er raar uit en maak je een fout.
  • De MARIA-methode: MARIA kijkt naar de puzzel en zegt: "Oké, dit stukje ontbreekt. Geen probleem. Ik ga gewoon kijken naar de stukjes die er wel zijn en die slim met elkaar verbinden."

MARIA gebruikt een speciale techniek die ze een "masker" noemen. Het is alsof MARIA een bril opzet die de ontbrekende stukjes zwart maakt. Ze negeert ze volledig. Ze laat de computer niet gokken wat er zou moeten staan, maar laat de computer alleen kijken naar de feiten die er echt zijn.

De "Orkest" Vergelijking

Om te begrijpen hoe MARIA verschillende soorten data (zoals bloedwaarden en foto's) samenbrengt, kun je denken aan een orkest:

  • Vroege fusie (Early Fusion): Alle muzikanten spelen tegelijkertijd in één groot ensemble. Als een viool ontbreekt, klinkt het ensemble vaak raar of stopt het.
  • Late fusie (Late Fusion): Elke muzikant speelt zijn eigen solostuk apart, en aan het eind zegt een dirigent: "Oké, we tellen de scores bij elkaar op." Dit werkt, maar de muzikanten luisteren niet naar elkaar, dus ze missen de mooie harmonieën.
  • MARIA (Intermediate Fusion): Dit is als een slim dirigent. Elke muzikant (elk type data) speelt eerst zijn eigen stukje. Maar de dirigent (MARIA) luistert naar wat er wel wordt gespeeld. Als de fluitist niet komt opdagen (ontbrekende data), zegt de dirigent: "Geen probleem, we laten de fluit even stil en focussen we op de klarinet en de trompet." De dirigent past de muziek dynamisch aan op basis van wat er beschikbaar is, zonder nep-instrumenten te introduceren.

Wat hebben ze ontdekt?

De auteurs hebben MARIA getest op echte medische data, zoals patiënten met de ziekte van Alzheimer en mensen met COVID-19. Ze hebben MARIA laten strijden tegen 10 andere slimme computersystemen.

Het resultaat? MARIA wint bijna altijd.

  • Hoe meer data er ontbreekt, hoe beter MARIA presteert in vergelijking met de anderen.
  • De andere systemen worden slomer en maken meer fouten naarmate er meer informatie ontbreekt.
  • MARIA blijft stabiel en betrouwbaar, zelfs als de dossiers half leeg zijn.

Waarom is dit belangrijk?

In de echte wereld zijn medische dossiers zelden perfect. Mensen vergeten testen, apparaten zijn kapot, of privacy-wetten zorgen ervoor dat sommige data niet beschikbaar is.

MARIA is een grote stap vooruit omdat het computersystemen veerkrachtiger maakt. Het betekent dat artsen in de toekomst meer vertrouwen kunnen hebben in de diagnose van een computer, zelfs als ze niet alle informatie hebben. Het voorkomt dat we artsen dwingen om op basis van gissingen te werken.

Kortom:
MARIA is een slimme computer die leert om te werken met wat er is, in plaats van te gissen naar wat er misschien had kunnen zijn. Het is als een arts die zegt: "Ik heb niet alles, maar ik maak het beste van wat ik heb, zonder nep-feiten te verzinnen."