MARIA: a Multimodal Transformer Model for Incomplete Healthcare Data

Das Papier stellt MARIA vor, ein neuartiges multimodales Transformer-Modell, das durch die Verwendung eines maskierten Self-Attention-Mechanismus anstelle von Imputation fehlende Daten in klinischen Anwendungen direkt verarbeitet und dabei die Leistung und Robustheit gegenüber unvollständigen Datensätzen im Vergleich zu bestehenden Methoden verbessert.

Camillo Maria Caruso, Paolo Soda, Valerio Guarrasi

Veröffentlicht 2026-03-13
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

🏥 MARIA: Der super-detective für unvollständige Patientendaten

Stellen Sie sich vor, Sie sind ein Arzt. Ein Patient kommt zu Ihnen, aber sein Gesundheitsakte ist ein echtes Chaos:

  • Die Blutwerte fehlen.
  • Das MRT-Bild ist weg.
  • Aber die Fragebögen über den Lebensstil sind da.
  • Und die Genetik-Daten sind teilweise unleserlich.

In der echten Welt passiert das ständig. Patienten vergessen Termine, Geräte streiken oder Datenschutzregeln verbergen Teile der Daten.

Das Problem:
Die meisten modernen Computer-Modelle (Künstliche Intelligenz), die Diagnosen stellen sollen, sind wie sehr strenge Schüler: Wenn ihnen auch nur eine Zahl fehlt, geben sie auf oder versuchen, die fehlende Zahl zu erraten (das nennt man "Imputation"). Das ist aber riskant. Wenn der Computer eine Zahl erfindet, die gar nicht stimmt, kann das zu einer falschen Diagnose führen. Das ist, als würde ein Koch ein Rezept kochen, indem er Zutaten erfindet, die gar nicht im Kühlschrank sind – das Ergebnis schmeckt vielleicht komisch oder ist sogar giftig.

Die Lösung: MARIA
Die Forscher haben MARIA entwickelt. Der Name steht für etwas wie "Multimodale Aufmerksamkeit, die gegen unvollständige Daten immun ist".

Stellen Sie sich MARIA nicht als einen Schüler vor, der Lücken ausfüllt, sondern als einen sehr klugen Detektiv, der nur mit dem arbeitet, was er wirklich sieht.

Wie funktioniert MARIA? (Die Analogie)

Stellen Sie sich vor, Sie haben drei Freunde, die Ihnen helfen sollen, ein Rätsel zu lösen:

  1. Freund A kennt die Blutwerte.
  2. Freund B kennt die Bilder.
  3. Freund C kennt die Genetik.

Der alte Weg (Imputation):
Wenn Freund A fehlt, versuchen die anderen, sich vorzustellen, was er sagen würde, und füllen seine Lücke mit einer Vermutung aus. Das ist unsicher.

Der MARIA-Weg (Maskierte Aufmerksamkeit):
MARIA sagt: "Kein Problem! Wenn Freund A fehlt, hören wir einfach auf ihn zu hören."
MARIA nutzt eine spezielle Technik namens "Maskierte Selbst-Aufmerksamkeit".

  • Es ist wie ein Lichtschalter. Wenn eine Information fehlt (z. B. das MRT-Bild), schaltet MARIA den Lichtschalter für diesen Bereich einfach aus.
  • Der Computer ignoriert die fehlenden Daten komplett, anstatt sie zu erfinden.
  • Er konzentriert sich nur auf das, was da ist (z. B. die Blutwerte und Genetik), und zieht daraus die bestmögliche Schlussfolgerung.

Warum ist das so genial?

  1. Keine Lügen: MARIA erfindet keine Daten. Das macht die Diagnose ehrlicher und sicherer.
  2. Flexibilität: Egal ob nur ein kleiner Teil der Daten fehlt oder ganze Kategorien (wie das MRT) komplett weg sind – MARIA passt sich an.
  3. Besser als die Konkurrenz: Die Forscher haben MARIA gegen 10 andere hochmoderne KI-Modelle getestet (sowohl einfache als auch sehr komplexe).
    • Das Ergebnis: MARIA war in fast allen Fällen besser, besonders wenn die Daten sehr lückenhaft waren.
    • Die anderen Modelle wurden mit steigender Anzahl an fehlenden Daten immer schlechter. MARIA blieb stabil, wie ein Fels in der Brandung.

Wo wurde es getestet?

Die Forscher haben MARIA an zwei echten medizinischen Problemen getestet:

  1. Alzheimer-Früherkennung: Hier gab es Daten von über 2.000 Patienten (Gedächtnistests, Blutwerte, Gehirnscans). Oft fehlten ganze Scans oder Tests. MARIA konnte den Krankheitsverlauf besser vorhersagen als alle anderen.
  2. COVID-19-Schweregrad: Hier wurden Daten von COVID-Patienten analysiert, um vorherzusagen, wer schwer erkranken oder sterben könnte. Auch hier fehlten oft Laborwerte. MARIA traf die richtige Entscheidung, auch wenn die Akte "löchrig" war.

Zusammenfassung in einem Satz

MARIA ist eine neue KI, die lernt, mit "Löchern" in den Patientendaten umzugehen, indem sie die fehlenden Teile einfach ignoriert, anstatt sie zu erfinden – und dadurch genauere und sicherere Diagnosen liefert als alle bisherigen Methoden.

Es ist wie ein Arzt, der sagt: "Ich brauche nicht alles, um eine gute Diagnose zu stellen. Ich nutze einfach das, was ich habe, und lasse mich nicht von dem, was fehlt, verwirren."