Large-Language Models for data extraction from written kidney biopsy reports

Die Studie zeigt, dass Open-Source-LLMs wie Llama3 70B und MedGemma narrative Nierenbiopsie-Berichte mit hoher Genauigkeit in strukturierte Daten umwandeln können, wobei faktische Elemente automatisch extrahiert werden, während interpretative Befunde weiterhin menschlicher Aufsicht bedürfen.

Niggemeier, L., Hoelscher, D. L., Herkens, T. C., Gilles, P., Boor, P., Buelow, R.

Veröffentlicht 2026-02-25
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre
⚕️

Dies ist eine KI-generierte Erklärung eines Preprints, das nicht peer-reviewed wurde. Dies ist kein medizinischer Rat. Treffen Sie keine Gesundheitsentscheidungen auf Grundlage dieses Inhalts. Vollständigen Haftungsausschluss lesen

Each language version is independently generated for its own context, not a direct translation.

Titel: Der digitale Übersetzer für Nieren-Biopsien – Wie KI alte Berichte in klare Daten verwandelt

Stellen Sie sich vor, ein Nieren-Biopsie-Bericht ist wie ein handgeschriebenes Tagebuch eines Detektivs. Der Pathologe (der medizinische Detektiv) hat die winzigen Gewebeproben untersucht und seine Entdeckungen in langen, fließenden Texten niedergeschrieben. Diese Texte sind voller Fachbegriffe, Nuancen und manchmal auch etwas verwirrend formuliert.

Das Problem: Wenn man heute forschen will und tausende dieser Fälle vergleichen möchte, ist es wie der Versuch, tausende dieser handgeschriebenen Tagebücher in eine riesige Excel-Tabelle zu übertragen. Ein Mensch müsste jeden Satz einzeln lesen, die wichtigen Zahlen (wie „8 Nierenkörperchen gefunden") und Diagnosen („FSGS") heraushandieren und in die Tabelle eintragen. Das dauert ewig und ist extrem mühsam.

Die Lösung: Der KI-Leser (Large Language Models)

In dieser Studie haben die Forscher aus Aachen getestet, ob moderne Künstliche Intelligenz (genannt „Large Language Models" oder LLMs) diese mühsame Arbeit übernehmen kann. Sie haben drei verschiedene KI-Modelle (Llama3 70B, Llama3 8B und MedGemma) mit den deutschen Original-Berichten gefüttert.

Man kann sich diese KIs wie super-intelligente Übersetzer vorstellen:

  • Eingabe: Der chaotische, handgeschriebene Text des Pathologen.
  • Ausgabe: Eine saubere, strukturierte Liste (im Computerformat JSON), in der genau steht: „Diagnose: X", „Anzahl der Körperchen: 8", „Entzündung: Ja/Nein".

Was haben sie herausgefunden?

  1. Die Großen sind die Besten:
    Die größte KI (Llama3 70B) war wie ein erfahrener Assistent, der fast alles perfekt macht. Sie konnte etwa 93 % der Informationen exakt richtig aus dem Text ziehen. Die kleinere KI (Llama3 8B) war wie ein Azubi: Sie war fleißig, machte aber öfter Fehler, besonders bei schwierigen Textstellen.

  2. Wo die KI glänzt:
    Bei klaren Fakten war die KI unschlagbar. Wenn im Text stand „Es gibt 12 Nierenkörperchen", zählte die KI das sofort richtig. Das ist wie das Zählen von Äpfeln in einem Korb – da gibt es keine Missverständnisse.

  3. Wo die KI stolpert (und ein Mensch helfen muss):
    Bei Dingen, die Interpretation erfordern, wurde es knifflig. Manchmal steht im Text: „Es sieht aus wie eine Entzündung, aber nur in dem Bereich, der schon vernarbt ist." Hier muss man wissen, ob das als „Entzündung" oder als „Narbe" gezählt wird.

    • Die KI konnte hier manchmal raten, aber nicht immer richtig.
    • Die Lösung: Die Forscher haben gesehen, dass die KI am besten funktioniert, wenn sie als Vorerstatter arbeitet. Sie macht den ersten Entwurf (und spart so 12 bis 18 Mal mehr Zeit als ein Mensch), und ein menschlicher Expert schaut dann nur noch schnell drüber, um die schwierigen Fälle zu bestätigen.

Ein konkretes Beispiel aus dem Papier:
Stellen Sie sich vor, der Text sagt: „Fokale segmentale Glomerulosklerose mit Schaumzellen."

  • Die KI erkennt sofort: „Diagnose: FSGS".
  • Ein Mensch könnte sich aber fragen: „Ist das eine Diagnose oder nur eine Beschreibung des Musters?"
  • In solchen Fällen stimmten die menschlichen Experten untereinander auch nicht immer 100 % überein. Die KI half hier sogar, indem sie als „dritte Meinung" hinzugezogen wurde und die Einigkeit der Gruppe erhöhte.

Das Fazit für die Zukunft

Diese Studie zeigt, dass wir nicht mehr jeden einzelnen Nieren-Biopsie-Bericht mühsam von Hand abtippen müssen.

  • Der Vorteil: Wir können riesige Datenmengen (Tausende von Fällen) in Sekunden strukturieren. Das ist wie der Unterschied zwischen dem manuellen Abschreiben von Adressen und dem automatischen Scannen eines ganzen Telefonbuchs.
  • Der Nutzen: Forscher können viel schneller große Gruppen von Patienten finden, um neue Therapien zu testen oder Krankheitsmuster zu erkennen.
  • Die Regel: Die KI macht die schwere, repetitive Arbeit. Der menschliche Arzt bleibt der Chef, der bei den kniffligen, interpretativen Fällen das letzte Wort hat.

Kurz gesagt: Die KI ist der Turbo für die Nierenforschung, der uns hilft, aus alten Textbergen wertvolle Schätze an Daten zu gewinnen, ohne dass wir dabei vor lauter Papierarbeit ertrinken.

Erhalten Sie solche Paper in Ihrem Posteingang

Personalisierte tägliche oder wöchentliche Digests passend zu Ihren Interessen. Gists oder technische Zusammenfassungen, in Ihrer Sprache.

Digest testen →