Quality versus quantity of training datasets for artificial intelligence-based whole liver segmentation

Die Studie zeigt, dass für die KI-gestützte Segmentierung der gesamten Leber hoch kuratierte Datensätze mit deutlich weniger Scans eine vergleichbare Leistung erzielen wie um eine Größenordnung größere, gemischt kuratierte Datensätze, wobei größere Mengen jedoch die Generalisierbarkeit verbessern können.

Castelo, A., O'Connor, C., Gupta, A. C., Anderson, B. M., Woodland, M., Altaie, M., Koay, E. J., Odisio, B. C., Tang, T. T., Brock, K. K.

Veröffentlicht 2026-02-18
📖 3 Min. Lesezeit☕ Kaffeepausen-Lektüre
⚕️

Dies ist eine KI-generierte Erklärung eines Preprints, das nicht peer-reviewed wurde. Dies ist kein medizinischer Rat. Treffen Sie keine Gesundheitsentscheidungen auf Grundlage dieses Inhalts. Vollständigen Haftungsausschluss lesen

Each language version is independently generated for its own context, not a direct translation.

Stellen Sie sich vor, Sie möchten einen perfekten Kochkurs für die Zubereitung von Linseneintopf (in unserem Fall: die genaue Darstellung der Leber auf medizinischen Bildern) erstellen. Die große Frage lautet: Brauchen Sie eine Handvoll Rezepte von einem Michelin-Stern-Koch (hohe Qualität, wenig Menge) oder eine riesige Schüssel mit tausenden von Rezepten von Hobbyköchen, die nicht alle perfekt sind (geringere Qualität, aber große Menge)?

Genau darum geht es in dieser Studie. Hier ist die Geschichte, einfach erklärt:

Das Experiment: Der große Kochwettbewerb

Die Forscher hatten Zugriff auf fast 3.100 Bilder von Bauch-CT-Scans. Auf diesen Bildern war die Leber bereits von Experten nachgezeichnet (wie ein Umriss). Sie teilten diese Bilder in zwei Lager auf:

  1. Das "Premium-Lager" (Hohe Qualität): Hier waren nur 244 Bilder. Diese waren von absoluten Top-Experten mit größter Sorgfalt und Präzision bearbeitet worden. Kein Fehler, keine Ungenauigkeit.
  2. Das "Massen-Lager" (Hohe Menge): Hier waren fast 2.800 Bilder. Diese kamen von verschiedenen Quellen und waren vielleicht nicht jedes einzelne zu 100 % perfekt, aber es gab einfach viel mehr davon.

Dann ließen sie einen künstlichen Intelligenz-Koch (ein KI-Modell namens 3D nnU-Net) mit diesen beiden Lagern trainieren, um zu sehen, welcher Ansatz besser funktioniert.

Die Ergebnisse: Der Überraschungssieg

Das Ergebnis war faszinierend und ein wenig überraschend:

  • Beim genauen Vergleich (3D-Messung): Der KI-Koch, der nur mit den 244 Premium-Bildern trainiert wurde, war genauso gut wie der Koch, der mit den 2.800 Massen-Bildern trainiert wurde. Sie schnitten fast identisch ab.

    • Die Analogie: Es ist, als würde ein Schüler, der nur 50 Seiten aus einem perfekten Lehrbuch gelernt hat, in einer Prüfung genauso gut bestehen wie ein Schüler, der 500 Seiten aus verschiedenen, etwas unordentlichen Büchern gelesen hat.
  • Der Test mit Fremden (Generalisierung): Als die KI dann mit völlig neuen, fremden Bildern getestet wurde (die sie noch nie gesehen hatte), zeigte sich ein kleiner Unterschied. Der Koch mit den vielen Bildern war hier ein winziges bisschen robuster und flexibler. Er konnte sich besser auf neue Situationen einstellen, weil er so viele verschiedene "Rezepte" gesehen hatte.

Was bedeutet das für uns?

Die Forscher kamen zu einem klaren Fazit, das man sich wie eine Waage vorstellen kann:

  1. Qualität ist König: Wenn Sie eine sehr präzise Aufgabe haben, müssen Sie nicht unbedingt zehntausende Daten sammeln. Eine kleine, aber extrem saubere und gut bearbeitete Menge reicht oft völlig aus, um ein hervorragendes Ergebnis zu erzielen.
  2. Menge hat ihren Preis: Wenn es darum geht, dass die KI auch in völlig neuen, unbekannten Situationen (wie bei anderen Krankenhäusern) gut funktioniert, helfen große Mengen an Daten, auch wenn sie nicht perfekt sind. Sie geben der KI mehr "Erfahrungswerte".

Zusammenfassend:
Es gibt keine einfache Antwort auf die Frage "Qualität oder Quantität?". Es ist wie beim Reisen: Wenn Sie nur eine Stadt besuchen wollen, reicht ein guter Reiseführer (Qualität). Wenn Sie aber die ganze Welt bereisen wollen, brauchen Sie vielleicht eine riesige Bibliothek an Reiseführern, auch wenn einige davon veraltet sind (Quantität). Für die KI-gestützte Leber-Untersuchung hat sich gezeigt, dass man oft mit weniger, aber besserem Material genauso weit kommt wie mit riesigen Datenbergen – es kommt ganz darauf an, was das genaue Ziel ist.

Erhalten Sie solche Paper in Ihrem Posteingang

Personalisierte tägliche oder wöchentliche Digests passend zu Ihren Interessen. Gists oder technische Zusammenfassungen, in Ihrer Sprache.

Digest testen →