Criteria-first, semantics-later: reproducible structure discovery in image-based sciences

Der Artikel schlägt einen Paradigmenwechsel in der bildbasierten Wissenschaft vor, bei dem die semantikfreie, kriterienbasierte Strukturerkennung der semantischen Zuordnung vorgeschaltet wird, um reproduzierbare und ontologieunabhängige Analysen zu ermöglichen.

Jan Bumberger

Veröffentlicht 2026-02-18
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Das Problem: Wenn wir versuchen, Bilder zu lesen, bevor wir sie verstehen

Stellen Sie sich vor, Sie sind ein Archäologe, der gerade eine neue, unbekannte Ruinenstadt ausgegraben hat.

Der alte Weg („Semantik zuerst"):
Sie nehmen sofort ein Buch mit einer Liste von Wörtern zur Hand: „Das ist ein Tempel", „Das ist ein Haus", „Das ist ein Stall". Sie schauen auf einen Steinhaufen und versuchen verzweifelt, ihn in diese Kategorien zu zwängen.

  • Das Problem: Was passiert, wenn die Steinhaufen anders aussehen als in Ihrem Buch? Oder wenn Sie in eine andere Stadt kommen, wo die Menschen „Tempel" anders definieren? Oder wenn Sie in 50 Jahren wieder da sind und die Wörterbücher sich geändert haben? Dann sind Ihre alten Karten wertlos. Sie haben die Struktur des Haufens ignoriert, nur um ihm schnell einen Namen zu geben.

Der neue Weg („Kriterien zuerst, Bedeutung später"):
Der Autor Jan Bumberger schlägt vor: Hören Sie auf, sofort zu benennen.
Schauen Sie sich stattdessen erst an, wie die Steine tatsächlich zusammenhängen.

  • Welche Steine liegen fest aufeinander?
  • Wo gibt es klare Risse?
  • Welche Formen wiederholen sich?

Erst wenn Sie diese stabile Struktur verstanden haben, können Sie ihr einen Namen geben. Und das Beste: Sie können diesen Namen später ändern, ohne die Steine neu zu sortieren.


Die große Analogie: Der Bau eines Hauses

Stellen Sie sich vor, Sie wollen ein Haus bauen und es vermessen.

  1. Die „Semantik-zuerst"-Methode (Der alte Fehler):
    Sie gehen mit einem Maßband auf die Baustelle und rufen sofort: „Das hier ist das Wohnzimmer!" „Das ist die Küche!"

    • Was passiert, wenn sich die Bauvorschriften ändern? Wenn morgen das Gesetz sagt, dass „Küchen" jetzt größer sein müssen, müssen Sie das ganze Haus neu vermessen und die Wände verschieben, nur weil sich das Wort geändert hat. Das ist ineffizient und instabil.
  2. Die „Kriterien-zuerst"-Methode (Der neue Ansatz):
    Sie ignorieren zuerst die Wörter „Küche" oder „Wohnzimmer".
    Stattdessen nutzen Sie klare, objektive Regeln (Kriterien):

    • „Wo ist eine gerade Linie?"
    • „Wo ändert sich das Material?"
    • „Wo ist eine stabile Ecke?"

    Sie zeichnen diese Linien und Ecken auf. Das ist Ihre Struktur. Sie ist objektiv, messbar und bleibt gleich, egal wie man die Räume nennt.

    • Der Vorteil: Wenn sich die Definition von „Küche" ändert, müssen Sie nur das Schild an der Tür austauschen. Die Wände (die Struktur) bleiben stabil. Sie können das Haus auch in 50 Jahren wieder vermessen, und die Linien sind immer noch da.

Warum ist das für die Wissenschaft so wichtig?

In der Wissenschaft (z. B. bei Satellitenbildern der Erde, medizinischen Röntgenaufnahmen oder Mikroskopie) passiert genau das „Semantik-zuerst"-Problem:

  • Die Wörter wandern: Was heute als „Krankheit A" gilt, kann morgen als „Symptom B" bezeichnet werden.
  • Die Sensoren wandern: Ein neues Kamera-Modell sieht Farben anders.
  • Die Entdeckungen wandern: Wir finden Dinge, für die es noch gar kein Wort gibt.

Wenn wir KI-Modelle nur darauf trainieren, diese Wörter zu erraten, brechen sie zusammen, sobald sich die Welt ein wenig ändert.

Die Lösung des Papers:
Wir sollten KI-Modelle so bauen, dass sie erst Muster erkennen (z. B. „hier ist ein klarer Rand", „hier ist ein zusammenhängendes Objekt"). Diese Muster sind wie die Wände im Haus. Sie sind stabil.
Erst danach (später, „semantics-later") können wir diese Muster mit den aktuellen Begriffen unserer Wissenschaft verbinden.

Die Vorteile auf einen Blick

  1. Stabilität: Die „Struktur" (die Wände) bleibt gleich, auch wenn sich die „Namen" (die Schilder) ändern.
  2. Wiederverwendbarkeit: Ein einmal erkanntes Muster kann von verschiedenen Wissenschaftlern unterschiedlich genutzt werden. Der eine nennt es „Wald", der andere „Ökosystem". Beide nutzen dieselbe stabile Basis.
  3. Entdeckung: Wir können Dinge finden, für die wir noch kein Wort haben. Das Muster ist da, auch wenn wir es noch nicht benennen können.
  4. Fairness & Transparenz: Jeder kann genau sehen, nach welchen Regeln (Kriterien) die Muster gefunden wurden. Es ist kein „Zauberkasten" mehr, der nur auf bestimmte Wörter trainiert wurde.

Zusammenfassung in einem Satz

Statt zu versuchen, ein Bild sofort in ein festes Wörterbuch zu stecken, sollten wir zuerst die stabilen Muster und Strukturen im Bild finden (die „Wände"), und erst danach entscheiden, wie wir diese Muster nennen (die „Schilder"). So bleibt unsere Wissenschaft auch dann noch brauchbar, wenn sich die Sprache und die Werkzeuge der Zukunft ändern.

Erhalten Sie solche Paper in Ihrem Posteingang

Personalisierte tägliche oder wöchentliche Digests passend zu Ihren Interessen. Gists oder technische Zusammenfassungen, in Ihrer Sprache.

Digest testen →