Position: Evaluation of Visual Processing Should Be Human-Centered, Not Metric-Centered

Each language version is independently generated for its own context, not a direct translation.

Hier ist eine einfache Erklärung der Positionspapier, als würde man es einem Freund beim Kaffee erklären, ohne Fachjargon.

Das Hauptproblem: Der falsche Richter im Gerichtssaal

Stell dir vor, du bist ein Koch, der die leckersten Gerichte der Welt kocht. Aber dein Bewertungssystem ist nicht der Geschmackssinn deiner Gäste, sondern eine Waage, die nur zählt, wie viele Gramm Zutaten du verwendet hast.

Das ist genau das Problem, das die Autoren dieses Papiers ansprechen. In der Welt der Bildverarbeitung (wie beim Reparieren von alten Fotos oder beim Erstellen neuer Bilder durch KI) wird alles nur noch nach Zahlen bewertet. Wir schauen auf Metriken wie PSNR oder SSIM. Das sind komplexe Formeln, die berechnen, wie ähnlich ein neues Bild einem Originalbild ist.

Die Metapher:
Stell dir vor, du hast ein verpixeltes, unscharfes Foto von deinem Hund.

Die alte KI (Zahlen-Optimierer): Sie macht das Bild so scharf wie möglich, aber sie fügt keine neuen Details hinzu. Das Ergebnis ist ein glattes, verschwommenes Bild. Die "Zahlen-Waage" sagt: "Perfekt! Es sieht dem Original fast identisch aus!"
Die moderne KI (Kreativ-Koch): Sie nutzt ihre Intelligenz, um das Fell des Hundes neu zu malen, die Augen glänzend zu machen und die Pfoten detailliert zu zeichnen. Das Bild sieht für uns Menschen fantastisch aus! Aber die "Zahlen-Waage" sagt: "Fehler! Das Fell sieht nicht exakt so aus wie im Original. Die Zahl ist schlechter!"

Warum das gefährlich ist

Die Autoren sagen: Wir haben uns verirrt.

Weil Forscher und KI-Entwickler unter Druck stehen, diese Zahlen zu verbessern, machen sie Dinge, die nur gut für die Statistik sind, aber schlecht für das menschliche Auge.

Sie machen Bilder künstlich scharf (wie ein zu starker Filter auf Instagram), damit die Zahlen steigen.
Sie vermeiden kreative Lösungen, weil diese oft die Zahlen verschlechtern, auch wenn das Bild schöner aussieht.

Es ist, als würde ein Architekt ein Haus bauen, das innen wunderschön ist, aber weil es eine andere Farbe hat als das alte Haus, bekommt er eine schlechte Bewertung. Niemand würde in so einem Haus wohnen wollen, aber der Architekt würde trotzdem weiter so bauen, weil er nur auf die Farbe achtet.

Die Lösung: Der Mensch muss das Urteil fällen

Die Autoren fordern einen Wechsel im System:

Menschen zuerst: Am Ende schauen Menschen auf die Bilder. Wenn ein Bild gut aussieht, ist es gut. Die KI sollte sich danach richten, wie Menschen empfinden (Schönheit, Realismus, Stimmung), nicht danach, wie gut eine Formel passt.
Kontext ist König: Ein Bild von einem Gemälde braucht andere Bewertungskriterien als ein Bild von einem medizinischen Röntgenbild.
- Bei einem Röntgenbild (Sicherheit!) muss jedes Pixel exakt stimmen. Hier sind die Zahlen wichtig.
- Bei einem Ferienfoto oder einem Kunstwerk zählt nur, ob es uns gefällt. Hier sind die alten Zahlen nutzlos.
Mehr als nur eine Zahl: Statt nur einen einzigen Score (wie "85 Punkte") zu geben, sollten wir detailliertes Feedback bekommen. "Das Gesicht sieht toll aus, aber der Hintergrund ist zu unscharf" oder "Die Farben sind zu grell".

Ein Beispiel aus dem Papier

Die Autoren zeigen, dass moderne KI-Modelle (die sogenannten "Diffusions-Modelle") Bilder erstellen können, die so realistisch sind, dass wir sie kaum von echten Fotos unterscheiden können. Aber die alten Bewertungs-Formeln hassen diese Bilder, weil sie zu viele neue Details enthalten, die im Original gar nicht waren.

Es ist, als würdest du einen neuen, besseren Motor in ein Auto einbauen. Der Motor ist schneller und leiser. Aber die Prüfstelle sagt: "Das Auto wiegt 2 kg mehr als das alte Modell. Das ist ein Fehler!" Das ist absurd.

Fazit

Die Botschaft ist klar: Zahlen sind nützliche Werkzeuge, aber sie sollten nicht die Meister sein.

Wir müssen aufhören, KI-Modelle nur zu trainieren, um in Tabellen oben zu stehen. Stattdessen müssen wir sie trainieren, um Bilder zu machen, die Menschen wirklich mögen und die für den jeweiligen Zweck (Kunst, Medizin, Alltag) passen. Die Forschung muss wieder "menschlich" werden, nicht nur "mathematisch".

Kurz gesagt: Ein Bild sollte nicht nach einer Formel aussehen, sondern nach einem Bild, das uns gefällt.

Position: Evaluation of Visual Processing Should Be Human-Centered, Not Metric-Centered

Das Hauptproblem: Der falsche Richter im Gerichtssaal

Warum das gefährlich ist

Die Lösung: Der Mensch muss das Urteil fällen

Ein Beispiel aus dem Papier

Fazit

Titel der Arbeit

1. Problemstellung

2. Methodik und Analyse

3. Schlüsselbeiträge

4. Ergebnisse und Beobachtungen

5. Bedeutung und Ausblick

Position: Evaluation of Visual Processing Should Be Human-Centered, Not Metric-Centered

Das Hauptproblem: Der falsche Richter im Gerichtssaal

Warum das gefährlich ist

Die Lösung: Der Mensch muss das Urteil fällen

Ein Beispiel aus dem Papier

Fazit

Titel der Arbeit

1. Problemstellung

2. Methodik und Analyse

3. Schlüsselbeiträge

4. Ergebnisse und Beobachtungen

5. Bedeutung und Ausblick

Mehr davon

The Structure of Service Level Agreement of Slice-based 5G Network

Digital currency hardware wallets and the essence of money

Adaptive aggregation of Monte Carlo augmented decomposed filters for efficient group-equivariant convolutional neural network

Positionality in Σ_0^2 and a completeness result

Slightly Non-Linear Higher-Order Tree Transducers