Conformal Graph Prediction with Z-Gromov Wasserstein Distances

Die Autoren schlagen einen konformen Vorhersagerahmen für graphenbasierte Ausgaben vor, der mithilfe des Z-Gromov-Wasserstein-Abstands und der Score Conformalized Quantile Regression (SCQR) eine verteilungsfreie Unsicherheitsquantifizierung für strukturierte Graphen wie Moleküle ermöglicht.

Gabriel Melo, Thibaut de Saivre, Anna Calissano, Florence d'Alché-Buc

Veröffentlicht 2026-03-06
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stell dir vor, du bist ein Detektiv, der versuchen muss, ein vermisstes Objekt zu identifizieren. In der Welt der künstlichen Intelligenz (KI) ist das oft eine chemische Verbindung (ein Molekül), die aus einem Spektrogramm (einer Art „Fingerabdruck" aus Licht und Energie) rekonstruiert werden muss.

Das Problem: Die KI kann oft nicht ein einziges Molekül nennen, das zu 100 % passt. Sie ist unsicher. Wenn sie sich irrt, kann das in der Chemie teuer oder gefährlich werden.

Dieser Paper beschreibt eine neue Methode, um dieser Unsicherheit gerecht zu werden. Statt nur eine „best guess"-Antwort zu geben, sagt die KI: „Hier ist eine Liste von 10 möglichen Kandidaten, und ich garantiere dir, dass das richtige Molekül mit 90 % Wahrscheinlichkeit dabei ist."

Hier ist die einfache Erklärung der drei wichtigsten Ideen, wie ein Detektiv, der mit einem neuen Werkzeug arbeitet:

1. Das Problem: Vergleiche von „Lego-Bauten"

Stell dir vor, du hast zwei Lego-Modelle. Sie sehen gleich aus, aber bei einem sind die Steine anders durcheinander gewürfelt (die Reihenfolge der Steine ist anders).

  • Das alte Problem: Herkömmliche Computerprogramme vergleichen oft Steine an Steinen. Wenn der rote Stein bei Modell A an Position 1 ist und bei Modell B an Position 5, denken sie, es sind zwei völlig verschiedene Modelle. Das ist falsch! Es ist dasselbe Modell, nur anders „beschriftet".
  • Die Lösung (Z-Gromov-Wasserstein): Die Autoren nutzen eine spezielle mathematische Methode (den Z-Gromov-Wasserstein-Abstand), die wie ein kluger Architekt funktioniert. Dieser Architekt schaut nicht auf die Nummern der Steine, sondern auf die Beziehungen zwischen ihnen.
    • Analogie: Es ist wie beim Vergleich von zwei Freundesgruppen. Es ist egal, ob du die Leute in alphabetischer Reihenfolge oder nach Alter auflistest. Der Architekt schaut nur: „Wer kennt wen?" und „Wer sitzt wo?". Wenn die Struktur der Freundschaften gleich ist, sind die Gruppen identisch, egal wie sie benannt sind.

2. Der Sicherheitsgürtel: Konforme Vorhersage

Normalerweise gibt eine KI eine Zahl oder ein Bild aus und hofft, dass es stimmt. Diese Methode fügt einen Sicherheitsgürtel hinzu.

  • Das alte System: Ein Wetterbericht sagt: „Morgen wird es 20 Grad." (Keine Unsicherheit).
  • Das neue System (Konforme Vorhersage): Der Bericht sagt: „Es wird zwischen 18 und 22 Grad."
  • Der Trick: Die KI berechnet für jede neue Aufgabe eine „Unsicherheits-Schwelle". Sie schaut sich ihre Fehler in der Vergangenheit an und sagt: „Okay, um zu 90 % sicher zu sein, muss ich meine Antwortliste so groß machen, dass das richtige Ergebnis fast immer dabei ist."
  • Das Ergebnis: Die KI gibt dir keine einzelne, riskante Antwort, sondern einen Korb mit Kandidaten. Wenn der Korb groß genug ist, ist die Garantie mathematisch bewiesen, dass das Richtige drin ist.

3. Der intelligente Korb: Adaptive Größe (SCQR)

Hier wird es noch cleverer. Nicht alle Aufgaben sind gleich schwer.

  • Das alte System: Ein Sicherheitsgürtel, der für alle gleich dick ist. Bei einer leichten Aufgabe (einfaches Molekül) ist der Korb unnötig riesig (zu viele Kandidaten). Bei einer schweren Aufgabe (komplexes Molekül) ist der Korb vielleicht zu klein, um das Richtige zu fangen.
  • Die neue Lösung (SCQR): Die KI nutzt einen intelligenten Korb, der sich anpasst.
    • Analogie: Stell dir vor, du packst einen Koffer für eine Reise.
      • Für einen kurzen Tagesausflug (einfache Aufgabe) nimmst du nur einen kleinen Rucksack (kleine Kandidatenliste).
      • Für eine Weltreise um die Welt (schwere Aufgabe) nimmst du einen riesigen Koffer (große Kandidatenliste).
    • Die Methode SCQR erkennt, wie schwierig die aktuelle Aufgabe ist (basierend auf den Eingabedaten), und passt die Größe des „Korbs" dynamisch an. So vermeidet sie, den Nutzer mit hunderten unnötigen Möglichkeiten zu überfluten, wenn nur wenige nötig wären.

Zusammenfassung: Was bringt das?

Die Autoren haben ein Werkzeug gebaut, das:

  1. Strukturen versteht: Es vergleicht komplexe Formen (wie Moleküle) richtig, ohne sich von der Reihenfolge der Teile täuschen zu lassen.
  2. Ehrlich ist: Es gibt keine falsche Sicherheit. Es sagt offen: „Ich bin mir nicht zu 100 % sicher, aber hier ist eine Liste, in der das Richtige mit hoher Wahrscheinlichkeit steckt."
  3. Effizient ist: Es passt die Größe dieser Liste automatisch an die Schwierigkeit der Aufgabe an.

Warum ist das wichtig?
In der Medizin oder Chemie ist es besser, 5 mögliche Medikamente zu testen, als sich auf ein falsches zu verlassen, das die KI „für sicher" hielt. Diese Methode hilft Wissenschaftlern, kostspielige Experimente zu planen, indem sie ihnen sagt: „Suche in diesen 10 Kandidaten, das ist der sicherste Weg."