AEX: Non-Intrusive Multi-Hop Attestation and Provenance for LLM APIs

Die Arbeit stellt AEX vor, eine nicht-intrusive Erweiterung für JSON-basierte LLM-APIs, die durch signierte Attestierungsobjekte eine vertrauenswürdige Nachverfolgung der Beziehung zwischen Client-Anfragen und API-Antworten sowie die sichere Provenienz von Ausgaben ermöglicht, ohne die bestehende API-Semantik zu verändern.

Yongjie Guan

Veröffentlicht 2026-03-17
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stellen Sie sich vor, Sie bestellen ein komplexes Gericht in einem Restaurant, das Sie nicht selbst betreten können. Sie schicken Ihre Bestellung über einen Kellner (die API) in die Küche. Am Ende erhalten Sie das Essen zurück. Aber wie können Sie sicher sein, dass:

  1. Der Koch wirklich das gekocht hat, was Sie bestellt haben?
  2. Niemand unterwegs das Essen umgetauscht hat?
  3. Der Kellner nicht einfach ein anderes Gericht aus der Speisekarte genommen und behauptet hat, es sei Ihr Essen?

Das ist genau das Problem, das mit Künstlicher Intelligenz (KI) und deren APIs (den Schnittstellen, über die wir KI-Modelle nutzen) passiert. Oft wissen wir nicht genau, ob die Antwort der KI wirklich von dem Modell stammt, das wir glauben, oder ob sie unterwegs manipuliert wurde.

Die Forscherin Yongjie Guan aus diesem Papier schlägt eine Lösung vor, die sie AEX nennt. Hier ist eine einfache Erklärung, wie das funktioniert, mit ein paar anschaulichen Vergleichen:

1. Das Problem: Der "Schatten-API"-Kellner

Stellen Sie sich vor, es gibt viele Kellner, die behaupten, sie würden für das berühmte Restaurant "OpenAI" arbeiten. Manche sind echte Angestellte, andere sind Betrüger, die nur so tun.

  • Das Risiko: Sie bestellen "Pizza", aber der Kellner gibt Ihnen eine "Torte" und behauptet, das sei die Pizza. Oder er gibt Ihnen die Pizza, aber jemand hat unterwegs eine Mücke hineingeworfen.
  • Bisherige Lösungen: Bisher versuchten Leute, die Pizza zu "schmecken" (Fingerabdruck-Tests), um zu erraten, wer sie gemacht hat. Das funktioniert aber nicht immer zuverlässig. Oder sie verlangen, dass der Koch seine Kochjacke (Hardware) vorzeigt. Das ist aber oft zu kompliziert für den normalen Gast.

2. Die Lösung: AEX – Der "Unverfälschte Siegel-Beleg"

AEX ist wie ein digitaler, versiegelter Beleg, den der Chef des Restaurants (der vertrauenswürdige KI-Anbieter) direkt auf Ihre Bestellung und Ihr Essen klebt.

Wie funktioniert das im Alltag?

  • Der "Klebe-Beleg" (Attestation):
    Wenn Sie Ihre Bestellung (den "Request") absenden, fügt das System einen unsichtbaren, aber mathematisch unzerstörbaren Stempel hinzu. Wenn das Essen (die "Antwort") zurückkommt, ist auf dem Teller ein weiterer Stempel.

    • Die Magie: Der Stempel auf dem Teller beweist: "Dieses Essen wurde genau für diese Bestellung zubereitet." Wenn jemand unterwegs das Essen ändert (z. B. die Pizza in eine Torte verwandelt), passt der Stempel nicht mehr. Der Beleg wird ungültig.
  • Die "Spezial-Kellner" (Vertrauenswürdige Zwischenhändler):
    Manchmal muss Ihre Bestellung auf dem Weg in die Küche angepasst werden (z. B. "Keine Nüsse!" hinzufügen). Oder das Essen wird auf dem Weg zurück umverpackt (z. B. aus einer Schale in eine Box).

    • Das AEX-System: Es erlaubt diesen Änderungen, aber nur, wenn sie offiziell genehmigt sind. Jeder Kellner, der etwas ändert, muss einen eigenen, unterschriebenen Zettel (einen "Quittungs-Beleg") hinterlassen.
    • Am Ende sehen Sie nicht nur, dass das Essen da ist, sondern auch eine Kette von Zetteln: "Chef hat Pizza gemacht -> Kellner A hat 'Keine Nüsse' hinzugefügt -> Kellner B hat es in die Box gepackt."
    • Wenn ein Kellner heimlich etwas ändert (z. B. die Pizza durch eine Torte ersetzt), fehlt der Zettel, und Sie wissen sofort: "Aha, hier wurde geschummelt!"
  • Der "Live-Stream" (Streaming):
    Oft kommt die Antwort der KI nicht als ein ganzer Teller, sondern als einzelne Bissen, die nacheinander ankommen (wie ein Video-Stream).

    • Das Problem: Wie weiß man, ob der Stream mitten drin abgehackt wurde oder ob jemand einen Bissen eingefügt hat?
    • Die AEX-Lösung: Es gibt zwei Modi:
      1. Der direkte Stream: Jeder Bissen wird sofort mit einem Siegel versehen. Sie können sofort sehen: "Ja, der erste Bissen ist echt, der zweite auch..."
      2. Der umgepackte Stream: Wenn das Essen unterwegs umgepackt wurde (z. B. aus einem Stream in ein ganzes Gericht verwandelt), gibt es keine "Bissen-Siegel" mehr. Stattdessen erhalten Sie am Ende einen Gesamt-Beleg, der beweist: "Dieses ganze Gericht wurde aus dem ursprünglichen Stream zusammengesetzt, und hier ist die Kette der Umverpacker."

3. Was AEX NICHT tut (Die Grenzen)

Es ist wichtig zu verstehen, was dieser "Beleg" nicht beweist:

  • Er beweist nicht, dass die Pizza schmeckt (die KI-Antwort ist nicht unbedingt "wahr" oder "faktisch korrekt").
  • Er beweist nicht, dass der Koch keine geheimen Zutaten (versteckte Prompts) benutzt hat.
  • Er beweist nur: Dieses Essen wurde von diesem Koch für diese Bestellung zubereitet und niemand hat es unterwegs manipuliert.

Zusammenfassung in einem Satz

AEX ist wie ein unfälschbares, digitales Siegel, das auf Ihre KI-Bestellung geklebt wird. Es garantiert, dass das, was Sie am Ende erhalten, genau das ist, was Sie bestellt haben – und wenn jemand unterwegs etwas geändert hat (auch von vertrauenswürdigen Helfern), dann ist das genau dokumentiert. Wenn jemand heimlich schummelt, platzt das Siegel, und Sie werden es sofort merken.

Das Ziel ist es, das Vertrauen in die KI-Infrastruktur wiederherzustellen, ohne dass man die ganze Küche (die KI-Modelle) umbauen muss. Es ist ein "Aufkleber für die Wahrheit" an der Tür des Restaurants.

Erhalten Sie solche Paper in Ihrem Posteingang

Personalisierte tägliche oder wöchentliche Digests passend zu Ihren Interessen. Gists oder technische Zusammenfassungen, in Ihrer Sprache.

Digest testen →