Session Risk Memory (SRM): Temporal Authorization for Deterministic Pre-Execution Safety Gates

Diese Arbeit stellt SRM (Session Risk Memory) vor, einen leichten deterministischen Modul, der durch die Analyse von Trajektorien auf Basis semantischer Zentren die Sicherheit von Agentensystemen verbessert, indem es verteilte Angriffe erkennt und gleichzeitig die Fehlalarmrate im Vergleich zu zustandslosen Gate-Systemen eliminiert.

Florin Adrian Chitan

Veröffentlicht 2026-03-25
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stell dir vor, du hast einen sehr strengen, aber klugen Türsteher für ein exklusives Clubhaus. Dieser Türsteher ist der ILION-Wächter aus dem Paper. Seine Aufgabe ist es, jeden einzelnen Gast zu prüfen, bevor er hereinkommt.

Hier ist die einfache Erklärung der neuen Erfindung, SRM (Session Risk Memory), wie sie im Paper beschrieben wird, mit ein paar anschaulichen Vergleichen:

1. Das Problem: Der "schleichende Dieb"

Der Türsteher (ILION) ist extrem gut darin, sofort zu erkennen, wenn jemand versucht, mit einer Waffe hereinzukommen oder einen falschen Ausweis vorzeigt. Er prüft jede einzelne Handlung: "Darf dieser Gast jetzt ein Glas Wasser holen? Ja. Darf er jetzt einen Stuhl verschieben? Ja."

Aber der Türsteher hat ein kleines Blindspot: Er vergisst, was der Gast vorher getan hat.
Stell dir einen Dieb vor, der nicht mit einer Waffe hereinkommt. Stattdessen macht er harmlose Dinge:

  1. Er fragt nach dem Öffnungszeitenplan (harmlos).
  2. Er macht ein Foto von der Wand (harmlos).
  3. Er nimmt eine Broschüre mit (harmlos).
  4. Er läuft zur Hintertür und wirft die Broschüre hinaus (harmlos).
  5. Er kommt wieder rein und wirft die Broschüre noch einmal hinaus...

Jeder einzelne Schritt ist für den Türsteher erlaubt. Aber wenn man die Reihe der Schritte betrachtet, ist das ein klarer Diebstahl. Der Türsteher sieht nur die einzelnen Schritte, nicht das große Bild. Das nennt man im Paper einen "verteidigten Angriff" (distributed attack).

2. Die Lösung: SRM – Der "Gedächtnis-Beobachter"

Hier kommt SRM ins Spiel. Stell dir SRM als einen zweiten Mitarbeiter vor, der neben dem Türsteher steht. Dieser Mitarbeiter hat ein kurzes Gedächtnis und einen Warn-Index.

  • Der Türsteher (ILION) schaut nur auf die aktuelle Handlung (Raum-Zeit-Konsistenz).
  • SRM schaut auf die Reihe der Handlungen (Zeit-Konsistenz).

Wie funktioniert SRM?

  1. Der "Wärmebild"-Start: Wenn ein Gast (der Agent) den Club betritt, ignoriert SRM die ersten paar Schritte. Es ist wie eine "Aufwärmphase". Der Gast könnte ein Sicherheitsbeauftragter sein, der viel herumläuft und viele Dinge prüft. Das ist normal. SRM lernt also erst, wie "normal" dieser Gast ist.
  2. Der Warn-Index: Sobald der Gast warm ist, fängt SRM an zu zählen. Wenn der Gast Dinge tut, die etwas riskanter sind als sein persönlicher Durchschnitt, steigt ein kleiner Warn-Index.
  3. Der "Kipppunkt": Solange der Index niedrig ist, ist alles okay. Aber wenn der Index einen bestimmten Wert erreicht (weil der Gast langsam aber sicher Dinge tut, die zusammen ein Problem ergeben), sagt SRM: "Stopp! Die Geschichte passt nicht mehr zusammen!" und sperrt den Gast aus.

3. Die zwei Arten von Sicherheit

Das Paper unterscheidet zwei Dinge, die wir brauchen:

  • Räumliche Sicherheit (Der Türsteher): "Ist diese eine Handlung erlaubt?" (Ja/Nein).
  • Zeitliche Sicherheit (SRM): "Macht diese Abfolge von Handlungen Sinn zusammen?" (Ja/Nein).

Ohne SRM könnte ein Hacker den Türsteher austricksen, indem er den Diebstahl in 100 harmlose Schritte zerlegt. Mit SRM wird der Dieb erwischt, weil die Gesamtheit seiner Schritte verdächtig wird, auch wenn jeder einzelne Schritt erlaubt ist.

4. Warum ist das so cool? (Die Ergebnisse)

Das Paper hat das System getestet, indem es 80 verschiedene Szenarien durchgespielt hat (40 normale Gäste, 40 schleichende Diebe).

  • Der alte Türsteher (nur ILION): Hat alle Diebe erwischt (100%), hat aber auch 5 normale Gäste fälschlicherweise rausgeworfen, weil er zu misstrauisch war (falsche Alarme).
  • Das Team (ILION + SRM): Hat alle Diebe erwischt UND keinen normalen Gast fälschlicherweise rausgeworfen.
  • Geschwindigkeit: SRM ist so schnell, dass es kaum Zeit kostet (unter einer Viertelsekunde pro Schritt). Es ist wie ein unsichtbarer Schutzschild, der im Hintergrund läuft.

Zusammenfassung in einem Satz

SRM ist wie ein Sicherheitsassistent, der nicht nur prüft, ob ein einzelner Schritt erlaubt ist, sondern sich merkt, ob die Reise des Agenten langsam in eine falsche Richtung abdriftet, und so schlaue Diebe entlarvt, die sich in harmlose Schritte verstecken.

Es ist eine Art "Gedächtnis" für KI-Agenten, damit sie nicht nur im Moment, sondern auch im Laufe der Zeit sicher bleiben.