Formal Semantics for Agentic Tool Protocols: A Process Calculus Approach

Diese Arbeit stellt die erste Prozesskalkül-Formalisierung der Agenten-Protokolle SGD und MCP bereit, beweist deren strukturelle Bisimilarität unter einer spezifischen Abbildung, identifiziert jedoch durch die Analyse der umgekehrten Abbildung kritische Ausdruckslücken in MCP, die durch die Einführung des Typsystems MCP+ geschlossen werden, um eine vollständige behaviorale Äquivalenz und formale Verifizierbarkeit zu gewährleisten.

Andreas Schlapbach

Veröffentlicht 2026-03-27
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stell dir vor, du hast einen extrem klugen, aber manchmal etwas chaotischen Assistenten (den KI-Agenten). Dieser Assistent kann Dinge tun, die er nicht selbst kann, indem er auf Werkzeuge zugreift – wie einen Zug buchen, Geld überweisen oder eine E-Mail senden. Damit er diese Werkzeuge sicher und korrekt benutzt, braucht er eine Art „Bauanleitung" oder „Speisekarte", die ihm genau sagt, was er tun darf und wie.

In der Welt der KI gibt es aktuell zwei große Ansätze, wie diese Bauanleitungen erstellt werden:

  1. SGD (Schema-Guided Dialogue): Ein akademischer Ansatz, der sehr detailliert ist und genau festlegt, wann eine Aktion sicher ist (z. B. „Du darfst Geld nur abheben, wenn du vorher den Kontostand geprüft hast").
  2. MCP (Model Context Protocol): Ein industrieller Standard, der schnell und flexibel ist, um viele verschiedene Werkzeuge zu verbinden, aber manchmal wichtige Sicherheitsdetails vergisst.

Der Autor dieses Papers, Andreas Schlapbach, stellt sich die Frage: Sind diese beiden Ansätze eigentlich dasselbe? Und wenn ja, warum funktioniert der eine manchmal sicherer als der andere?

Hier ist die einfache Erklärung der Forschung, verpackt in eine Geschichte:

1. Die Sprache der Werkzeuge (Die formale Semantik)

Stell dir vor, SGD und MCP sind zwei verschiedene Sprachen, in denen Architekten (die Entwickler) dem Bauarbeiter (der KI) sagen, wie er bauen soll.

  • Der Autor hat eine neue, universelle Grammatik (eine Art „Mathematik für Prozesse") entwickelt, um beide Sprachen zu übersetzen.
  • Er hat bewiesen, dass man die Bauanleitung von SGD fast perfekt in die Sprache von MCP übersetzen kann. Das ist wie das Übersetzen eines detaillierten Kochrezepts in eine einfache Einkaufsliste.

2. Das Problem: Der Informationsverlust (Die Lücke)

Hier kommt das Wichtigste: Wenn man von SGD (dem detaillierten Rezept) zu MCP (der Einkaufsliste) wechselt, geht Information verloren.

Die Analogie:
Stell dir vor, SGD sagt: „Nimm den Hammer, aber nur, wenn du einen Schutzhelm auf hast und der Boden trocken ist."
MCP sagt nur: „Nimm den Hammer."

Der MCP-Standard vergisst drei kritische Dinge, die in SGD enthalten sind:

  1. Der „Gefahren-Status": Ist diese Aktion gefährlich? (MCP weiß nicht immer, ob eine Handlung Geld kostet oder Daten löscht).
  2. Der „Notfallplan": Was passiert, wenn etwas schiefgeht? (SGD hat genaue Pläne für Fehler, MCP oft nicht).
  3. Die „Abhängigkeiten": Muss ich zuerst A machen, bevor ich B tue? (SGD sagt es explizit, MCP lässt es oft offen).

Ohne diese Details kann der KI-Assistent vielleicht versehentlich Geld abheben, ohne vorher zu prüfen, ob genug drauf ist, oder er weiß nicht, was er tun soll, wenn ein Server abstürzt.

3. Die Lösung: MCP+ (Das Upgrade)

Der Autor schlägt vor, MCP nicht zu verwerfen, sondern zu upgraden. Er nennt das neue System MCP+.

Er fügt fünf einfache Regeln hinzu, die MCP wieder so sicher machen wie SGD:

  1. Semantische Vollständigkeit: Beschreibungen müssen nicht nur sagen was ein Werkzeug ist, sondern warum es existiert und was es bedeutet (wie ein detailliertes Etikett auf einer Medizin).
  2. Klare Grenzen: Jedes Werkzeug muss ein rotes oder grünes Licht haben: „Darf ich das einfach tun (grün)" oder „Darf ich das nur mit Erlaubnis tun (rot, z. B. bei Löschaktionen)".
  3. Fehler-Protokolle: Jedes Werkzeug muss eine Anleitung dabei haben: „Wenn ich scheitere, versuche es noch 3 Mal" oder „Wenn ich scheitere, rufe den Menschen an".
  4. Schrittweise Enthüllung: Um Platz zu sparen, darf das Werkzeug erst eine kurze Zusammenfassung zeigen und erst auf Nachfrage die langen Details. (Wie ein Menü: Erst die Überschrift, dann die Zutatenliste).
  5. Beziehungen: Es muss klar sein, welche Werkzeuge voneinander abhängen (z. B. „Ich kann nur zahlen, wenn vorher bestellt wurde").

4. Das Ergebnis: Sicherheit durch Mathematik

Mit diesen fünf Regeln (MCP+) wird MCP mathematisch gleichwertig zu SGD.
Das bedeutet:

  • Man kann beweisen, dass der Assistent niemals einen gefährlichen Befehl ausführt, ohne vorher zu prüfen.
  • Man kann beweisen, dass der Assistent niemals in einer Endlosschleife stecken bleibt.
  • Man kann beweisen, dass der Assistent niemals versehentlich Daten stiehlt (durch „Tool Poisoning", also manipulierte Beschreibungen).

Warum ist das wichtig?

Bisher verließen wir uns darauf, dass die KI „gute Absichten" hat oder dass wir sie viel testen. Aber Tests finden nicht alle Fehler.
Dieser Ansatz macht Sicherheit zu einer mathematischen Eigenschaft. Es ist wie ein Sicherheitsgurt im Auto: Man muss nicht hoffen, dass er funktioniert, man kann beweisen, dass er es tut, solange die Regeln eingehalten werden.

Zusammenfassend:
Der Autor hat bewiesen, dass die beiden großen KI-Standards eigentlich dasselbe Ziel haben, aber einer (MCP) ohne die richtigen Sicherheitsregeln zu riskant ist. Durch das Hinzufügen von fünf klaren Regeln (MCP+) schaffen wir ein System, in dem KI-Agenten nicht nur clever, sondern auch nachweisbar sicher sind. Das ist der Grundstein für eine Zukunft, in der KI sicher unsere Gelder verwaltet, Krankenhäuser steuert oder Züge lenkt.