Directional Reasoning Trajectory Change (DRTC): Identifying Critical Trace Segments in Reasoning Models

Die Arbeit stellt DRTC vor, eine kausale Methode zur Identifizierung kritischer Wendepunkte in den Denkprozessen von Sprachmodellen, die durch gezielte Eingriffe in den Kontext nachweist, wie spezifische Textabschnitte die推理-Trajektorie steuern.

Waldemar Chang

Veröffentlicht 2026-03-03
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stell dir vor, ein KI-Modell ist wie ein Reisender, der eine sehr lange und verworrene Reise durch einen riesigen, dunklen Wald macht, um einen Schatz (die richtige Antwort auf eine Matheaufgabe) zu finden.

Oft läuft dieser Reisende erst in die falsche Richtung, stolpert über Wurzeln, dreht sich um, beschließt, einen anderen Weg zu gehen, und erst nach vielen Umwegen findet er den Schatz.

Bisher konnten Forscher nur sagen: „Hier ist der Schatz!" oder „Hier war der Reisende gerade." Aber sie wussten nicht genau: Wann hat er beschlossen, umzudrehen? Welches Blatt auf dem Boden hat ihn dazu gebracht, den Weg zu wechseln? Und war das wirklich der entscheidende Moment oder nur ein zufälliges Rauschen?

Das ist das Problem, das diese neue Methode namens DRTC (Directional Reasoning Trajectory Change) löst.

Hier ist die Erklärung in einfachen Bildern:

1. Das Problem: Der Labyrinth-Weg

Stell dir vor, du schaust einem Menschen zu, der ein Labyrinth durchquert. Er läuft 100 Schritte nach links, dann 50 Schritte nach rechts, dann stolpert er, denkt nach, und läuft plötzlich geradeaus zum Ausgang.
Wenn du nur das Endergebnis siehst, ist das Labyrinth gelöst. Aber wenn du verstehen willst, wie er es geschafft hat, musst du wissen:

  • War der Moment, in dem er stolperte, der wichtigste?
  • Oder war es der Satz, den er sich vor 20 Minuten selbst gesagt hat („Ich muss hier links abbiegen")?

Bisherige Methoden waren wie ein Highlighter-Stift: Sie haben einfach alle Wörter markiert, die am Ende wichtig schienen. Aber sie haben nicht gezeigt, wann und warum das Gehirn des KI-Modells den Kurs geändert hat.

2. Die Lösung: DRTC als „Zeitmaschinen-Kamera"

DRTC ist wie eine spezielle Kamera, die zwei Dinge tut:

Schritt A: Die „Wendepunkte" finden (Pivots)
Die Kamera sucht nach den Momenten, in denen der Reisende unsicher wird. Das sind die Stellen, wo er zögert, wo er sagt: „Moment mal, das ergibt keinen Sinn" oder „Vielleicht sollte ich es anders versuchen".

  • Analogie: Stell dir vor, du fährst mit dem Auto. Die Kamera sucht nicht nach jeder kleinen Kurve, sondern nur nach den Stellen, wo du das Lenkrad hart herumreißt, weil du einen neuen Weg gewählt hast. Diese Momente nennt das Papier Pivots (Drehpunkte).

Schritt B: Der „Geister-Test" (Intervention)
Jetzt kommt der magische Teil. An genau diesen Wendepunkten stellt sich die Frage: „Was wäre passiert, wenn wir den Reisenden nicht den Weg gezeigt hätten, den er vor 5 Minuten gegangen ist?"

Normalerweise würde man das Modell neu starten lassen, wenn man etwas ändert. Das wäre aber wie ein anderer Reisender auf einem anderen Weg – man könnte sie nicht vergleichen.
DRTC macht etwas Cleveres: Es blockiert nur die Information aus einem bestimmten früheren Textabschnitt genau in dem Moment, in dem der Wendepunkt passiert.

  • Die Analogie: Stell dir vor, der Reisende steht an einer Kreuzung (dem Wendepunkt). Jemand hält ihm eine Brille vor die Augen, die ihm nur den Textblock von vor 5 Minuten verdeckt. Aber der Rest der Welt bleibt gleich.
  • Schaut er dann immer noch in die gleiche Richtung? Oder dreht er sich plötzlich um?

3. Das Ergebnis: Eine Landkarte der Entscheidungen

Wenn das Entfernen eines Textblocks den Reisenden dazu bringt, in eine völlig andere Richtung zu schauen, dann war dieser Textblock entscheidend.

Das Papier misst genau, wie stark sich die Richtung ändert.

  • Positive Punkte: Textstellen, die den Reisenden auf dem richtigen Weg gehalten haben (wie ein Wegweiser).
  • Negative Punkte: Textstellen, die ihn verwirrt haben oder in die Irre geführt haben (wie ein falscher Wegweiser, den er später korrigiert hat).

4. Warum ist das cool?

Die Forscher haben herausgefunden, dass nicht alles wichtig ist.

  • Konzentration: Wie bei einem Orchester, bei dem nur ein paar Instrumente die Melodie tragen, sind bei der KI nur wenige Textstellen (etwa 5 % des Textes) für die entscheidenden Richtungswechsel verantwortlich. Der Rest ist nur „Füllmaterial" oder Hintergrundrauschen.
  • Lernen vs. Zufall: Wenn man zufällige Textstellen testet, passiert fast nichts. Aber wenn man die Stellen testet, die die KI selbst als wichtig erachtet hat (die „gelernten" Wendepunkte), dann ändern sich die Ergebnisse drastisch. Das beweist, dass die KI wirklich denkt und nicht nur zufällig Wörter aneinanderreiht.

Zusammenfassung in einem Satz

DRTC ist wie ein Detektiv, der nicht nur schaut, wo der Täter (die Antwort) war, sondern genau nachvollzieht, an welchem Punkt im Verhör (dem Denkprozess) der Verdächtige (die KI) beschlossen hat, die Wahrheit zu sagen, und welche Aussage (welcher Text) ihn dazu gebracht hat, die Richtung zu ändern.

Es hilft uns zu verstehen, dass KI nicht nur ein „Black Box" ist, die magisch antwortet, sondern ein Prozess, bei dem bestimmte Momente und Informationen den Kurs der Reise entscheidend lenken.

Erhalten Sie solche Paper in Ihrem Posteingang

Personalisierte tägliche oder wöchentliche Digests passend zu Ihren Interessen. Gists oder technische Zusammenfassungen, in Ihrer Sprache.

Digest testen →