Data-Driven Prediction and Control of Hammerstein-Wiener Systems with Implicit Gaussian Processes

Diese Arbeit stellt einen datengesteuerten Ansatz zur Vorhersage und Regelung von Hammerstein-Wiener-Systemen vor, der physikinformierte Gauß-Prozesse mit einer impliziten Struktur nutzt, um die Blockstruktur des Modells zu kodieren und dabei die Vorhersagegenauigkeit sowie die Regelungsleistung im Vergleich zu reinen Black-Box-Modellen signifikant zu verbessern.

Mingzhou Yin, Matthias A. Müller

Veröffentlicht 2026-03-03
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stellen Sie sich vor, Sie versuchen, das Wetter vorherzusagen, aber Sie kennen die genauen physikalischen Gesetze der Atmosphäre nicht. Sie haben nur ein Tagebuch mit vergangenen Wetterdaten (Temperatur, Wind, Regen).

Die meisten modernen Methoden würden versuchen, eine riesige, undurchsichtige „Blackbox"-Formel zu finden, die einfach nur Muster in diesen Daten erkennt. Das funktioniert oft gut, aber es ist wie ein blindes Raten: Wenn die Daten einmal etwas anders aussehen als erwartet, kann die Vorhersage völlig danebenliegen.

Dieser Papier beschreibt einen clevereren Weg, um das Verhalten bestimmter komplexer Systeme (die sogenannten Hammerstein-Wiener-Systeme) vorherzusagen und zu steuern. Hier ist die Erklärung in einfachen Worten:

1. Das Problem: Ein Sandwich aus Verzerrungen

Stellen Sie sich das System als ein Sandwich vor:

  • Das untere Brot (Eingang): Das Signal wird zuerst durch einen „Verzerrer" geschickt (z. B. ein Sensor, der bei hohen Werten nicht mehr linear reagiert).
  • Die Füllung (Kern): Dann passiert etwas ganz lineares und Vorhersagbares (wie ein einfacher Feder-Masse-System).
  • Das obere Brot (Ausgang): Am Ende wird das Ergebnis noch einmal durch einen zweiten „Verzerrer" geschickt (z. B. ein Aktuator, der sich anders verhält als erwartet).

Das Schwierige ist: Wir kennen die Formel für das untere und das obere Brot nicht. Wir kennen nur das Sandwich als Ganzes.

2. Die alte Methode: Blindes Raten vs. Strukturwissen

Frühere Methoden haben versucht, das ganze Sandwich als eine riesige, undurchsichtige Blackbox zu lernen. Das ist wie wenn Sie versuchen, ein Rezept zu erraten, indem Sie einfach nur schmecken, ohne zu wissen, dass es aus drei Schichten besteht. Das funktioniert oft schlecht, besonders wenn Sie in die Zukunft blicken wollen (mehrere Schritte voraus).

3. Die neue Methode: Der „Geheimnis-Entschlüssler" (Implicit Gaussian Processes)

Die Autoren dieses Papiers nutzen eine Technik namens Gaussian Processes (GP), die man sich wie einen sehr klugen, vorsichtigen Wahrsager vorstellen kann. Aber sie machen ihn schlauer, indem sie ihm die Struktur des Sandwichs verraten.

Statt das ganze Sandwich auf einmal zu erraten, sagen sie dem Wahrsager:

„Hey, wir wissen, dass da drinnen eine lineare Füllung ist und zwei verzerrte Brote. Bitte lerne die Verzerrungen und die Füllung getrennt, aber so, dass sie zusammenpassen."

Das nennt man einen impliziten Ansatz. Anstatt eine direkte Formel für das Ergebnis zu suchen, suchen sie nach den Regeln, die die Teile verbinden.

4. Die kreativen Tricks

A. Die „Geister-Punkte" (Virtual Derivative Points)

Manchmal wissen wir, dass ein Teil des Systems sich nur in eine Richtung verhalten kann (z. B. wenn Sie mehr Druck auf einen Knopf geben, wird das Ergebnis nie kleiner, sondern nur größer). Das nennt man Monotonie.
Da Computer manchmal „verrückt" werden und sagen, dass mehr Druck zu weniger Ergebnis führt, fügen die Autoren virtuelle Geister-Punkte hinzu.

  • Analogie: Stellen Sie sich vor, Sie trainieren einen Hund. Sie sagen nicht nur „Geh links", sondern Sie stellen unsichtbare Zäune auf, die dem Hund verbieten, nach rechts zu gehen. Diese unsichtbaren Zäune (die Geister-Punkte) zwingen den Wahrsager, nur logische, monotone Vorhersagen zu treffen.

B. Der „Stabile Architekt" (Stable Spline Hyperprior)

Die lineare Füllung im Sandwich muss stabil sein (sie darf nicht ins Unendliche explodieren). Um sicherzustellen, dass der Wahrsager keine wilden, unmöglichen Formeln erfindet, geben sie ihm einen strengen Architekten als Mentor. Dieser Mentor sagt: „Nur solche linearen Muster sind erlaubt, die physikalisch stabil sind." Das verhindert, dass das Modell sich nur die Trainingsdaten auswendig lernt (Overfitting), sondern wirklich die Gesetze versteht.

5. Die Anwendung: Der autonome Fahrer

Am Ende nutzen die Autoren dieses Modell, um ein Auto (oder einen Roboter) zu steuern.

  • Das Ziel: Das Auto soll einer Kurve folgen.
  • Das Problem: Der Sensor liefert verzerrte Werte, und der Motor reagiert nicht perfekt linear.
  • Die Lösung: Der Algorithmus berechnet nicht nur den besten Weg, sondern berücksichtigt auch die Unsicherheit. Er sagt: „Wenn ich hier zu schnell fahre, könnte mein Sensor mich täuschen. Also bremse ich lieber etwas ab, um sicherzugehen."
  • Das Ergebnis: Das Auto fährt sicherer und präziser als Systeme, die nur blindes Raten nutzen.

Zusammenfassung

Statt zu versuchen, das ganze Rätsel auf einmal zu lösen, zerlegen die Autoren das Problem in seine logischen Teile (Verzerrer und lineares Kernstück). Sie nutzen mathematische Tricks (Geister-Punkte und stabile Architekten), um sicherzustellen, dass die Vorhersagen physikalisch sinnvoll bleiben.

Das Ergebnis: Ein System, das nicht nur Daten auswendig lernt, sondern die zugrunde liegende Struktur versteht. Es ist wie der Unterschied zwischen einem Schüler, der nur die Lösungen im Antwortbuch abschreibt, und einem Schüler, der wirklich die Formeln verstanden hat und sie auch auf neue, unbekannte Aufgaben anwenden kann.

Erhalten Sie solche Paper in Ihrem Posteingang

Personalisierte tägliche oder wöchentliche Digests passend zu Ihren Interessen. Gists oder technische Zusammenfassungen, in Ihrer Sprache.

Digest testen →