Integrated Online Monitoring and Adaption of Process Model Predictive Controllers

Diese Arbeit stellt eine ereignisgesteuerte, datenbasierte Anpassungsmethode für modellprädiktive Regler vor, die mittels statistischer Überwachung der Regelkreisleistung eine Degradation erkennt und bei Bedarf durch Reinforcement Learning sowie Identifikationstechniken eine gezielte Nachjustierung ermöglicht, um katastrophales Vergessen und unnötige Eingriffe zu vermeiden.

Samuel Mallick, Laura Boca de de Giuli, Alessio La Bella, Azita Dabiri, Bart De Schutter, Riccardo Scattolini

Veröffentlicht 2026-03-13
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stellen Sie sich vor, Sie fahren ein hochmodernes, selbstfahrendes Auto (das ist Ihr MPC-Regler). Dieses Auto ist darauf programmiert, den schnellsten und sichersten Weg zu nehmen, indem es die Straße weit voraus berechnet. Damit es das gut kann, braucht es eine sehr genaue Landkarte und ein gutes Verständnis der Physik des Autos (das ist Ihr Vorhersagemodell).

Das Problem ist: Straßen verändern sich. Es kann sein, dass die Reifen abgenutzt sind, der Wind stärker weht oder plötzlich eine Baustelle auftaucht. Wenn das Auto weiterhin mit der alten Landkarte und den alten Annahmen fährt, wird es irgendwann anfangen, unsicher zu werden, zu viel zu bremse oder sogar gegen die Leitplanken zu fahren.

Dieser Papier beschreibt eine intelligente Lösung für genau dieses Problem. Hier ist die Erklärung in einfachen Worten:

1. Der "Gesundheits-Check" (Überwachung)

Statt dass das Auto ständig versucht, alles neu zu berechnen (was Energie kostet und verwirrend sein kann), hat es einen intelligenten Gesundheits-Check.

  • Wie funktioniert das? Das Auto beobachtet nicht nur, ob es gerade geradeaus fährt. Es schaut sich eine ganze Reihe von Indikatoren an: Wie viel Sprit verbraucht es? Wie stark schwankt die Geschwindigkeit? Wie nah ist es an den Leitplanken?
  • Der Vergleich: Das Auto vergleicht diese aktuellen Werte mit einem "perfekten Protokoll" aus der Vergangenheit (dem Referenz-Datensatz). Es fragt sich: "Fahre ich noch so, wie ein gesundes Auto fahren sollte?"
  • Der Alarm: Wenn die aktuellen Werte zu stark vom perfekten Protokoll abweichen (gemessen mit einer Art "statistischem Abstand"), schlägt der Alarm los. Das Auto weiß: "Hey, hier stimmt was nicht mehr!"

2. Die erste Reaktion: Der "Klempner" (Anpassung ohne Umbau)

Wenn der Alarm losgeht, versucht das Auto zuerst, das Problem mit kleinen Tricks zu lösen, ohne das ganze Auto auseinanderzubauen.

  • Die Metapher: Stellen Sie sich vor, Ihr Auto fährt etwas zu hart. Statt den Motor zu tauschen, stellt der Fahrer einfach den Tempomat etwas anders ein oder drückt die Bremse etwas früher.
  • In der Technik: Das System nutzt eine Methode namens Reinforcement Learning (Bestärkendes Lernen). Es passt die "Einstellungen" des Reglers (z. B. wie streng es auf Hindernisse reagiert) an, um sofort wieder sicher zu fahren.
  • Der Vorteil: Das geht sehr schnell und erfordert keine Unterbrechung des Betriebs. Es ist wie ein schneller Handgriff, um die Situation zu retten.

3. Die zweite Reaktion: Der "Mechaniker" (Neues Modell)

Was passiert aber, wenn die kleinen Tricks nicht mehr helfen? Vielleicht ist der Motor wirklich defekt oder die Straße ist komplett anders als gedacht.

  • Die Metapher: Wenn das Einstellen des Tempomats nicht reicht, muss ein echter Mechaniker kommen. Der Mechaniker muss das Auto öffnen, den Motor prüfen und vielleicht sogar neue Teile einbauen. Das dauert länger und ist aufwendiger.
  • In der Technik: Wenn die schnelle Anpassung scheitert, greift das System auf eine Systemidentifikation (sysID) zurück. Das bedeutet, es sammelt neue Daten, um das physikalische Modell des Systems komplett neu zu lernen. Es baut quasi die "Landkarte" neu auf.
  • Der Trick: Das System macht das nur, wenn es wirklich nötig ist. Es will nicht ständig den Motor zerlegen, wenn nur der Tempomat verrückt spielt.

Das große Ganze: Ein kluger Wachhund

Die Idee des Papiers ist also, diese beiden Methoden zu kombinieren:

  1. Immer wachsam sein: Ein statistischer Wächter prüft ständig, ob die Leistung noch "akzeptabel" ist.
  2. Zuerst sanft eingreifen: Wenn etwas schiefgeht, versucht das System, sich selbst zu korrigieren (wie ein erfahrener Fahrer, der den Kurs korrigiert).
  3. Erst dann tiefgreifend ändern: Wenn das nicht hilft, wird das Fundament (das Modell) neu gelernt.

Warum ist das wichtig?

Bisher haben viele Systeme entweder ständig alles neu berechnet (was ineffizient ist und zu Fehlern führen kann, weil sie alte, gute Erfahrungen "vergessen") oder sie haben gar nichts getan, bis es zu spät war.

Dieser neue Ansatz ist wie ein kluger Hausmeister: Er schaut nicht ständig auf die Uhr, sondern prüft, ob das Haus noch warm ist. Wenn es kühler wird, dreht er erst mal den Thermostat hoch (schnelle Anpassung). Erst wenn das nicht reicht, ruft er den Heizungsbauer, um den Kessel zu reparieren (neues Modell).

Das Ergebnis: Ein System, das lange Zeit stabil läuft, aber sofort reagiert, wenn sich die Bedingungen ändern, ohne dabei unnötig Chaos zu verursachen. Das wurde in dem Papier an einem komplexen Fernwärmenetz getestet, wo es genau das tat: Es merkte, dass sich die Nachfrage änderte, und passte sich automatisch an, ohne dass die Heizung ausfiel.