Opponent State Inference Under Partial Observability: An HMM-POMDP Framework for 2026 Formula 1 Energy Strategy

Diese Arbeit stellt ein zweistufiges HMM-POMDP-Rahmenwerk vor, das die Energiestrategie für die Formel-1-Saison 2026 optimiert, indem es mittels eines Hidden-Markov-Modells den verborgenen Zustand von Gegnern aus Telemetriedaten ableitet und eine Deep-Q-Network-Politik zur Vermeidung von Täuschungsmanövern wie dem „Counter-Harvest Trap" steuert.

Kalliopi Kleisarchaki

Veröffentlicht Tue, 10 Ma
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stellen Sie sich vor, Sie sitzen in einem Formel-1-Rennwagen im Jahr 2026. Aber es ist kein normales Rennen. Es ist wie ein Schachspiel, bei dem Sie die Figuren Ihres Gegners nicht sehen können, aber Sie müssen wissen, ob er gerade eine Falle stellt oder ob er wirklich schwach ist.

Dieser wissenschaftliche Artikel beschreibt einen digitalen Detektiv und einen taktischen Berater, die Ihrem Team helfen, diese unsichtbaren Informationen zu erraten und die richtigen Entscheidungen zu treffen.

Hier ist die Erklärung in einfachen Worten:

1. Das Problem: Das Rennen im Nebel

Früher war Formel 1 relativ einfach: Wenn Sie schneller waren, haben Sie gewonnen. Aber ab 2026 gibt es neue Regeln. Die Autos haben eine riesige Batterie (wie ein riesiger Akku im Elektroauto), die sie ständig laden und entladen müssen.

Das Tückische: Sie wissen nicht, wie voll die Batterie Ihres Gegners ist.

  • Hat er noch viel Energie für einen schnellen Angriff?
  • Oder ist sie leer, und er muss langsam fahren?
  • Oder ist das alles nur eine Täuschung? Vielleicht macht er so, als wäre er schwach, damit Sie auf ihn zugehen und Ihre eigene Energie verschwenden – nur damit er Sie dann mit voller Kraft überholt. Das nennt der Autor die „Gegenernte-Falle" (Counter-Harvest Trap).

2. Die Lösung: Zwei Schichten aus KI

Der Autor schlägt ein System vor, das aus zwei Teilen besteht, wie ein Detektiv und ein Stratege.

Schicht 1: Der Detektiv (Das HMM)

Stellen Sie sich diesen Teil als einen sehr aufmerksamen Spion vor, der nur die Dinge sieht, die auch Sie sehen können:

  • Wie schnell fährt der Gegner an der Messstrecke vorbei?
  • Wie lange braucht er für eine Kurve?
  • Wann bremst er?
  • Neu ab 2026: Wie stark drückt er das Gaspedal, wenn er eigentlich langsamer ist als sonst? (Das ist der „Gaspedal-Clue").

Der Detektiv nutzt diese kleinen Hinweise, um zu raten, was im Kopf (und im Akku) des Gegners vor sich geht. Er hat 40 verschiedene „Gedanken" (Zustände), die er durchgehen kann.

  • Früher (alte Version): Er wusste nur: „Der Gegner ist schwach."
  • Jetzt (neue Version v2): Er unterscheidet genau: „Ist er absichtlich schwach (Falle) oder ist er wirklich am Ende (echte Chance)?"

Das ist wie beim Poker: Früher sagten Sie nur „Der Gegner blufft oder hat eine gute Hand". Jetzt sagt der Detektiv: „Er blufft mit einem sehr spezifischen Muster, das wir erkennen können."

Schicht 2: Der Stratege (Das DQN)

Sobald der Detektiv eine Wahrscheinlichkeit hat (z. B. „80 % Wahrscheinlichkeit, dass der Gegner eine Falle stellt"), gibt er diese Information an den Strategen weiter.
Der Strategist ist ein künstliches Gehirn (eine KI), das entscheidet:

  • „Soll ich jetzt Gas geben und angreifen?"
  • „Oder soll ich Energie sparen und warten?"

Er lernt durch Millionen von simulierten Rennen, welche Entscheidung am besten ist, basierend auf dem, was der Detektiv ihm sagt.

3. Der große Durchbruch: Der „Gaspedal-Clue"

Der wichtigste Teil dieses neuen Systems ist ein neues Signal, das im Jahr 2026 hinzukommt: Wie viel Gas gibt der Gegner, wenn er eigentlich nicht schnell ist?

  • Szenario A (Die Falle): Der Gegner drückt das Gaspedal nur leicht, aber er fährt trotzdem schnell, weil er eine spezielle Aerodynamik nutzt. Er spart Energie. Das ist die Falle!
  • Szenario B (Die echte Schwäche): Der Gegner drückt das Gaspedal voll durch, aber das Auto wird trotzdem nicht schneller, weil die Batterie leer ist. Das ist eine echte Chance für Sie!

Früher konnte die KI diese beiden Situationen nicht gut unterscheiden. Die neue Version (v2) nutzt genau dieses Gaspedal-Signal, um die beiden Szenarien sofort zu trennen. Das ist wie der Unterschied zwischen jemandem, der sich nur stellt, als wäre er müde, und jemandem, der wirklich müde ist.

4. Warum das wichtig ist

Das System wurde anfangs nur in Computersimulationen getestet (wie ein Flugsimulator für Rennwagen). Dort hat es hervorragend funktioniert:

  • Es hat die Batteriestufe des Gegners zu 97 % richtig erraten.
  • Es hat die „Falle" zu 96 % erkannt, bevor sie zuschlug.

Aber: Da es noch keine echten Rennen 2026 gibt, muss das System noch mit echten Daten aus dem ersten Rennen in Melbourne kalibriert werden. Der Autor sagt: „Wir haben den Motor gebaut, jetzt müssen wir ihn auf der echten Strecke abstimmen."

Zusammenfassung in einem Satz

Dieser Artikel beschreibt eine neue Art von KI für Formel 1, die wie ein Spion funktioniert, der aus winzigen Details (wie dem Gaspedalverhalten) errät, ob ein Gegner eine Falle stellt oder wirklich schwach ist, damit Ihr Team nicht in die Irre gelockt wird.

Es ist der Versuch, das „Versteckspiel" im Rennsport durch Mathematik und KI zu lösen, bevor das Auto überhaupt die Kurve verlässt.