Dual-Horizon Hybrid Internal Model for Low-Gravity Quadrupedal Jumping with Hardware-in-the-Loop Validation

Diese Arbeit stellt ein Dual-Horizon-Hybrid-Internal-Model vor, das die kontinuierliche quadrupede Sprunglokomotion unter Mondgravitation ermöglicht, und validiert diesen Ansatz hardwareseitig auf der MATRIX-Plattform, die eine Echtzeit-Emulation der Mondumgebung durch ein digitales Zwillingssystem bietet.

Haozhe Xu, Yifei Zhao, Wenhao Feng, Zhipeng Wang, Hongrui Sang, Cheng Cheng, Xiuxian Li, Zhen Yin, Bin He

Veröffentlicht 2026-03-10
📖 5 Min. Lesezeit🧠 Tiefgang

Each language version is independently generated for its own context, not a direct translation.

Stellen Sie sich vor, Sie möchten einen Hund auf dem Mond herumlaufen lassen. Das klingt erst einmal einfach, aber auf dem Mond ist die Schwerkraft nur ein Sechstel so stark wie auf der Erde. Das bedeutet: Wenn der Hund einen Schritt macht, fliegt er viel länger durch die Luft, bevor er wieder den Boden berührt.

Das ist wie beim Trampolinspringen: Auf der Erde landen Sie schnell wieder. Auf dem Mond würden Sie so lange in der Luft schweben, dass Sie die Kontrolle über Ihren Körper fast verlieren könnten. Wenn Sie dann endlich landen, ist der Aufprall hart, und auf dem unebenen, kraterreichen Mondgelände ist es extrem schwierig, nicht zu stolpern.

Genau dieses Problem haben die Forscher in diesem Papier gelöst. Hier ist die Erklärung, wie sie es gemacht haben, ohne Fachchinesisch:

1. Das Gehirn des Roboters: Der "Zwei-Zeit-Manager"

Normalerweise steuern Roboter ihre Bewegungen basierend auf dem, was sie in den letzten paar Millisekunden gespürt haben. Das funktioniert auf der Erde gut. Aber auf dem Mond ist die "Luftphase" so lang, dass ein kurzer Blick in die Vergangenheit nicht ausreicht. Es ist, als würde man versuchen, ein Auto zu steuern, indem man nur auf die letzten 10 Zentimeter der Straße schaut, während man eigentlich schon 100 Meter voraussehen müsste.

Die Forscher haben dem Roboter daher ein neues Gehirn gegeben, das wir den "Dual-Horizon-Hybrid-Modell" nennen. Man kann sich das wie einen Mitarbeiter mit zwei Gehirnteilen vorstellen:

  • Das schnelle Gehirn (Kurzfrist): Dieses Teil schaut sich nur die letzten paar Sekunden an. Es ist wie ein Sprinter, der sofort reagiert: "Achtung! Ich lande gerade! Ich muss die Beine steif machen!" Es hilft dem Roboter, den schnellen vertikalen Aufprall zu spüren.
  • Das langsame Gehirn (Langfrist): Dieses Teil schaut sich eine viel längere Zeitspanne an. Es ist wie ein Kapitän, der den Kurs über den ganzen Flug beobachtet: "Wir sind noch in der Luft, aber wir bewegen uns langsam nach vorne und sinken langsam ab." Es hilft dem Roboter zu wissen, wo er sich im gesamten Sprungzyklus befindet.

Indem diese beiden Gehirnteile ihre Informationen mischen, weiß der Roboter genau, was er tun muss, egal ob er gerade abhebt, in der Luft schwebt oder landet. Er verliert nie den Überblick.

2. Der Trainer: Die "MATRIX"-Bühne

Wie trainiert man so etwas, bevor man den Roboter auf den echten Mond schickt? Man kann nicht einfach auf den Mond gehen und herumprobieren. Die Forscher haben also eine Maschine namens MATRIX gebaut.

Stellen Sie sich MATRIX wie einen hochmodernen Film-Set vor, der in einem Labor steht:

  • Der Schwerkraft-Trick: Der Roboter ist an einem Seil befestigt, das an einer Rolle hängt. Ein schwerer Gegenstand (ein Gewichtsblock) zieht am anderen Ende des Seils. Dieser Block zieht den Roboter so stark nach oben, dass er sich genau so leicht anfühlt, als wäre er auf dem Mond. Es ist, als würde man einen Elefanten mit einem Seil so weit entlasten, dass er sich wie eine Feder fühlt.
  • Der Laufband-Trick: Der Roboter läuft auf einem riesigen Laufband. Aber das ist kein normales Laufband. Es ist mit einem beweglichen Boden verbunden, der sich neigen und wackeln kann.
  • Der digitale Zwilling: Ein Computer (eine "digitale Welt" in Unreal Engine) simuliert die Mondoberfläche mit allen Kratern und Steinen. Wenn der Roboter auf dem Laufband läuft, schaut der Computer in die digitale Welt, berechnet, wie der Boden unter den Füßen aussieht, und bewegt den echten Boden im Labor genau so.

So kann der Roboter in einem sicheren Labor "auf dem Mond" über Krater springen, ohne dass er je das Labor verlässt.

3. Der Lernprozess: Belohnung für den richtigen Moment

Damit der Roboter lernt, nicht einfach nur zu springen, sondern gut zu springen, haben die Forscher ein spezielles Belohnungssystem entwickelt.

Stellen Sie sich vor, Sie unterrichten einen Hund. Wenn er springt, geben Sie ihm nicht einfach nur ein Leckerli. Sie geben ihm ein Leckerli nur, wenn er:

  1. Hoch genug springt (Startphase).
  2. In der Luft gerade bleibt und nicht wild herumwirbelt (Flugphase).
  3. Sanft und sicher landet (Landephase).

Das System des Roboters macht genau das. Es weiß genau, in welcher Phase des Sprungs er sich befindet, und belohnt ihn nur für die richtigen Aktionen in dieser spezifischen Phase. Ohne diese "Phasen-Belohnung" würde der Roboter wild herumhüpfen und ständig stürzen.

Das Ergebnis

Am Ende haben die Forscher ihren Roboter (ein Unitree A1, der aussieht wie ein kleiner Hund) auf dieser MATRIX-Bühne getestet. Das Ergebnis war beeindruckend: Der Roboter konnte kontinuierlich über kraterreiche, unebene Mondlandschaften hüpfen, ohne hinzufallen.

Zusammenfassend:
Die Forscher haben einen Roboter entwickelt, der auf dem Mond nicht mehr stolpert. Sie haben ihm ein Gehirn gegeben, das sowohl schnell als auch geduldig denkt, und sie haben ihm in einem Labor eine künstliche Mondwelt gebaut, in der er sicher üben konnte. Es ist ein großer Schritt dafür, dass Roboter in Zukunft wirklich die Mondoberfläche erkunden können, besonders an Orten, an denen Räder (wie bei den klassischen Mondrovern) stecken bleiben würden.