A Spatio-temporal Graph Network Allowing Incomplete Trajectory Input for Pedestrian Trajectory Prediction

Die vorgestellte Arbeit stellt STGN-IT vor, ein räumlich-zeitliches Graph-Netzwerk, das die Vorhersage von Fußgängertrajektorien auch bei unvollständigen historischen Eingabedaten ermöglicht, indem es Beobachtungszustände und statische Hindernisse in einem Graphenmodell integriert.

Juncen Long, Gianluca Bardaro, Simone Mentasti, Matteo Matteucci

Veröffentlicht 2026-02-17
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stellen Sie sich vor, Sie sind ein Roboter, der durch eine belebte Fußgängerzone läuft. Ihr Job ist es, sicher zu navigieren und niemanden anzustoßen. Dafür müssen Sie vorhersagen, wohin die Menschen in den nächsten paar Sekunden gehen werden. Das ist die Aufgabe dieses Forschungsprojekts.

Hier ist die Geschichte der Lösung, die die Forscher von der Politecnico di Milano entwickelt haben, ganz einfach erklärt:

Das Problem: Der "versteckte" Fußgänger

Die meisten aktuellen Roboter-Programme funktionieren wie ein strenger Lehrer: Wenn sie einen Fußgänger auch nur für eine Sekunde nicht sehen können (weil er hinter einem Baum, einem anderen Menschen oder einem Schild verschwindet), geben sie auf. Sie sagen: "Ich habe die Geschichte nicht vollständig gesehen, also kann ich nicht raten, wohin er geht."

Das ist gefährlich! Wenn der Roboter aufhört, den Fußgänger zu verfolgen, könnte er ihn übersehen und ihn umrennen.

In der echten Welt (aus der Sicht des Roboters) passiert das ständig. Menschen werden oft verdeckt. Die alten Algorithmen funktionieren nur, wenn man wie ein Drohne aus der Vogelperspektive schaut, wo niemand verdeckt wird. Aber Roboter haben keine Drohnen-Augen; sie haben Kameras auf Augenhöhe.

Die Lösung: STGN-IT (Der "Gedächtnis-Roboter")

Die Forscher haben ein neues System namens STGN-IT entwickelt. Man kann es sich wie einen sehr aufmerksamen Schachspieler vorstellen, der auch dann weiterdenkt, wenn ein Teil des Spielfelds verdeckt ist.

Hier sind die drei genialen Tricks, die sie benutzt haben:

1. Der "Unsichtbarkeits-Code" (Die Notiz im Tagebuch)
Wenn ein Fußgänger verschwindet, sagen die alten Systeme: "Null, Null" (als wäre er an den Ursprungspunkt zurückgekehrt). Das verwirrt den Roboter.
STGN-IT macht etwas Cleveres: Es schreibt eine Notiz in das System. Es sagt: "Okay, wir sehen ihn gerade nicht, aber wir wissen, dass er vorhin noch da war."

  • Die Analogie: Stellen Sie sich vor, Sie spielen Verstecken. Wenn Ihr Freund hinter einem Baum steht, sagen Sie nicht "Er ist verschwunden", sondern Sie merken sich: "Er ist hinter dem Baum." Das System kodiert diesen Zustand so, dass der Roboter weiß: "Er ist nicht weg, er ist nur unsichtbar."

2. Die "Karten-Integration" (Die Wand als Freund)
Früher haben Roboter oft nur auf Menschen geschaut. STGN-IT schaut sich auch die Umgebung an. Es nutzt eine digitale Landkarte (eine "Belegungskarte"), die Wände, Bänke und andere Hindernisse zeigt.

  • Die Analogie: Ein guter Fußgänger weiß, dass er nicht durch eine Wand laufen kann. STGN-IT fügt diese Hindernisse als "Spieler" in sein Gehirn ein. Wenn ein Fußgänger auf eine Wand zuläuft, sagt das System: "Aha, er wird dort abbiegen müssen, weil die Wand da ist." Das macht die Vorhersage viel genauer.

3. Der "Zweischritt-Plan" (Erst schauen, dann planen)
Das System macht die Vorhersage zweimal:

  • Schritt 1: Es schaut nur auf die Menschen und sagt grob: "Die gehen wahrscheinlich dorthin."
  • Schritt 2: Es schaut auf diese grobe Vorhersage und fragt: "Hey, auf diesem Weg gibt es eine Wand oder einen anderen Menschen!" Dann fügt es diese Hindernisse hinzu und sagt: "Okay, dann wird er hier abbiegen."
  • Die Analogie: Es ist wie beim Autofahren. Erst schauen Sie, wo die anderen Autos sind. Dann schauen Sie auf die Straße und sagen: "Oh, da ist eine Baustelle, ich muss die Spur wechseln."

Warum ist das besser als alles andere?

Die Forscher haben das System getestet, indem sie absichtlich Teile der Fußgängerbewegungen "versteckt" haben (wie im echten Leben).

  • Die alten Systeme: Haben oft aufgegeben oder falsche Vorhersagen gemacht (z. B. durch Wände laufen).
  • STGN-IT: Hat auch dann noch gute Vorhersagen gemacht. Es war wie ein erfahrener Taktiker, der auch mit unvollständigen Informationen den besten Zug findet.

Das Fazit

Dieses neue System ist wie ein Roboter, der nicht aufgibt, wenn er jemanden kurz nicht sieht. Es nutzt sein Gedächtnis, die Umgebungskarte und einen klugen Plan, um sicher durch eine Menschenmenge zu navigieren. Das ist ein riesiger Schritt für Roboter, die in Zukunft sicher mit uns Menschen zusammenleben sollen – sei es in Fabriken, Krankenhäusern oder auf belebten Straßen.

Kurz gesagt: Es ist der Unterschied zwischen einem Roboter, der bei Unsicherheit stehenzubleibt, und einem, der klug weiterdenkt.

Erhalten Sie solche Paper in Ihrem Posteingang

Personalisierte tägliche oder wöchentliche Digests passend zu Ihren Interessen. Gists oder technische Zusammenfassungen, in Ihrer Sprache.

Digest testen →