A Spatio-temporal Graph Network Allowing Incomplete Trajectory Input for Pedestrian Trajectory Prediction

Il paper propone STGN-IT, una rete a grafo spaziotemporale che supera i limiti degli algoritmi esistenti permettendo l'input di traiettorie storiche incomplete e migliorando la previsione del movimento dei pedoni attraverso l'incodamento degli stati di osservazione, l'integrazione di ostacoli statici e l'uso di algoritmi di clustering.

Juncen Long, Gianluca Bardaro, Simone Mentasti, Matteo Matteucci

Pubblicato 2026-02-17
📖 4 min di lettura☕ Lettura da pausa caffè

Each language version is independently generated for its own context, not a direct translation.

Immagina di essere un robot che cammina in mezzo a una folla di persone. Il tuo compito è prevedere dove andranno le persone nei prossimi secondi per non scontrarti con loro. È come guidare un'auto in una piazza affollata: devi sapere se quel pedone che sta attraversando la strada continuerà dritto o si fermerà.

Finora, i "cervelli" (gli algoritmi) che guidavano questi robot avevano un grosso difetto: erano come studenti molto rigidi. Se anche solo per un secondo non vedevano una persona (perché era nascosta dietro un palo, un altro pedone o un'auto), lo studente diceva: "Non ho visto il passato di questa persona, quindi non posso prevedere il suo futuro. Ignoriamola!".

Questo è pericoloso. Se il robot ignora una persona che è stata nascosta per un attimo, potrebbe scontrarsi con lei proprio quando riappare.

Gli autori di questo paper, un gruppo di ricercatori del Politecnico di Milano, hanno creato un nuovo "cervello" chiamato STGN-IT che è molto più intelligente e flessibile. Ecco come funziona, spiegato con delle metafore semplici:

1. Il problema della "Fotografia Sgranata"

Immagina di guardare un video di una folla. A volte, una persona viene coperta da un ombrello o da un cartellone. Nei vecchi sistemi, se il video aveva un "buco" (un momento in cui la persona non era visibile), il sistema smetteva di calcolare la sua traiettoria.
Gli autori dicono: "No, non possiamo permettercelo! Dobbiamo prevedere dove andrà anche se la abbiamo vista solo per metà del tempo".

2. La soluzione: La "Mappa dei Ricordi" (Grafo Spazio-Temporale)

Il nuovo sistema STGN-IT non guarda solo le persone, ma costruisce una mappa mentale dinamica (un grafo spazio-temporale).

  • Le persone sono nodi: Ogni persona è un punto sulla mappa.
  • Le relazioni sono linee: Se due persone sono vicine, il sistema traccia una linea tra loro per capire come si influenzano a vicenda (es. se uno si sposta a destra, l'altro potrebbe spostarsi a sinistra per non urtarlo).
  • Gli ostacoli sono amici: Il sistema include anche muri, pali e sedie come "punti" sulla mappa. Questo è fondamentale perché aiuta il robot a capire che le persone non cammineranno attraverso i muri.

3. Il trucco del "Codice Segreto" (Encoding)

Qui sta la vera magia. Quando una persona scompare dalla vista (diventa "invisibile"), i vecchi sistemi mettevano il punto a zero (0,0), come se la persona fosse sparita nel nulla o fosse tornata al punto di partenza. Questo confondeva il robot.

STGN-IT usa un codice segreto. Invece di dire "non c'è", dice: "C'è una persona qui, ma in questo momento non la vedo".

  • È come se avessi un amico in una stanza piena di nebbia. Se non lo vedi, non pensi che sia sparito; pensi semplicemente che è nascosto dalla nebbia. Il sistema mantiene la traccia della sua posizione e della sua velocità, anche se non la vede fisicamente in quel frame.

4. Il "Doppio Controllo" (Due previsioni)

Il sistema fa due passi di pensiero, come un detective che indaga due volte:

  1. Prima previsione: Guarda le persone e cerca di indovinare dove andranno.
  2. Aggiunta degli ostacoli: Guarda dove il sistema pensa che le persone andranno e controlla se ci sono muri o ostacoli su quel percorso. Se sì, aggiunge questi ostacoli alla mappa mentale.
  3. Seconda previsione: Ricalcola il percorso tenendo conto che, ad esempio, "la persona non può attraversare quel muro".

Perché è importante?

Immagina di guidare un'auto a guida autonoma in una città.

  • I vecchi sistemi (Modalità "Filtraggio"): Se un pedone viene nascosto da un'auto parcheggiata, il sistema smette di seguirlo. Quando il pedone riappare, l'auto potrebbe non essere pronta a frenare.
  • Il nuovo sistema STGN-IT (Modalità "Riempimento"): Anche se il pedone è nascosto, il sistema continua a dire: "È ancora lì, sta andando verso destra, e c'è un muro lì davanti, quindi probabilmente rallenterà".

In sintesi

Gli autori hanno dimostrato che il loro sistema è molto più preciso e sicuro, specialmente quando le persone vengono nascoste (cosa che succede spesso nella visione dal punto di vista di un robot o di un'auto, ma meno nelle telecamere aeree).

Hanno anche scoperto che i vecchi metodi di valutazione (che ignoravano le persone nascoste) non erano giusti per la sicurezza reale. Il loro nuovo metodo permette ai robot di navigare in modo più fluido, evitando collisioni e capendo che anche se non vedi qualcuno per un secondo, lui c'è ancora e ha un piano.

È come passare da un guidatore che si blocca se perde di vista il semaforo, a un guidatore esperto che sa che il semaforo è ancora lì, anche se coperto da un camion, e sa come reagire.

Ricevi articoli come questo nella tua casella di posta

Digest giornalieri o settimanali personalizzati in base ai tuoi interessi. Riassunti Gist o tecnici, nella tua lingua.

Prova Digest →