PeRoI: A Pedestrian-Robot Interaction Dataset for Learning Avoidance, Neutrality, and Attraction Behaviors in Social Navigation

Cet article présente le jeu de données PeRoI, qui capture les interactions piétons-robots à travers des comportements d'attraction, de neutralité et de répulsion, et propose le modèle NeuRoSFM pour améliorer la prédiction des trajectoires piétonnes dans des environnements sociaux.

Subham Agrawal, Nico Ostermann-Myrau, Nils Dengler, Maren Bennewitz

Publié 2026-03-06
📖 5 min de lecture🧠 Analyse approfondie

Each language version is independently generated for its own context, not a direct translation.

Imaginez que vous marchez dans un centre commercial bondé. Soudain, un robot arrive. Comment réagissez-vous ?

  • Option A : Vous faites un grand écart pour éviter de le toucher (c'est l'évitement).
  • Option B : Vous continuez votre chemin comme si de rien n'était, sans même le regarder (c'est la neutralité).
  • Option C : Vous vous arrêtez, intrigué, pour regarder le robot passer (c'est l'attraction).

Jusqu'à présent, les robots qui apprennent à se déplacer dans la rue ne connaissaient que l'Option A. Ils pensaient que tous les humains avaient peur d'eux et voulaient fuir. C'est comme si un nouveau conducteur apprenait à conduire en pensant que tous les piétons sont des obstacles immobiles à éviter à tout prix, sans jamais comprendre qu'un enfant pourrait courir vers lui par curiosité.

Voici comment cette recherche change la donne, expliquée simplement :

1. Le Problème : La "Cécité" des Robots

Les chercheurs ont réalisé que les robots actuels sont un peu "aveugles" aux nuances sociales. Les anciennes bases de données (les livres de recettes pour les robots) ne contenaient que des humains qui marchent entre eux. Elles ignoraient complètement comment les humains réagissent quand un robot est là. Résultat : les robots sont soit trop timides, soit trop brusques, car ils ne comprennent pas la diversité des réactions humaines.

2. La Solution : Le "PeRoI" (La Grande Bibliothèque des Réactions)

Les auteurs de l'article ont créé une nouvelle base de données appelée PeRoI. Imaginez que c'est une immense bibliothèque de vidéos où ils ont filmé des milliers de personnes marchant dans deux endroits différents (un campus universitaire et un passage entre des bureaux).

Mais ils n'ont pas juste filmé. Ils ont joué un rôle de metteur en scène avec trois scénarios :

  • Scénario 1 : Pas de robot (juste des humains).
  • Scénario 2 : Un robot immobile au milieu du chemin (comme une statue).
  • Scénario 3 : Un robot qui se déplace (comme un chien ou un petit chariot).

Ils ont utilisé trois types de robots très différents : un bras mécanique sur roues, un chien-robot à quatre pattes, et une base mobile industrielle.

Le résultat ? Ils ont pu étiqueter chaque personne : "Ah, celle-ci a fait un détour (évitement)", "Celle-ci est passée sans broncher (neutralité)", "Et celle-ci s'est approchée pour regarder (attraction)". C'est la première fois qu'on a une carte complète de ces trois réactions.

3. L'Innovation : Le "NeuRoSFM" (Le Cerveau du Robot)

Avoir les vidéos, c'est bien, mais il faut apprendre au robot à les comprendre. Les chercheurs ont donc inventé un nouveau modèle mathématique appelé NeuRoSFM.

Pour faire une analogie simple :

  • L'ancien modèle (le "Social Force Model") était comme un conducteur de train : il ne voit que des rails et des obstacles. S'il y a un obstacle, il freine. Point.
  • Le nouveau modèle (NeuRoSFM) est comme un conducteur de taxi expérimenté. Il utilise une intelligence artificielle (un cerveau numérique) pour sentir l'ambiance.
    • Si le robot est un chien-robot (Unitree Go1), le modèle sait que les gens sont curieux et peuvent s'approcher (Attraction).
    • Si le robot est une grosse machine industrielle, le modèle sait que les gens vont s'éloigner (Évitement).
    • Il sait aussi que les gens marchent souvent en groupes et qu'ils ne veulent pas se séparer de leurs amis (Force de groupe).

Au lieu de programmer des règles rigides ("Si robot à 2 mètres, freine"), le modèle apprend à partir des vidéos de la bibliothèque PeRoI. Il comprend que la force qui pousse un humain à s'éloigner ou à s'approcher dépend du type de robot et de la situation.

4. Les Résultats : Pourquoi c'est important ?

Quand ils ont testé ce nouveau "cerveau" sur d'autres données, il a été beaucoup plus précis pour prédire où iront les gens.

  • Avant : Le robot prédisait que tout le monde s'éloignerait.
  • Maintenant : Il prédit que 30 % des gens vont s'éloigner, 60 % vont passer sans rien dire, et 10 % vont s'approcher par curiosité.

Cela permet aux robots de devenir de meilleurs citoyens. Ils peuvent naviguer dans les hôpitaux, les centres commerciaux ou les rues sans effrayer les gens, sans les bloquer inutilement, et en respectant leurs espaces personnels ou leur curiosité.

En Résumé

Cette recherche, c'est comme passer d'un robot qui dit "Je suis un robot, fuyez !" à un robot qui dit "Je suis un robot, je vois que vous êtes curieux, je vais passer doucement, ou peut-être que vous allez me regarder, et c'est normal".

Grâce à cette nouvelle "bibliothèque" de données et à ce nouveau "cerveau" d'apprentissage, les robots de demain seront enfin capables de se fondre harmonieusement dans la vie de tous les jours, en comprenant que les humains ne sont pas tous pareils face à une machine.