DriverGaze360: OmniDirectional Driver Attention with Object-Level Guidance

Ce papier présente DriverGaze360, un vaste jeu de données d'attention conducteur à 360° et la méthode DriverGaze360-Net qui, en intégrant une guidance par objets via une segmentation sémantique, permet une prédiction d'attention omnidirectionnelle performante pour les systèmes de conduite autonome.

Shreedhar Govil, Didier Stricker, Jason Rambach

Publié 2026-03-06
📖 4 min de lecture☕ Lecture pause café

Each language version is independently generated for its own context, not a direct translation.

🚗 Le Problème : Le "Tunnel" des voitures actuelles

Imaginez que vous conduisez une voiture autonome. Aujourd'hui, les systèmes qui essaient de comprendre ce que vous regardez (votre attention) sont comme des caméras de surveillance fixées sur le pare-brise. Elles ne voient que ce qui est juste devant vous.

C'est comme si vous conduisiez avec un tuyau d'arrosage collé sur vos yeux : vous voyez la route devant, mais vous ne voyez rien sur le côté, ni derrière. Or, un vrai conducteur est un poulpe ! Il regarde devant, mais il jette aussi un coup d'œil dans les rétroviseurs pour vérifier s'il y a un piéton, un cycliste ou une voiture qui arrive par la gauche ou la droite.

Les anciennes technologies échouaient à comprendre ces mouvements de tête et de yeux vers les côtés ou l'arrière, car elles n'avaient pas les données pour apprendre ce comportement.

💡 La Solution : DriverGaze360 (Le "Casque de Vision Totale")

Pour régler ce problème, les chercheurs du DFKI (un centre de recherche allemand) ont créé deux choses magiques :

1. La Base de Données : "Le Monde en 360°"

Ils ont construit DriverGaze360, une immense bibliothèque de données.

  • L'analogie : Imaginez que vous mettez un casque de réalité virtuelle à 19 conducteurs humains. Ce casque ne montre pas seulement la route devant, mais tout l'environnement à 360 degrés (devant, derrière, gauche, droite, haut, bas).
  • Ce qu'ils ont fait : Ils ont filmé ces conducteurs dans un simulateur de conduite ultra-réaliste (comme un jeu vidéo très avancé) pendant qu'ils faisaient des manœuvres complexes : changer de voie, tourner, éviter des piétons.
  • Le résultat : Ils ont collecté 1 million d'images où chaque point de regard (ce que le conducteur regarde exactement) est marqué. C'est la première fois qu'on a une carte complète de ce que les humains regardent dans toutes les directions, pas seulement devant.

2. L'Intelligence Artificielle : "Le Détective à Double Vision"

Ensuite, ils ont créé un cerveau artificiel nommé DriverGaze360-Net.

  • L'analogie : Les anciens systèmes étaient comme un peintre qui essaie de deviner où vous regardez en regardant juste la route.
  • Le nouveau système est comme un détective qui a deux casquettes :
    1. Il regarde où vous posez les yeux (la carte de l'attention).
    2. Il identifie l'objet que vous regardez (une voiture, un feu rouge, un cycliste).
  • Pourquoi c'est génial ? En apprenant à nommer les objets en même temps qu'il prédit le regard, le détective devient beaucoup plus intelligent. Il comprend mieux l'espace. C'est comme si, au lieu de juste dire "regarde là", il disait "regarde le feu rouge là-bas". Cela l'aide à mieux comprendre la scène globale, même sur une image panoramique énorme.

🧪 Les Résultats : Pourquoi c'est une révolution ?

Les chercheurs ont testé leur nouveau détective contre les meilleurs anciens systèmes :

  • Sur les données 360° : Le nouveau système a gagné haut la main. Il comprend bien mieux les situations où le conducteur regarde dans le rétroviseur (ce que les anciens systèmes ne pouvaient pas faire car ils ne "voyaient" pas le rétroviseur).
  • Sur les vraies routes : Même quand on l'a testé sur des vidéos de vraies routes (sans casque 360°), il a continué à être meilleur que les autres. C'est comme si le détective avait appris une leçon de conduite si bien qu'il peut conduire n'importe où.

🎯 En Résumé

Imaginez que vous voulez enseigner à un robot à conduire comme un humain.

  • Avant : Vous lui appreniez à regarder uniquement devant lui, comme un robot timide.
  • Aujourd'hui (avec DriverGaze360) : Vous lui donnez des lunettes magiques qui lui montrent tout autour, et vous lui apprenez à identifier les dangers (piétons, voitures) en même temps qu'il regarde.

Grâce à cette invention, les voitures autonomes du futur pourront mieux comprendre l'intention des humains, anticiper les dangers cachés dans les angles morts et, surtout, devenir plus sûres et plus transparentes pour nous tous. C'est un pas de géant vers une cohabitation harmonieuse entre les humains et les robots sur la route.