Active Inference for Adaptive Traffic Signal Control in Noisy Nonstationary IoT Environments

Cet article propose un contrôleur d'inférence active traçable pour la gestion adaptative des signaux de circulation qui surpasse à la fois les heuristiques fondées sur des règles et l'apprentissage par renforcement profond dans des environnements IoT bruités et non stationnaires en minimisant l'énergie libre attendue afin de réduire les temps d'attente et les émissions de CO2.

Auteurs originaux : Dénes Toth, George Ambroladze, Edwin Sundberg, Ali Beikmohammadi, Alfreds Lapkovskis

Publié 2026-06-15
📖 6 min de lecture🧠 Analyse approfondie

Auteurs originaux : Dénes Toth, George Ambroladze, Edwin Sundberg, Ali Beikmohammadi, Alfreds Lapkovskis

Article original sous licence CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Ceci est une explication générée par l'IA de l'article ci-dessous. Elle n'a pas été rédigée ni approuvée par les auteurs. Pour une précision technique, consultez l'article original. Lire la clause de non-responsabilité complète

Imaginez une intersection urbaine très fréquentée comme une cuisine géante et chaotique où les voitures sont les ingrédients, les feux de signalisation sont les chefs, et l'objectif est de nourrir tout le monde (faire circuler le trafic) le plus rapidement possible sans brûler la nourriture (causer de la pollution ou des accidents).

Ce document présente un nouveau type de « chef intelligent » pour les feux de signalisation appelé Inférence Active (AIF). Voici comment il fonctionne, comment il a été testé et ce qu'il a découvert, expliqué simplement.

Le Problème : La cuisine est embrumée et chaotique

Dans le monde réel, les capteurs de trafic (comme les caméras ou les radars) ne sont pas parfaits. Ils peuvent être bloqués par de gros camions, confus par une pluie battante, ou simplement rater des voitures entièrement. C'est comme un chef qui essaierait de cuisiner en portant des lunettes embuées et en gérant des clients qui changent constamment de commande.

  • Les Vieilles Règles : Les feux de signalisation traditionnels suivent une recette stricte (ex : « Vert pendant 30 secondes, puis Rouge »). Ils ne peuvent pas s'adapter quand la cuisine devient folle.
  • L'Apprenti "Boîte Noire" : Les nouveaux systèmes d'IA (appelés Apprentissage par Renforcement Profond ou DQN) sont comme un sous-chef qui s'est exercé à cuisiner des milliers de fois. Ils sont excellents pour cuisiner si on les a entraînés dans exactement la même cuisine. Mais si le brouillard s'épaissit ou si un client commande soudainement quelque chose de bizarre, ils peuvent être déroutés. De plus, personne ne sait pourquoi ils ont fait un choix spécifique ; ils le font, c'est tout.

La Solution : Le « Chef Curieux » (Inférence Active)

Les auteurs proposent un nouveau chef basé sur l'Inférence Active. Au lieu de simplement mémoriser une recette ou de deviner en se basant sur une pratique passée, ce chef utilise un modèle mental spécial pour poser constamment deux questions :

  1. « Que est-ce que je veux voir ? » (Valeur Pragmatique) : « Je veux voir les files de circulation raccourcir et l'air devenir plus propre. »
  2. « Qu'est-ce que j'ai besoin d'apprendre ? » (Valeur Épistémique) : « Je ne suis pas sûr de ce qui se passe à cause du brouillard. Je devrais changer le feu pour mieux voir l'autre côté de la rue. »

Ce chef essaie de minimiser un concept appelé « Énergie Libre Attendue ». Voyez cela comme un « Score de Confusion ». Le chef veut faire des choix qui réduisent sa confusion et le rapprochent de son objectif (un trafic fluide).

Le Meilleur Élément : Contrairement à l'IA « Boîte Noire », ce chef tient un journal. Vous pouvez consulter le journal et voir exactement pourquoi il a changé le feu : « J'ai changé le feu parce que je m'inquiétais de ne pas voir les voitures du côté Nord, alors j'ai passé le feu pour vérifier. »

L'Expérience : La Cuisine Virtuelle

Les chercheurs ont construit une simulation de trafic numérique (une cuisine virtuelle) avec une intersection à quatre voies. Ils ont testé trois chefs :

  1. Le Suiveur de Règles : S'en tient à un programme fixe.
  2. L'IA Entraînée (DQN) : A appris en pratiquant pendant des heures dans la simulation.
  3. Le Chef Curieux (AIF) : Utilise la méthode du « Score de Confusion » décrite précédemment.

Ils ont fait passer la simulation à travers quatre niveaux de difficulté :

  • Niveau 1 : Temps clair, trafic normal.
  • Niveau 2 : Les capteurs sont bloqués par de gros camions (Occlusion).
  • Niveau 3 : Il commence à pleuvoir abondamment (Météo).
  • Niveau 4 : Une voiture est accidentée, bloquant la route, pendant qu'il pleut et que les capteurs sont obstrués (La Tempête Parfaite).

Les Résultats : Qui a le mieux cuisiné ?

1. Dans des conditions calmes (Niveaux 1 & 3) :
L'IA Entraînée (DQN) était légèrement plus rapide pour déplacer les voitures. Elle avait pratiqué ce scénario spécifique et connaissait la recette par cœur. Le Chef Curieux (AIF) était presque aussi bon, mais pas tout à fait le plus rapide.

2. Dans la « Tempête Parfaite » (Niveau 4) :
C'est ici que le Chef Curieux (AIF) a gagné haut la main.

  • Temps d'attente : Le Chef Curieux a fait attendre les voitures un total de 56 977 secondes. L'IA Entraînée a fait attendre les voitures pendant 71 741 secondes. C'est une énorme différence.
  • Pollution : Le Chef Curieux a produit moins d'émissions de CO2.
  • Pourquoi ? Lorsque les capteurs sont devenus désordonnés et qu'un accident est survenu, l'IA Entraînée a été confuse car elle n'avait pas pratiqué exactement cette combinaison de catastrophes. Le Chef Curieux, cependant, a été conçu pour gérer l'incertitude. Il a réalisé : « Je ne sais pas ce qui se passe, donc je dois recueillir plus d'informations et m'adapter », ce qui a permis de maintenir la circulation plus efficacement.

3. Les Compromis :
Le Chef Curieux n'était pas parfait.

  • Priorité aux Bus : Il était légèrement moins efficace pour laisser passer les bus rapidement par rapport aux autres. Comme il se concentrait sur le nombre total de voitures pour réduire la confusion globale, il ignorait parfois un bus unique attendant dans la voie opposée.
  • Changement de Feux : Il changeait les feux plus souvent. Bien que cela l'aide à recueillir des informations, cela peut paraître un peu « saccadé » par rapport au Suiveur de Règles qui est plus constant.

L'Essentiel à Retenir

Ce document montre que si l'IA « entraînée » est excellente pour les situations prévisibles, un Chef Curieux qui cherche activement à comprendre l'incertitude est bien meilleur lorsque les choses tournent mal (comme lors de mauvaises conditions météo ou d'accidents).

La plus grande victoire du Chef Curieux est la transparence. Si un gestionnaire de trafic demande : « Pourquoi avez-vous mis le feu au rouge ? », le Chef Curieux peut expliquer son raisonnement étape par étape. L'IA Entraînée répond simplement : « Parce que mon cerveau me l'a dit », ce qui est difficile à accorder de la confiance quand les choses tournent mal.

En bref : quand le monde du trafic est calme, un expert entraîné gagne. Quand le monde devient désordonné et imprévisible, un système curieux et conscient de lui-même gagne.

Noyé(e) sous les articles dans votre domaine ?

Recevez des digests quotidiens des articles les plus récents correspondant à vos mots-clés de recherche — avec des résumés techniques, dans votre langue.

Essayer Digest →