CAWM-Mamba: A unified model for infrared-visible image fusion and compound adverse weather restoration

Cet article présente CAWM-Mamba, un modèle unifié pionnier capable de fusionner simultanément des images infrarouges et visibles tout en restaurant les dégradations causées par des conditions météorologiques composées complexes, surpassant ainsi les méthodes existantes grâce à son architecture innovante intégrant des modules de prétraitement, d'interaction intermodale et de décomposition dans l'espace des ondelettes.

Huichun Liu, Xiaosong Li, Zhuangfan Huang, Tao Ye, Yang Liu, Haishu Tan

Publié 2026-03-04
📖 4 min de lecture☕ Lecture pause café

Each language version is independently generated for its own context, not a direct translation.

🌧️📸 Le Super-Héros des Images : CAWM-Mamba

Imaginez que vous conduisez une voiture autonome ou que vous pilotez un drone par une journée terrible. Il pleut, il y a du brouillard, et peut-être même de la neige.

  • Votre caméra classique (visible) voit tout flou, les gouttes de pluie déforment l'image et le brouillard efface les détails.
  • Votre caméra thermique (infrarouge) voit les formes et la chaleur, mais l'image est souvent granuleuse, sans couleurs et manque de détails fins.

Le but de la fusion d'images est de combiner ces deux caméras pour créer une image parfaite : claire, colorée et détaillée, même dans le chaos.

Le problème ?
Les anciennes méthodes fonctionnent bien si c'est juste de la pluie, ou juste du brouillard. Mais si vous avez pluie + brouillard + neige en même temps (ce qu'on appelle un "temps composé"), elles échouent lamentablement. C'est comme essayer de nettoyer une vitre sale avec un chiffon qui ne fonctionne que sur la poussière, mais pas sur la boue.

C'est ici qu'intervient CAWM-Mamba, le nouveau modèle proposé par les chercheurs.


🛠️ Comment ça marche ? (L'Analogie de l'Atelier de Restauration)

Pour comprendre CAWM-Mamba, imaginez un atelier de restauration d'art très sophistiqué qui reçoit des tableaux abîmés par la météo. Ce modèle utilise trois outils magiques :

1. Le Détective Météo (Module WAPM)

Avant même de commencer à réparer, ce module regarde l'image et dit : "Attends, ce n'est pas juste de la poussière, c'est un mélange de pluie et de brouillard !"

  • L'analogie : C'est comme un chef cuisinier qui goûte la sauce avant de l'assaisonner. Il identifie exactement quels ingrédients (types de météo) sont présents pour savoir comment les neutraliser. Il extrait une "carte d'identité" de la météo pour guider le reste du processus.

2. Le Traducteur de Langues (Module CFIM)

Ensuite, il faut faire parler la caméra classique et la caméra thermique ensemble. Souvent, elles ne se comprennent pas bien (l'une voit les couleurs, l'autre la chaleur).

  • L'analogie : Imaginez deux personnes qui parlent des langues différentes essayant de construire un meuble ensemble. Le module CFIM est le traducteur simultané qui s'assure que la personne qui voit les contours (infrarouge) et celle qui voit les textures (visible) travaillent parfaitement en harmonie, sans se marcher dessus.

3. Le Magicien des Ondes (Bloc WSSB)

C'est la partie la plus intelligente. Au lieu de regarder l'image comme une photo plate, ce module la décompose en différentes "fréquences" (comme séparer les basses, les médiums et les aigus dans une chanson).

  • L'analogie : Imaginez que la pluie et la neige sont comme des vagues sur l'eau, et le brouillard est comme un brouillard qui couvre tout.
    • Le brouillard se cache dans les "grands mouvements" (basses fréquences).
    • La pluie et la neige sont des "petites étincelles" rapides (hautes fréquences).
    • Le modèle utilise une technique appelée Mamba (inspirée de la façon dont les serpents se déplacent) pour scanner l'image. Contrairement aux anciennes méthodes qui regardent tout en rond, ce modèle sait exactement dans quelle direction regarder.
    • Si c'est une goutte de pluie verticale, il la nettoie verticalement. Si c'est un flocon, il l'attrape spécifiquement. Il sépare le "bruit" de la météo du "signal" réel de l'image.

🏆 Pourquoi est-ce si spécial ?

  1. Tout-en-un : Les anciens modèles devaient souvent faire deux étapes : d'abord nettoyer l'image, puis la fusionner. CAWM-Mamba fait les deux en même temps, comme un chef qui prépare et assaisonne le plat en une seule passe. C'est plus rapide et plus efficace.
  2. Le mélange est la clé : Il est le premier à gérer vraiment bien les mélanges complexes (Pluie + Neige + Brouillard). C'est comme si un nettoyeur de vitres pouvait enlever la boue, la poussière et les traces d'oiseaux simultanément sans laisser de traces.
  3. Plus intelligent pour les robots : Les chercheurs ont testé ce modèle pour aider des voitures autonomes à "voir" et à "reconnaître" des piétons ou des voitures dans la tempête. Résultat ? Les voitures "voient" mieux et évitent les accidents beaucoup plus efficacement avec ce modèle qu'avec les anciennes méthodes.

🚀 En résumé

CAWM-Mamba est un nouveau système d'intelligence artificielle qui agit comme un super-héros de la vision. Il prend des images floues et abîmées par des conditions météorologiques extrêmes et complexes, les nettoie, les combine avec des images thermiques, et produit une image claire et précise, prête à être utilisée par des drones, des voitures autonomes ou des caméras de surveillance.

C'est un peu comme passer d'une vieille caméra de sécurité floue à une vision de nuit parfaite, même au milieu d'une tempête de neige et de pluie ! ❄️🌧️🚗✨