Anomaly detection in time-series via inductive biases in the latent space of conditional normalizing flows

Each language version is independently generated for its own context, not a direct translation.

🕵️‍♂️ Le Problème : Le Détective qui se fait avoir par les apparences

Imaginez que vous êtes un détective chargé de repérer des voleurs dans une ville très calme (c'est votre série temporelle, comme des données de capteurs ou des transactions bancaires).

Jusqu'à présent, les détectives (les modèles d'intelligence artificielle classiques) utilisaient une méthode simple : "Si ça ressemble à un voleur, c'est un voleur." Ils regardaient si une action était "rare" ou "étrange" par rapport à la moyenne.

Le problème ? Parfois, un voleur très intelligent se déguise parfaitement en citoyen lambda. Il porte le même manteau, marche au même rythme et a le même visage que tout le monde. Pour le détective classique, ce voleur a l'air "normal" (haute probabilité), donc il ne l'arrête pas. Pourtant, ce voleur a un comportement anormal : il ne suit pas les règles du jeu !

C'est exactement ce que les auteurs disent : les modèles actuels se trompent souvent car ils se fient trop à la "densité" (à quoi ça ressemble) et pas assez à la "dynamique" (comment ça bouge dans le temps).

🚀 La Solution : Le Détective qui vérifie la "Chorégraphie"

Les auteurs (Baumgartner et ses collègues) proposent une nouvelle méthode. Au lieu de demander "Est-ce que ça ressemble à un voleur ?", ils demandent : "Est-ce que cette personne suit la chorégraphie attendue ?"

Voici comment leur méthode fonctionne, étape par étape, avec des analogies :

1. Le Traducteur Secret (Le Flux Normalisant Conditionnel)

Imaginez que vous avez un traducteur magique (le modèle CNF). Son travail est de prendre les actions complexes des gens dans la rue (les données brutes) et de les traduire en une langue simple et codée (l'espace latent).

Dans cette langue codée, chaque mouvement normal se transforme en une forme géométrique très précise.

2. La Règle du Jeu Imposée (Les Biais Inductifs)

C'est ici que la magie opère. Les auteurs ne laissent pas le traducteur inventer n'importe quelle règle. Ils imposent une règle stricte : "Dans cette langue codée, les mouvements normaux doivent suivre une trajectoire mathématique précise, comme une danse bien réglée."

Ils disent au modèle : "Si c'est normal, la danse doit être fluide, prévisible et suivre une ligne droite (ou une courbe simple)." C'est ce qu'ils appellent un biais inductif. C'est comme si on disait à un élève : "Pour avoir 20/20, tu dois écrire en ligne droite."

3. Le Test de Conformité (Le Test Statistique)

Maintenant, quand un nouveau mouvement arrive, le traducteur le transforme en langage codé.

Le Détective (le test statistique MV-KS) regarde la trajectoire dans ce langage codé.
Il ne se demande pas "Est-ce que c'est rare ?"
Il se demande : "Est-ce que cette trajectoire respecte la règle de la danse ?"

Si la trajectoire dévie même un tout petit peu de la règle imposée (même si elle ressemble à une action normale dans le monde réel), le détective crie : "ALERTE ! Ce n'est pas une danse normale !"

🌟 Pourquoi c'est génial ? (Les Avantages)

On ne se fait pas avoir par les déguisements : Même si un voleur (une anomalie) porte le même manteau que tout le monde (haute probabilité d'apparence), s'il ne suit pas la chorégraphie (la dynamique temporelle), il sera attrapé.
Pas de réglages compliqués : Habituellement, il faut dire au détective : "Si le score de suspicion dépasse 0,7, arrête-le." Trouver ce chiffre 0,7 est difficile et demande beaucoup d'essais. Ici, la règle est mathématique. Si la danse est fausse, c'est faux. Pas besoin de deviner un seuil.
Un contrôle qualité automatique : Avant même de commencer à chasser les voleurs, le système vérifie si le traducteur a bien appris la règle. Si le traducteur ne respecte pas la règle lui-même pendant l'entraînement, le système vous dit : "Hé, mon traducteur est nul, je ne peux pas faire confiance à mes résultats." C'est comme vérifier que votre boussole pointe bien vers le Nord avant de partir en expédition.

🎯 En Résumé

Imaginez que vous essayez de repérer un faux billet de banque.

L'ancienne méthode : Regarder si le papier a la bonne couleur et la bonne texture. Un faux billet très bien fait passe.
La nouvelle méthode (ce papier) : Regarder si le billet suit les règles de la gravure. Même si le papier est parfait, si les lignes de la gravure ne suivent pas la courbe mathématique attendue, c'est un faux.

Les auteurs montrent que cette méthode fonctionne très bien, même sur des données réelles complexes, car elle se concentre sur la structure du mouvement plutôt que sur l'apparence superficielle. C'est une façon plus intelligente et plus fiable de détecter l'inattendu.

Each language version is independently generated for its own context, not a direct translation.

1. Problématique

La détection d'anomalies (DA) dans les séries temporelles multivariées repose souvent sur des modèles génératifs profonds (DPM) entraînés pour maximiser la vraisemblance des données (likelihood). Cependant, l'article identifie une limitation fondamentale de cette approche :

Échec de la vraisemblance observationnelle : La densité de probabilité dans l'espace d'observation mesure la densité marginale plutôt que la conformité aux dynamiques temporelles structurées. Par conséquent, un modèle peut attribuer une forte probabilité (vraisemblance élevée) à des échantillons anormaux ou hors distribution (OOD), surtout si ces échantillons se situent dans des régions denses de l'espace des données mais ne respectent pas la dynamique temporelle attendue.
Dépendance aux seuils manuels : Les méthodes classiques nécessitent souvent des seuils arbitraires pour convertir les scores d'anomalie en décisions binaires, ce qui est coûteux et peu robuste sans supervision.
Manque de biais inductifs structurels : Les modèles basés uniquement sur la vraisemblance ne possèdent pas de notion intrinsèque de ce qui constitue un comportement « inattendu » ; ils doivent apprendre cela explicitement via des biais structurels.

2. Méthodologie Proposée

Les auteurs proposent un cadre probabiliste d'état d'espace (state-space) pour les séries temporelles, combinant des Flux de Normalisation Conditionnels (CNF) et des biais inductifs explicites dans l'espace latent. L'objectif est de déplacer la détection d'anomalies de l'espace d'observation vers un espace latent où le comportement attendu est défini par des dynamiques temporelles prescrites.

A. Modèle Génératif : CNF avec Dynamique Latente

Le modèle se compose de deux éléments clés :

Flux de Normalisation Conditionnel (CNF) : Il mappe les observations $x_t$ vers un espace latent $z_t$ , conditionné par un contexte temporel $W_t$ (historique des observations).
$z_t = F(x_t | W_t; \theta) \sim \mathcal{N}(\mu_t, \Sigma_t)$
Dynamique Latente Prescrite (Biais Inductif) : Au lieu de laisser les représentations latentes libres, l'auteur impose une évolution temporelle déterministe sur la moyenne du latent $\mu_t$ .
$\mu_t = \psi(\mu_{t-1}; \phi)$
Dans l'implémentation proposée, ils utilisent un Modèle Dynamique Linéaire-Gaussien (LG-LDM) :
$\mu_t = A\mu_{t-1} + b$
Cela contraint les trajectoires latentes à suivre une loi dynamique spécifique (par exemple, une convergence vers un point fixe ou une oscillation stable).

B. Entraînement

Le modèle est entraîné en minimisant la négative log-vraisemblance (NLL) conjointe des paramètres du CNF ( $\theta$ ) et de la dynamique latente ( $\phi$ ). L'entraînement peut se faire de manière séquentielle sur toute la série ou par mini-batches temporels pour des raisons d'efficacité computationnelle.

C. Détection d'Anomalies : Test de Conformité Statistique

Au lieu d'utiliser le score de vraisemblance (NLL) pour détecter les anomalies, la méthode vérifie la conformité des trajectoires latentes aux dynamiques prescrites.

Principe : Une observation est considérée comme normale si sa trajectoire latente (après transformation par le CNF) respecte la distribution évolutive prescrite par le biais inductif.
Test Statistique : Les auteurs utilisent un test de bonté d'ajustement (Goodness-of-Fit - GOF), spécifiquement le test Kolmogorov-Smirnov Multivarié (MV-KS).
Décision : On compare la distribution empirique des trajectoires latentes d'une séquence de test à la distribution théorique prescrite (ex: Gaussienne blanche). Si la statistique KS ( $s$ $s$ ) dépasse une valeur critique ( $\tau$ $τ$ ) déterminée non-paramétriquement, la séquence est rejetée comme anormale.
- $s < \tau$ : Comportement attendu.
- $s \ge \tau$ : Anomalie.

3. Contributions Clés

Modèle d'État d'Espace Profond : Un modèle couplant un CNF à une dynamique latente explicite (ex: LG-LDM), forçant les représentations à évoluer selon des lois temporelles cohérentes.
Détection Sans Étiquettes et Sans Seuil : Un détecteur d'anomalies basé sur des tests statistiques (MV-KS) dans l'espace latent. Cela élimine le besoin de seuils manuels ou de données étiquetées pour l'entraînement, car la valeur critique du test statistique sert de seuil automatique.
Diagnostic de Conformité Intégré : Une méthode pour vérifier si l'entraînement du modèle a réussi à imposer le biais inductif. Si les données d'entraînement ne respectent pas la dynamique prescrite (mesuré par le test KS), le modèle n'est pas fiable pour la détection d'anomalies.
Robustesse aux Hautes Densités : La méthode permet de détecter des anomalies même dans des régions de l'espace d'observation où la vraisemblance est élevée, en se basant sur la violation de la dynamique temporelle plutôt que sur la densité statique.

4. Résultats Expérimentaux

Les expériences ont été menées sur des données synthétiques et réelles (TSB-AD, NEK, Stock, MITDB).

Données Synthétiques :
- Le score NLL échoue à détecter les anomalies d'amplitude (car elles restent dans des zones de haute densité) mais détecte les anomalies de fréquence.
- Le test MV-KS détecte avec succès à la fois les anomalies d'amplitude et de fréquence, car les trajectoires latentes violées ne respectent pas la dynamique Gaussienne prescrite.
- L'analyse de sensibilité montre que le test KS réagit aux changements mineurs d'amplitude, de fréquence et de bruit.
Données Réelles :
- Sur des séries univariées et multivariées, la méthode obtient des performances compétitives (parfois supérieures) par rapport aux bases de référence (Sub-PCA, CNN, TimesNet, etc.), notamment sur la métrique VUS-PR (Volume Under the Surface Precision-Recall).
- Importance de la conformité : Les résultats montrent une corrélation forte entre le taux de conformité des données d'entraînement au biais inductif (mesuré par le score KS) et la performance de détection. Lorsque le modèle est bien entraîné (conformité élevée, ex: 88-100% sur certains jeux de données), la détection sans seuil fonctionne très bien.
- Limites : Sur des jeux de données complexes où la dynamique linéaire n'est pas appropriée (ex: MITDB), la performance baisse, soulignant l'importance du choix du biais inductif.

5. Signification et Conclusion

Cet article propose un changement de paradigme pour la détection d'anomalies dans les séries temporelles :

Du "Likelihood" à la "Conformité" : Au lieu de chercher à modéliser la densité des données, l'approche cherche à vérifier si les données respectent une structure dynamique prédéfinie.
Interprétabilité : La méthode offre des diagnostics visuels et statistiques clairs sur le comportement du modèle et la nature des anomalies (violation de la dynamique).
Indépendance aux étiquettes : Elle fournit une règle de décision statistique rigoureuse qui ne nécessite pas de réglage manuel de seuils, rendant le déploiement plus robuste.

En conclusion, les auteurs démontrent que l'intégration de biais inductifs structurels dans l'espace latent, couplée à des tests statistiques de conformité, permet de surmonter les limites des modèles génératifs basés uniquement sur la vraisemblance, offrant une solution plus fiable et interprétable pour la détection d'anomalies non supervisée.