CINDI: Conditional Imputation and Noisy Data Integrity with Flows in Power Grid Data

Dit paper introduceert CINDI, een onbewaakte probabilistisch raamwerk op basis van conditionele normaliserende flows dat detectie van anomalieën en imputatie van ruis in multivariate tijdsreeksen, zoals elektriciteitsnetwerkdata, verenigt tot één end-to-end systeem om de gegevensintegriteit te herstellen.

David Baumgartner, Helge Langseth, Heri Ramampiaro

Gepubliceerd 2026-03-13
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

CINDI: De Slimme Restaurator voor Elektrische Netwerken

Stel je voor dat een elektriciteitsnetwerk een enorme, complexe orkest is. Elke muzikant (een sensor) speelt een noot (een meetwaarde) om het geluid van het net te beschrijven. Maar soms, door een defecte snaar, een dronken muzikant of een storing in de zaal, spelen ze valse tonen of vallen ze helemaal stil. Als je dit "ruis" in de muziek niet opruimt, klinkt het hele concert (de voorspellingen van het net) waardeloos.

Tot nu toe hebben mensen dit probleem opgelost door twee aparte teams in te huren:

  1. De Detectie-agent: Kijkt naar de muziek en zegt: "Hé, die noot klinkt raar!"
  2. De Reparateur: Kijkt naar die raar klinkende noot en probeert hem te vervangen door iets wat logisch klinkt, vaak door gewoon te raden of te middelen met de buren.

Het probleem? Deze twee teams praten niet met elkaar. De reparateur weet niet precies wat de agent dacht, en de agent heeft geen idee of zijn vervanging goed klinkt. Het resultaat is vaak een "pleister" die niet helemaal past.

CINDI (Conditional Imputation and Noisy Data Integrity) is een nieuw, slimme aanpak die deze twee teams samenvoegt tot één meester-restaurator.

Hoe werkt CINDI?

Stel je voor dat CINDI een kunstrestaurator is die een oud schilderij (de data) bekijkt. In plaats van alleen te raden wat er onder de vlekken zit, leert CINDI eerst perfect hoe het schilderij er had moeten uitzien als er geen schade was.

  1. Het Leren van de "Normale" Wereld:
    CINDI kijkt naar de gezonde delen van de data en leert de complexe patronen. Het leert bijvoorbeeld: "Als de zon schijnt en de temperatuur stijgt, dan stijgt het stroomverbruik op een heel specifieke manier." Het bouwt een mentaal model van hoe het net moet werken.

  2. Het Opsporen van de Vlekken:
    Vervolgens kijkt CINDI naar de hele dataset. Waar het model zegt: "Dit past niet bij wat ik heb geleerd!" (bijvoorbeeld: plotseling een enorme piek in de winter), markeert het die plek als verdacht. Dit is de "anomalie".

  3. Het Slimme Vervangen (Imputatie):
    Nu komt de magie. In plaats van een simpele lijn te trekken tussen twee punten, gebruikt CINDI zijn mentale model om te dromen over wat er op die plek had moeten staan.

    • Het vraagt zichzelf: "Als ik dit stukje data zou vervangen, wat is dan de meest waarschijnlijke, logische waarde die past bij de rest van het schilderij?"
    • Het genereert een nieuwe, schone versie van die data.
    • Het slimme trucje: CINDI doet dit niet één keer, maar in een iteratief proces. Het vervangt de data, kijkt of het resultaat nog steeds logisch is, en past het eventueel weer aan. Het is alsof de restaurator steeds verder verfijnt tot het schilderij perfect harmonieert.

Waarom is dit zo belangrijk?

In de echte wereld, zoals bij de Noorse elektriciteitsnetwerken waar dit papier over gaat, zijn de data vaak vies. Sensoren gaan stuk, of er zijn storingen in de communicatie. Als je een AI-model traint op deze "vies" data, leert het de verkeerde regels. Het is alsof je een student leert wiskunde met een boek vol typefouten; de student zal de fouten leren, niet de wiskunde.

CINDI zorgt ervoor dat je eerst het boek corrigeert voordat je de student iets leert.

  • Voorheen: Je probeerde de fouten te vinden en te repareren met losse tools.
  • Met CINDI: Je gebruikt één krachtig systeem dat zowel de fouten ziet als de juiste oplossing bedenkt, gebaseerd op een diep begrip van hoe het systeem werkt.

De Resultaten in het Kort

De onderzoekers hebben CINDI getest op echte data van een Noors energienetwerk. Ze zagen dat:

  • CINDI tot een bepaald punt (ongeveer 14% aan fouten in de data) uitstekend werk leverde.
  • Het systeem de data zo schoon maakte dat andere modellen die daarop trainden veel beter presteerden.
  • Zelfs als er veel ruis in de data zat, kon CINDI vaak nog een goede, logische "gissing" doen die beter was dan simpele rekenmethodes.

Kortom: CINDI is als een slimme, geduldige editor die niet alleen typos ziet, maar ook begrijpt wat de schrijver bedoelde, en het verhaal zo herschrijft dat het weer logisch en waardevol wordt. Dit zorgt voor betrouwbaardere voorspellingen over stroomverbruik en verlies, wat essentieel is voor een stabiel energienet.