CINDI: Conditional Imputation and Noisy Data Integrity with Flows in Power Grid Data

El artículo presenta CINDI, un marco probabilístico no supervisado basado en flujos normalizadores condicionales que unifica la detección de anomalías y la imputación de datos en series temporales multivariantes de redes eléctricas, logrando restaurar la integridad de los datos ruidosos preservando sus propiedades físicas y estadísticas.

David Baumgartner, Helge Langseth, Heri Ramampiaro

Publicado 2026-03-13
📖 4 min de lectura☕ Lectura para el café

Each language version is independently generated for its own context, not a direct translation.

Imagina que la red eléctrica es como un sistema de tuberías de agua gigante que alimenta a toda una ciudad. Para que los ingenieros sepan cuánta agua se pierde por fugas (pérdidas de energía) y puedan cobrar correctamente, necesitan medir el flujo con extrema precisión.

El problema es que, en el mundo real, los medidores a veces se rompen, los cables se cortan o los humanos cometen errores al registrar los datos. Esto es como si alguien pintara de rojo partes del mapa de la ciudad, diciendo "aquí hay agua", cuando en realidad no hay nada, o viceversa. Si intentas predecir el futuro basándote en un mapa con manchas de pintura, tu predicción será un desastre.

Aquí es donde entra CINDI, el "detective y restaurador de datos" que proponen los autores.

¿Qué es CINDI? (El Detective que también pinta)

Normalmente, cuando los científicos tienen datos sucios, hacen dos cosas por separado:

  1. Detectan el error: Usan un programa para decir "¡Esa lectura es sospechosa!".
  2. Reparan el error: Usan otro programa diferente para decir "Bueno, si aquí no hay dato, inventa uno que parezca lógico".

CINDI es diferente. Es como un restaurador de arte que también es detective. No usa dos herramientas separadas; usa una sola "mente" (un modelo matemático llamado flujo normalizante condicional) que hace todo a la vez.

¿Cómo funciona? (La analogía del "Molde de Chocolate")

Imagina que tienes un molde de chocolate que sabe exactamente cómo se ve una barra de chocolate perfecta.

  1. El Escaneo (Detección): CINDI toma tus datos sucios y los compara con su "molde perfecto". Si ve una parte que no encaja (como un trozo de chocolate que parece más bien una piedra), lo marca: "¡Esto no es chocolate, es un error!".
  2. La Reparación (Imputación): En lugar de simplemente borrar la piedra, CINDI usa su conocimiento del molde para imaginar cómo debería ser el chocolate en ese lugar. Genera una nueva pieza de chocolate que encaja perfectamente con el resto de la barra, respetando el sabor y la textura originales.
  3. El Bucle de Mejora: Lo genial de CINDI es que no se detiene ahí. Una vez que repara un trozo, vuelve a mirar toda la barra con el trozo nuevo. ¿Ahora encaja mejor? ¿Hay otro error que antes estaba oculto por el error anterior? Repite el proceso una y otra vez hasta que la barra de chocolate (los datos) sea lo más perfecta posible.

¿Por qué es importante para la red eléctrica?

En el artículo, probaron esto con datos reales de una compañía de electricidad en Noruega.

  • El problema: Los datos de "pérdidas de energía" estaban muy sucios, especialmente en ciertas épocas del año (como cuando cambia la hora de verano/invierno), llenos de "ruido" y errores sistemáticos.
  • La solución: CINDI limpió estos datos, eliminando las "manchas de pintura" y rellenando los huecos con datos que tienen sentido físico y estadístico.
  • El resultado: Cuando usaron estos datos limpios para entrenar a otros sistemas de inteligencia artificial que predicen el futuro, estos sistemas funcionaron mucho mejor.

La lección clave

La idea central es que no debes tratar la detección de errores y la reparación como dos tareas separadas. Al unirlas en un solo sistema inteligente que entiende cómo funciona el sistema eléctrico en su conjunto, CINDI logra:

  • No inventar datos al azar (respeta las leyes de la física).
  • Mejorar la calidad de los datos de forma iterativa (poco a poco).
  • Hacer que las predicciones futuras sean mucho más fiables.

En resumen, CINDI es como tener un guardián de datos que no solo sabe cuándo algo está mal, sino que tiene la creatividad y el conocimiento para arreglarlo de manera que todo vuelva a tener sentido, asegurando que la red eléctrica funcione sin sorpresas desagradables.