Counterfactual Explanations on Robust Perceptual Geodesics

Este artículo presenta Perceptual Counterfactual Geodesics (PCG), un método que genera explicaciones contrafactuales semánticamente válidas y suaves al trazar geodésicas en un espacio latente con una métrica riemanniana perceptual derivada de características de visión robusta, superando así las limitaciones de los enfoques existentes que sufren de artefactos fuera de la variedad o colapso adversarial.

Eslam Zaher, Maciej Trzaskowski, Quan Nguyen, Fred Roosta

Publicado 2026-03-03
📖 5 min de lectura🧠 Análisis profundo

Each language version is independently generated for its own context, not a direct translation.

Imagina que tienes un modelo de inteligencia artificial (IA) que es como un chef muy estricto. Si le pones una foto de un gato, te dice: "¡Esto es un gato!". Pero si le pones una foto de un perro, te dice: "¡Esto es un perro!".

El problema es que a veces, si le haces una pequeña "trampa" a la foto (cambiando un píxel aquí o allá), el chef se confunde y te dice que el gato es un perro. A esto los expertos le llaman "ejemplo adversario".

Los investigadores de este papel quieren responder a una pregunta muy humana: "¿Qué tendría que cambiar exactamente en esta foto para que el chef diga 'perro' en lugar de 'gato'?". A esto le llaman explicación contrafactual.

El problema es que los métodos anteriores para encontrar esa respuesta eran como intentar adivinar el camino en una montaña oscura sin mapa. A veces, el camino que encontraban no era realista (parecía un gato que se convierte en un perro a través de un monstruo alienígena) o era una trampa que engañaba al chef pero no tenía sentido para los humanos.

Aquí está la solución que proponen, explicada con analogías sencillas:

1. El Problema: Caminar por un Terreno Plano vs. un Terreno Real

Imagina que el mundo de las imágenes (todos los gatos, perros y plantas posibles) es una montaña con curvas y valles.

  • Los métodos antiguos intentaban caminar en línea recta sobre un mapa plano (como si el mundo fuera una hoja de papel). Al hacerlo, a menudo se caían por los bordes de la montaña (creando imágenes que no existen en la realidad) o se quedaban atrapados en zonas peligrosas donde el chef se confunde fácilmente (trampas adversarias).
  • El problema de la "distancia": Antes, medían la distancia entre un gato y un perro contando píxeles (como medir la distancia entre dos ciudades contando los ladrillos de las casas). Pero para un humano, dos fotos pueden tener los mismos píxeles pero parecer totalmente diferentes, o viceversa.

2. La Solución: PCG (Geodésicas Perceptuales Contrafactuales)

Los autores crearon un nuevo método llamado PCG. Imagina que PCG es como tener un GPS de montaña con un mapa 3D perfecto que solo sabe de caminos seguros y reales.

  • El Mapa Robusto (La Brújula Mágica): En lugar de usar un mapa plano, PCG usa un mapa creado por un "experto" que es muy difícil de engañar (un modelo de IA entrenado para ser resistente a trucos). Este experto sabe qué cambios son reales (como cambiar el color del pelaje) y cuáles son trucos (como añadir ruido invisible).
  • Caminar por la Curva (Geodésica): En lugar de caminar en línea recta, PCG te guía por el camino más suave y natural que sigue la curvatura de la montaña. Es como si caminaras por un sendero que ya existe en la naturaleza, en lugar de cortar a través del bosque y romper las ramas.
    • Analogía: Si quieres ir de un punto A a un punto B en una esfera (como la Tierra), no puedes ir en línea recta a través del centro de la Tierra. Tienes que seguir la curvatura de la superficie. PCG hace lo mismo con las imágenes: sigue la "piel" de la realidad.

3. Cómo funciona el proceso (Dos Fases)

Imagina que quieres transformar una foto de un gato en un perro:

  1. Fase 1 (El Camino Seguro): Primero, el sistema traza un camino suave entre el gato y un perro cualquiera que ya conoce. No le importa aún si es el perro más parecido al gato, solo quiere asegurarse de que el camino no tenga monstruos ni trampas. Es como trazar una ruta de senderismo segura.
  2. Fase 2 (El Ajuste Fino): Ahora, toma ese camino seguro y lo ajusta para que el perro final sea lo más parecido posible al gato original, pero sin salirse del sendero seguro. Si el camino se desvía hacia una zona peligrosa, el sistema lo corrige y lo vuelve a poner en el sendero.

¿Por qué es mejor esto?

  • Evita los "Monstruos": Los métodos antiguos a veces creaban imágenes que parecían gatos y perros mezclados de forma extraña (como un gato con patas de perro). PCG evita esto porque sigue el "terreno" real de las imágenes.
  • Engaño Imposible: Como el mapa está hecho por un experto resistente, no puedes usar trucos invisibles para engañar al chef. El cambio que propone PCG es algo que un humano también notaría y entendería.
  • Realismo: Las imágenes resultantes parecen fotos reales, no arte abstracto o distorsionado.

En resumen

Este papel dice: "Para explicar cómo cambiar una decisión de una IA, no podemos simplemente empujar los píxeles al azar. Tenemos que caminar por el camino natural y seguro que ya existe en el mundo de las imágenes, usando un mapa que no se deja engañar por trucos."

Es como si antes intentáramos cruzar un río saltando piedras al azar (y a veces cayéndonos al agua), y ahora tenemos un puente de piedra sólido y bien diseñado que nos lleva de un lado a otro sin mojarnos y sin caer en trampas.