EraseAnything++: Enabling Concept Erasure in Rectified Flow Transformers Leveraging Multi-Object Optimization

El artículo presenta EraseAnything++, un marco unificado que utiliza optimización multiobjetivo y cirugía de gradientes implícita para eliminar conceptos no deseados de modelos de flujo rectificado tanto para imágenes como para video, logrando un equilibrio superior entre la eficacia de la eliminación y la preservación de la calidad generativa.

Zhaoxin Fan, Nanxiang Jiang, Daiheng Gao, Shiji Zhou, Wenjun Wu

Publicado 2026-03-03
📖 4 min de lectura☕ Lectura para el café

Each language version is independently generated for its own context, not a direct translation.

¡Claro que sí! Imagina que las Inteligencias Artificiales que crean imágenes y videos (como las que hacen fotos de personas o paisajes) son como grandes cocineros digitales. Estos cocineros han aprendido a cocinar de todo: desde una pizza perfecta hasta un retrato de un gato. Pero, por desgracia, también han aprendido a cocinar cosas que no deberían, como contenido inapropiado, violento o con derechos de autor.

El problema es que si intentas "borrar" esa habilidad mala del cocinero, a menudo terminas arruinando su capacidad para cocinar cosas buenas. Es como si, para que el cocinero dejara de hacer pasteles de chocolate (porque no quieres eso), le quitaras la habilidad de hacer pasteles de zanahoria o incluso de freír huevos.

Aquí es donde entra EraseAnything++, la nueva solución presentada en este artículo. Vamos a explicarlo con una analogía sencilla:

1. El Problema: El "Borrado" que arruina todo

Antes, los métodos para eliminar conceptos indeseados (como la desnudez o un artista específico) funcionaban como un martillo: golpeaban fuerte para romper la "mala idea", pero terminaban rompiendo también la "buena idea".

  • En videos: Era aún peor. Imagina que intentas borrar a un personaje malo de una película. Los métodos antiguos borraban al personaje en el primer segundo, pero luego, en el siguiente segundo, el personaje volvía a aparecer porque la película "se olvidó" de que debía estar borrado. Esto se llama "deriva temporal".

2. La Solución: EraseAnything++ (El Cirujano de Precisión)

EraseAnything++ no es un martillo; es un cirujano de precisión que opera con una nueva filosofía: Optimización Multi-Objetivo.

Imagina que tienes dos metas que parecen opuestas:

  1. Objetivo A: Eliminar el concepto malo (ej. "desnudez").
  2. Objetivo B: Mantener la calidad de todo lo demás (ej. "que la piel se vea real", "que el fondo sea bonito").

Antes, los científicos intentaban equilibrar esto como si fuera una balanza inestable. Si empujabas mucho hacia la izquierda (borrar), la derecha (calidad) caía.

EraseAnything++ usa una técnica llamada "Cirugía de Gradiente Implícita".

  • La analogía: Imagina que el cocinero está intentando mezclar dos ingredientes en un tazón. Uno es el "ingrediente malo" y el otro es el "ingrediente bueno".
  • La nueva técnica actúa como un filtro inteligente. Si el movimiento para quitar el ingrediente malo choca contra el ingrediente bueno, el sistema hace un pequeño ajuste matemático (un "corte" en la dirección del movimiento) para que pueda quitar lo malo sin tocar lo bueno.
  • Es como conducir un coche: si quieres girar a la izquierda (borrar) pero hay un muro a la izquierda (proteger la calidad), el sistema calcula la ruta perfecta para deslizarte hacia la izquierda sin chocar, manteniendo la velocidad.

3. El Truco para los Videos: "Anclar y Propagar"

Para los videos, el reto es que el tiempo pasa. Si borras algo en el primer fotograma, ¿cómo aseguras que no vuelva en el fotograma 100?

EraseAnything++ usa una estrategia de "Anclar y Propagar":

  • Anclar: Primero, el sistema elige el primer fotograma (el "ancla") y se asegura de que el concepto malo esté 100% borrado allí. Es como poner una base sólida de cemento.
  • Propagar: Luego, en lugar de tratar cada fotograma por separado, el sistema "propaga" esa limpieza a través de toda la película, asegurándose de que la "sombra" del concepto malo no pueda colarse a través de las conexiones entre los fotogramas.
  • Resultado: El personaje malo desaparece y nunca vuelve a aparecer, manteniendo el movimiento suave y natural de la película.

4. ¿Por qué es mejor que los anteriores?

  • No olvida nada: A diferencia de métodos anteriores que borraban todo (incluso cosas buenas como "una chica" si querías borrar "desnudez"), este método es tan preciso que puede borrar "desnudez" pero seguir generando "chicas con ropa" perfectamente.
  • Resiste trucos: Si alguien intenta engañar al sistema escribiendo "nude" como "nudee" o "n-ude", EraseAnything++ entiende que es lo mismo y lo sigue borrando, porque entiende el significado, no solo la palabra escrita.
  • Funciona en todo: Funciona tanto en fotos estáticas (como las de Flux) como en videos largos (como los de OpenSora).

En resumen

EraseAnything++ es como un filtro de seguridad inteligente que se instala en el cerebro de la IA. No apaga la máquina ni le quita la memoria; simplemente le enseña a ignorar las instrucciones peligrosas sin dejar de ser creativo con el resto.

Gracias a esto, podemos tener IAs que generen videos e imágenes increíbles, pero que sean seguras y no produzcan contenido dañino, manteniendo la magia de la creación intacta. ¡Es un gran paso para que la tecnología sea más responsable!