Measuring AI Agents' Progress on Multi-Step Cyber Attack Scenarios

El estudio evalúa la capacidad de siete modelos de IA de vanguardia para ejecutar ciberataques autónomos en entornos corporativos e industriales, revelando que el rendimiento escala log-linealmente con la potencia de cómputo y mejora significativamente entre generaciones, logrando completar hasta 22 de 32 pasos en un escenario corporativo en un tiempo comparable al de un experto humano.

Linus Folkerts, Will Payne, Simon Inman, Philippos Giavridis, Joe Skinner, Sam Deverett, James Aung, Ekin Zorer, Michael Schmatz, Mahmoud Ghanem, John Wilkinson, Alan Steer, Vy Hong, Jessica Wang

Publicado 2026-03-13
📖 5 min de lectura🧠 Análisis profundo

Each language version is independently generated for its own context, not a direct translation.

Imagina que la inteligencia artificial (IA) es como un aprendiz de detective muy inteligente, pero que todavía está aprendiendo el oficio. Este artículo es como un informe de entrenamiento donde los autores ponen a prueba a varios de estos "detectives" (modelos de IA más nuevos y antiguos) en dos escenarios de entrenamiento muy específicos: uno es un ataque a una oficina corporativa y el otro es un ataque a una planta de energía industrial.

El objetivo no era ver si podían resolver un acertijo rápido, sino si podían llevar a cabo una misión larga y compleja paso a paso, sin que un humano les dijera qué hacer en cada momento.

Aquí tienes los puntos clave explicados con analogías sencillas:

1. La Prueba de Fuego: Dos Escenarios Diferentes

Los autores construyeron dos "pistas de entrenamiento" virtuales:

  • Escenario A: "Los Últimos" (La Oficina Corporativa).

    • La misión: Robar datos sensibles de una base de datos protegida dentro de una red de oficina.
    • La dificultad: Es como un laberino de 32 pasos. Tienes que encontrar llaves, abrir puertas, saltar vallas y esquivar guardias (aunque en esta prueba, los guardias no atacan de verdad, solo observan).
    • El resultado: ¡Aquí es donde la IA sorprendió! Los modelos más nuevos lograron avanzar mucho más lejos que los antiguos. El mejor modelo logró completar 22 de los 32 pasos.
    • La analogía: Imagina que un humano experto tardaría unas 14 horas en completar este laberino. El mejor modelo de IA lo hizo en un tiempo equivalente a 6 horas de trabajo humano, aunque tardó más tiempo real en la computadora porque "pensó" mucho.
  • Escenario B: "La Torre de Refrigeración" (La Planta Industrial).

    • La misión: Desactivar o dañar el sistema de control de una planta de energía.
    • La dificultad: Es un sistema muy especializado y delicado. Son solo 7 pasos, pero cada paso es como mover una pieza de un reloj gigante; si te equivocas, todo se detiene.
    • El resultado: Aquí la IA todavía se queda corta. La mayoría de los modelos apenas lograron dar 1 o 2 pasos. Es como intentar que un niño de primaria repare un motor de avión: tienen la inteligencia, pero les falta el conocimiento técnico específico y la experiencia de campo.

2. Dos Grandes Descubrimientos (Las Tendencias)

El estudio encontró dos reglas de oro sobre cómo están mejorando estas IAs:

  • Regla 1: "Más dinero, más éxito" (Escalar el presupuesto).

    • Si le das a la IA más tiempo de "pensamiento" (medido en "tokens", que son como palabras o fragmentos de texto que la IA procesa), hace un trabajo mucho mejor.
    • La analogía: Es como si le dieras a un estudiante más tiempo para estudiar antes del examen. No importa si el estudiante es "tonto" o "inteligente"; si le das 100 veces más tiempo para pensar, resolverá más problemas.
    • Lo más preocupante es que no hay un límite visible. Cuanto más tiempo de computación gastan, mejor se vuelven, sin estancarse. Y lo peor: cualquiera puede hacer esto. No necesitas ser un genio de la informática; solo necesitas pagar por más tiempo de procesamiento.
  • Regla 2: "Cada nueva generación es más lista" (Mejora con el tiempo).

    • Comparando modelos lanzados en 2024 con los de 2026, los nuevos son mucho mejores, incluso si les das el mismo tiempo de "pensamiento".
    • La analogía: Es como comparar un coche de 2024 con uno de 2026. El nuevo no solo va más rápido, sino que tiene mejor navegación y maneja mejor las curvas. En el escenario de la oficina, el modelo más nuevo (Opus 4.6) completó casi el doble de pasos que el modelo de hace un año y medio, usando la misma cantidad de recursos.

3. ¿Dónde fallan? (Los Cuellos de Botella)

Aunque la IA avanza rápido, todavía tiene problemas graves:

  • El muro del conocimiento especializado: En el escenario de la oficina, la IA se estanca cuando necesita conocimientos muy técnicos, como "ingeniería inversa" (desarmar un programa para ver cómo funciona) o criptografía avanzada. Es como si el detective supiera abrir puertas, pero no supiera cómo forzar una caja fuerte compleja.
  • El problema de la distracción: En el escenario industrial, la IA a veces se distrae o intenta atajos extraños. Por ejemplo, en lugar de seguir el camino lógico de hackear una web primero, a veces intenta "adivinar" códigos directamente en el sistema industrial, como si estuviera adivinando la contraseña de un cajero automático a la fuerza. A veces funciona por suerte (encontrando un error en el sistema), pero no porque entienda lo que hace.

4. ¿Por qué es importante esto?

El mensaje principal es que la barrera para cometer ciberataques está bajando.

  • Antes: Para hackear una red compleja, necesitabas un equipo de hackers expertos trabajando durante días.
  • Ahora: Con una IA moderna y un poco de presupuesto de computación, un actor con pocos conocimientos técnicos podría lanzar un ataque que antes requería expertos. La IA actúa como un "acelerador" o un "multiplicador de fuerza".

Conclusión en una frase

La inteligencia artificial está aprendiendo a ser un hacker autónomo muy rápido en entornos de oficina, y cada nueva versión es más peligrosa, pero todavía no es lo suficientemente experta para romper sistemas industriales complejos por sí sola. Sin embargo, la tendencia es clara: están mejorando tan rápido que pronto podrían ser capaces de hacer casi cualquier cosa si se les da suficiente tiempo y recursos.