Measuring AI Agents' Progress on Multi-Step Cyber Attack Scenarios

Each language version is independently generated for its own context, not a direct translation.

Samenvatting: Hoe slim zijn AI-robots nu eigenlijk als het gaat om hacken?

Stel je voor dat je een groep super-slimme robots (AI-modellen) hebt die je leert hoe ze een complex doolhof moeten vinden. Maar dit is geen gewoon doolhof; het is een digitaal kasteel vol sloten, valkuilen en geheime gangen. De vraag is: kunnen deze robots het kasteel alleen, zonder hulp van mensen, volledig veroveren?

Dit onderzoek, uitgevoerd door experts van het AI Security Institute in het VK, heeft precies dat getest. Ze hebben zeven verschillende generaties van de slimste AI's ter wereld (van augustus 2024 tot februari 2026) de opdracht gegeven om twee verschillende digitale "speelvelden" te hacken.

Hier is wat ze ontdekten, vertaald in begrijpelijke taal:

1. De twee proefvelden: Een kantoorpand en een elektriciteitscentrale

De onderzoekers bouwden twee digitale simulaties:

Het Kantoorgebouw ("The Last Ones"): Dit is een 32-stappen lange aanval op een virtueel bedrijfsnetwerk. De AI moet als een dief door het gebouw sluipen, sleutels (wachtwoorden) stelen, zich verplaatsen naar andere kamers en uiteindelijk een kluis met gevoelige data openen. Dit is vergelijkbaar met een lange, complexe puzzel.
De Koeltoren ("Cooling Tower"): Dit is een aanval op een virtuele elektriciteitscentrale. De AI moet hier de fysieke machines (zoals pompen en kleppen) saboteren. Dit is veel lastiger omdat de stappen hier groter zijn en de regels anders werken. Het is alsof je niet alleen de deur moet openen, maar ook moet weten hoe je een machine moet laten ontploffen zonder dat je weet hoe die machine werkt.

2. De grote ontdekkingen

De onderzoekers keken naar twee dingen: hoeveel rekenkracht ze gebruikten (gemeten in "tokens", ofwel de hoeveelheid tekst die de AI moet verwerken) en hoe slim de AI-generatie was.

A. "Meer geld = Beter resultaat" (De rekenkracht-metode)

Stel je voor dat je een robot een opdracht geeft. Als je de robot maar één minuut tijd geeft, haalt hij misschien de halve trap. Maar als je hem een uur tijd geeft, klimt hij de hele trap op.

Wat ze zagen: Als je de AI meer "rekenkracht" (tokens) gaf, werd hij direct slimmer. Er was geen punt waarop de AI "vastliep".
Het verrassende: Je hoeft geen computerexpert te zijn om dit te doen. Iedereen kan simpelweg zeggen: "Gebruik meer rekenkracht." Door de budgetten te verhogen van 10 miljoen naar 100 miljoen tokens, kon de AI tot 59% meer stappen zetten. Het was alsof je een fietsje omruilt voor een racefiets: je komt veel sneller en verder, zonder dat je hoeft te leren fietsen.

B. "Nieuwe modellen zijn gewoon beter" (De generatie-metode)

De onderzoekers keken ook naar de evolutie van de AI's.

De groei: Een AI uit augustus 2024 (GPT-4o) haalde gemiddeld slechts 1,7 stappen van de 32. Een AI uit februari 2026 (Opus 4.6) haalde gemiddeld 9,8 stappen, en in zijn beste poging zelfs 22 van de 32 stappen.
De snelheid: De nieuwste AI kon in ongeveer 10 uur werk doen waar een menselijke hacker ongeveer 14 uur voor nodig zou hebben. Dat klinkt snel, maar het is nog niet perfect.

3. Waar lopen ze vast? (De "Muur")

Hoewel de AI's steeds beter worden, zijn ze nog niet onoverwinnelijk.

Het Kantoorgebouw: De AI's konden de eerste helft van het gebouw prima veroveren. Maar zodra ze bij de "diepe" delen kwamen (waar ze moeten knoeien met cryptografie, oude software reverse-engineeren en malware schrijven), liepen ze vast. De nieuwste AI (Opus 4.6) was de eerste die hier echt doorheen brak, maar zelfs hij kon het niet helemaal afmaken.
De Koeltoren: Hier was het nog veel moeilijker. De AI's konden hier nauwelijks iets doen. Ze haalden gemiddeld maar 1,4 van de 7 stappen.
- Interessant detail: Soms probeerden de AI's iets heel anders dan mensen zouden doen. In plaats van via de webpagina de deur open te breken, probeerden ze direct met de machines te praten via hun geheime taal (protocollen) en deden ze alsof ze de machine "raakten" totdat het werkte. Het was alsof ze de muur niet openbraken, maar de muur gewoon omzeilden door er doorheen te lopen.

4. Wat betekent dit voor de wereld?

Dit onderzoek is een wake-up call voor de cybersecurity-wereld.

Het dreigingsniveau stijgt: AI wordt steeds beter in het zelfstandig uitvoeren van complexe aanvalsketens. De drempel om een cyberaanval te plegen wordt lager. Een minder ervaren hacker kan nu met AI-tools doen wat vroeger alleen een expert kon.
Nog niet volledig autonoom: Hoewel de AI's indrukwekkend zijn, zijn ze nog niet in staat om een volledige aanval op een echt, complex systeem (zoals een elektriciteitscentrale) volledig alleen te voltooien zonder menselijke hulp. Ze hebben nog steeds hulp nodig bij de moeilijkste puzzels.
De toekomst: Als we niets doen, zullen deze AI's binnenkort nog slimmer zijn. De onderzoekers waarschuwen dat we nu al moeten kijken naar hoe we deze systemen kunnen beveiligen, voordat de AI's de "muur" volledig doorbreken.

Kortom: De AI's zijn net als kinderen die leren fietsen. Twee jaar geleden konden ze nauwelijks rechtop blijven. Vandaag rijden ze al flink door de stad, maar ze kunnen nog niet de Tour de France winnen zonder dat ze vallen. En het gevaar is dat ze elke dag sneller leren fietsen.

Measuring AI Agents' Progress on Multi-Step Cyber Attack Scenarios

1. De twee proefvelden: Een kantoorpand en een elektriciteitscentrale

2. De grote ontdekkingen

A. "Meer geld = Beter resultaat" (De rekenkracht-metode)

B. "Nieuwe modellen zijn gewoon beter" (De generatie-metode)

3. Waar lopen ze vast? (De "Muur")

4. Wat betekent dit voor de wereld?

Titel: Het Meten van de Vooruitgang van AI-Agenten in Multi-Stap Cyberaanvalsscenario's

1. Probleemstelling

2. Methodologie

3. Belangrijkste Bevindingen en Resultaten

A. Schaling met Inference-Time Compute

B. Verbetering per Modelgeneratie

C. Prestaties op "Cooling Tower" (ICS)

4. Kritieke Observaties en Beperkingen

5. Significance en Conclusie

Measuring AI Agents' Progress on Multi-Step Cyber Attack Scenarios

1. De twee proefvelden: Een kantoorpand en een elektriciteitscentrale

2. De grote ontdekkingen

A. "Meer geld = Beter resultaat" (De rekenkracht-metode)

B. "Nieuwe modellen zijn gewoon beter" (De generatie-metode)

3. Waar lopen ze vast? (De "Muur")

4. Wat betekent dit voor de wereld?

Titel: Het Meten van de Vooruitgang van AI-Agenten in Multi-Stap Cyberaanvalsscenario's

1. Probleemstelling

2. Methodologie

3. Belangrijkste Bevindingen en Resultaten

A. Schaling met Inference-Time Compute

B. Verbetering per Modelgeneratie

C. Prestaties op "Cooling Tower" (ICS)

4. Kritieke Observaties en Beperkingen

5. Significance en Conclusie

Meer zoals dit

DIVE: Scaling Diversity in Agentic Task Synthesis for Generalizable Tool Use

A Survey of Reasoning in Autonomous Driving Systems: Open Challenges and Emerging Paradigms

PACED: Distillation at the Frontier of Student Competence

Reversible Lifelong Model Editing via Semantic Routing-Based LoRA

Mind the Sim2Real Gap in User Simulation for Agentic Tasks