Learning the APT Kill Chain: Temporal Reasoning over Provenance Data for Attack Stage Estimation

Dit paper introduceert StageFinder, een tijdsgerelateerd graf-leerframework dat gefuseerde host- en netwerkbewijsdata analyseert om de voortgang van APT-aanvallen met hoge nauwkeurigheid en stabiliteit te schatten binnen het MITRE ATT&CK-rahmen.

Trung V. Phan, Thomas Bauschert

Gepubliceerd Tue, 10 Ma
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

🕵️‍♂️ De Jacht op de Onzichtbare Dieven: Wat is StageFinder?

Stel je voor dat een hackersbende (een zogenaamde APT of Advanced Persistent Threat) een groot kantorencomplex binnendringt. Ze zijn niet zoals de gewone inbrekers die snel iets stelen en wegrennen. Nee, deze groep is als een sluwe spion: ze sluipen maandenlang onopgemerkt rond, verkennen de gangen, vinden de sleutels, verplaatsen zich naar de kluis en stelen uiteindelijk de waardevolle documenten.

Het probleem voor de beveiliging is dat ze vaak pas merken dat er iets mis is als het te laat is, of ze zien alleen losse stukjes puzzel (een raam open, een vreemde mail) zonder te weten dat het één groot plan is.

StageFinder is een slimme nieuwe tool die precies dit probleem oplost. Het is als een super-intelligente detective die niet alleen kijkt naar losse gebeurtenissen, maar het hele verhaal reconstrueert om te zeggen: "Aha! We zijn nu in de fase van 'verkenning', over een uur gaan ze proberen de deuren te forceren, en morgen proberen ze de kluis te openen."


🧩 Hoe werkt het? (De Drie Stappen)

De onderzoekers hebben StageFinder gebouwd met drie slimme onderdelen, die we kunnen vergelijken met een detectivebureau:

1. Het Grote Netwerk (De "Provenance Graph")

Stel je voor dat elke computer, elk bestand en elke gebruiker in het bedrijf een spook is. Normale beveiliging kijkt alleen naar één spook op één moment.
StageFinder doet echter iets anders: het tekent een enorme, levende kaart van wie met wie praat.

  • De slimme truc: Het combineert twee soorten bewijs.
    • Binnenin het huis: Wat doet de computer? (Bijv. "PowerShell start een nieuw programma op").
    • Buiten het huis: Wat ziet de beveiligingscamera? (Bijv. "Er is een verdachte verbinding met een vreemd IP-adres").
  • De analogie: Stel je voor dat je een verdachte ziet die een raam openmaakt (binnen) én tegelijkertijd een auto ziet die wegrijdt (buiten). Een gewone camera ziet ze apart. StageFinder koppel ze direct aan elkaar: "Die auto is de vluchtweg van die man bij het raam!" Dit heet vroege fusie.

2. De Architect (De "GNN" - Graph Neural Network)

Nu hebben we die enorme kaart met alle lijntjes en punten. Een mens kan dat niet snel lezen.
De GNN is als een super-snel architect die deze kaart bekijkt en zegt: "Kijk eens naar dit patroon! Dit lijkt op een spion die eerst de muren inspecteert (verkenning) en dan probeert een sleutel te maken (privilege escalatie)."
Het vertaalt die complexe kaart naar een simpele, begrijpelijke code die een computer makkelijk kan verwerken.

3. De Tijdreis (De "LSTM" - Long Short-Term Memory)

Hackers werken in een tijdlijn. Eerst verkennen, dan binnenkomen, dan stelen.
De LSTM is als een detective met een fantastisch geheugen. Hij kijkt niet alleen naar wat er nu gebeurt, maar remembert wat er gisteren en de week daarvoor gebeurde.

  • De analogie: Als je plotseling een auto ziet die wegrijdt met een koffer, is dat verdacht. Maar als je weet dat die auto gisteren al drie keer langs het pand reed om de beveiliging te testen, dan is het duidelijk: dit is de diefstal-fase.
    De LSTM houdt rekening met deze tijdlijn en voorspelt: "We zitten nu in fase 4 (verplaatsing naar andere kamers), en over 10 minuten gaan ze in fase 6 (de data stelen)."

🏆 Waarom is dit zo goed?

De onderzoekers hebben StageFinder getest tegen andere bekende systemen (zoals Cyberian en NetGuardian) met echte data van het Amerikaanse leger (DARPA).

  • Hoger scoren: StageFinder had een 96% kans om de juiste fase te raden. De anderen lagen rond de 90%. Dat klinkt als een klein verschil, maar in beveiliging betekent dat veel minder foutalarmen en minder gemiste dieven.
  • Minder paniek: Andere systemen schakelden vaak wild heen en weer: "Nu is het verkenning... wacht, nu is het diefstal... wacht, nu weer verkenning!" Dit noemen ze "volatiliteit". StageFinder is veel rustiger en stabieler. Het zegt niet elke seconde iets anders, maar volgt het verhaal logisch.
  • De "Tijdreis" werkt: De analyse toonde aan dat StageFinder echt begrijpt wanneer iets belangrijk is, in plaats van alleen te kijken naar losse pieken.

💡 De Kernboodschap

Vroeger keken beveiligingssystemen vaak naar losse puzzelstukjes en probeerden ze raadsels op te lossen zonder de randjes.
StageFinder doet alsof het de hele puzzel in elkaar heeft gezet en vervolgens de tijdslijn van de dieven bestudeert.

Door te kijken naar zowel wat er op de computers gebeurt als wat er in het netwerk gebeurt, en door die twee te combineren in één groot verhaal, kan StageFinder precies zeggen: "We zijn niet alleen aangevallen; we weten precies in welk stadium van de aanval we zitten, en we kunnen nu de juiste maatregelen nemen."

Het is de overgang van "Er is iets raars aan de hand" naar "We weten wie het is, wat ze doen, en wat ze als volgende gaan doen."