Network Traffic Analysis with Process Mining: The UPSIDE Case Study

Dit artikel presenteert een procesmijningsmethode die netwerkbewegingen van online games zoals Clash Royale en Rocket League analyseert door onbewaakte toestandherkenning om interpreteerbare Petri-netten te genereren en het speltype met hoge nauwkeurigheid te classificeren.

Francesco Vitale, Paolo Palmiero, Massimiliano Rak, Nicola Mazzocca

Gepubliceerd Tue, 10 Ma
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat een online game-netwerk een enorm, drukke luchthaven is. Duizenden vliegtuigen (je data-pakketten) vliegen continu heen en weer tussen de passagiers (jouw telefoon of computer) en de bestemming (de game-server).

In het verleden keken experts naar deze luchthaven en probeerden ze te raden wat er aan de hand was door gewoon naar de vliegtuigen te kijken. Ze gebruikten complexe "zwarte doos" computers (kunstmatige intelligentie) die wel goed konden voorspellen of er een storm kwam, maar die niet konden uitleggen waarom. Het was alsof een robot zegt: "Er is gevaar," zonder te vertellen of het een storm is, een brand of een vogel die in de motor is gevlogen.

De auteurs van dit paper, Francesco, Massimiliano, Nicola en Paolo, hebben een nieuwe manier bedacht om deze luchthaven te begrijpen. Ze noemen hun methode "Process Mining". Laten we dit uitleggen met een paar simpele metaforen.

1. Het probleem: De chaos van de data

Wanneer je Clash Royale of Rocket League speelt, sturen je apparaat en de server duizenden kleine boodschappen naar elkaar. Dit is als een enorme stroom van brieven die door een postkantoor worden gegooid. De meeste brieven zien er hetzelfde uit, maar ze bevatten verschillende boodschappen: "Ik heb een kaart gespeeld" of "Ik heb een goal gescoord".

Het probleem is dat deze brieven door elkaar heen liggen (ze zijn "verweven") en er veel ruis in zit. Als je gewoon kijkt, zie je alleen een wirwar van papier.

2. De oplossing: De "Vormgever" (Process Mining)

De auteurs zeggen: "Laten we niet naar elke losse brief kijken, maar naar patronen."

Hun methode werkt in vier stappen, alsof je een detective bent die een verhaal reconstrueert:

  • Stap 1: De observatiepost. Ze kijken niet naar de hele luchthaven, maar naar specifieke vliegtuigen (jouw apparaat). Ze verzamelen alle data, maar zonder de game zelf te verstoren.
  • Stap 2: De blokken bouwen. Ze nemen de stroom van brieven en snijden ze in gelijke stukken (zoals blokken van LEGO). In elk blokje tellen ze hoeveel brieven er zijn, hoe groot ze zijn en welke "vlaggen" ze hebben (bijvoorbeeld: is het een bevestiging? Is het een nieuwe vraag?).
  • Stap 3: Het sorteren (De "Staten"). Dit is het slimste deel. Ze gebruiken een slimme manier om te groeperen. Ze zeggen: "Oké, als er in dit blokje veel kleine, snelle brieven zijn, noemen we dat Staat A. Als er grote, langzame brieven zijn, noemen we dat Staat B."
    • Ze doen dit zonder dat ze van tevoren weten welke game er gespeeld wordt. Ze laten de data zelf de groepen vormen.
  • Stap 4: De blauwdruk (Petri-netten). Nu hebben ze de groepen. Ze tekenen voor elke groep een blauwdruk (een Petri-net).
    • Metafoor: Stel je voor dat je een tekening maakt van hoe een speler normaal gesproken communiceert. Voor Clash Royale is de tekening misschien een snelle, ritmische dans (veel kleine stappen). Voor Rocket League is het een andere dans (grotere sprongen). Deze tekeningen zijn heel duidelijk en mensen kunnen ze lezen, in tegenstelling tot de onbegrijpelijke "zwarte doos".

3. Het experiment: De UPSIDE Case Study

Ze hebben dit getest tijdens een groot evenement genaamd UPSIDE. Ze hadden mensen die Clash Royale (een strategisch kaartspel) speelden en mensen die Rocket League (auto's die met een bal voetballen) speelden.

Ze vroegen zich af: "Kunnen we, puur op basis van het gedrag van de data, zien wie welke game speelt?"

De resultaten:

  • Het werkt! Ze konden de twee games heel goed van elkaar onderscheiden.
  • Het is begrijpelijk. Omdat ze blauwdrukken (Petri-netten) maakten, konden ze precies zien waarom het Clash Royale was. Bijvoorbeeld: "Ah, dit apparaat stuurt constant kleine bevestigingen, dat is typisch voor Clash Royale."
  • De balans: Ze ontdekten dat je de "blokken" (de data die je tegelijk bekijkt) niet te groot mag maken. Als je te veel data in één blok stopt, wordt het patroon vaag en onduidelijk (alsof je een hele dag van iemand probeert te samenvatten in één zin). Maar als je de blokken te klein maakt, zie je geen patroon. De perfecte balans gaf de beste resultaten.

Waarom is dit belangrijk?

Vroeger moesten we vertrouwen op ingewikkelde algoritmes die we niet konden uitleggen. Met deze methode kunnen we:

  1. Netwerkproblemen sneller oplossen: Als het gedrag van de "blauwdruk" niet meer klopt, weten we direct dat er iets mis is.
  2. Veiligheid: Als er een hacker probeert in te breken, ziet zijn "dans" er heel anders uit dan die van een normale speler. We kunnen hem dan direct herkennen.
  3. Betere games: Game-maatschappijen kunnen zien hoe hun servers reageren en de ervaring voor spelers verbeteren.

Kortom:
De auteurs hebben een manier bedacht om de chaotische stroom van internet-data van games om te zetten in duidelijke, leesbare kaarten. Het is alsof ze van een wirwar van kluwen garen een nette, opgerolde bundel maken, zodat je precies kunt zien welk garen bij welke game hoort. En het beste van alles? Iedereen kan de kaart lezen en begrijpen.