Computational Complexity of Alignments

Dit artikel onderzoekt de computationele complexiteit van het berekenen van alignments in procesmining en toont aan dat het probleem PSPACE-compleet is voor veilige Petri-netten, NP-compleet voor diverse subclasses zoals procesbomen en T-systemen, maar in P oplosbaar is voor levende, veilige S-systemen.

Christopher T. Schwanen, Wied Pakusa, Wil M. P. van der Aalst

Gepubliceerd 2026-03-06
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

De Complexiteit van het "Puzzelen" met Bedrijfsprocessen: Een Simpele Uitleg

Stel je voor dat je een gigantische, ingewikkelde legpuzzel hebt. De randstukken zijn de regels van een bedrijf (het procesmodel), en de losse stukjes die je op de grond hebt gevonden, zijn de feitelijke gebeurtenissen uit de dagelijkse praktijk (de event log of sporen).

Het doel van Process Mining is om te kijken of die losse stukjes precies in de rand passen. Soms passen ze perfect, maar vaak zijn er stukjes die niet kloppen: misschien is er een stap overgeslagen, of is er iets extra's gedaan. Om dit te meten, gebruiken experts een techniek die Alignments (uitlijningen) heet. Het is alsof je probeert de losse stukjes op de grond zo te herschikken, te verwijderen of toe te voegen, dat ze weer een compleet plaatje vormen met de rand.

Dit artikel van Christopher Schwanen, W. Pakusa en Wil van der Aalst onderzoekt een heel vervelende vraag: Hoe moeilijk is het om die perfecte puzzel te maken? Is het een simpele taak voor een computer, of is het een opdracht die zelfs de krachtigste supercomputers duizenden jaren kan kosten?

Hier is wat ze hebben ontdekt, vertaald naar alledaagse taal:

1. De "Onmogelijke" Puzzel (Veilige Petri-netten)

Stel je een heel complexe, veilige puzzel voor waar je op elk moment veel verschillende keuzes kunt maken. De auteurs tonen aan dat voor dit soort systemen het vinden van de perfecte uitlijning extreem moeilijk is.

  • De analogie: Het is alsof je in een doolhof loopt met duizenden vertakkingen, en je moet de kortste weg vinden terwijl je ook nog eens alle mogelijke routes tegelijkertijd moet checken.
  • Het resultaat: Voor deze complexe systemen is het probleem zo zwaar dat het waarschijnlijk nooit snel opgelost kan worden door een computer, tenzij we fundamentele regels van de wiskunde veranderen. Het is net zo moeilijk als het oplossen van een zeer ingewikkeld raadsel dat een computer in zijn geheugen moet houden.

2. De "Goed Georganiseerde" Puzzel (Levende, Beperkte Vrije-Keuze Systemen)

Vervolgens kijken ze naar systemen die beter georganiseerd zijn. Stel je een fabriek voor waar elke machine precies weet wat hij moet doen, en er geen rare, onverwachte blokkades zijn.

  • De analogie: Hier is het alsof je een puzzel hebt waarbij de stukjes wel veel zijn, maar ze passen altijd op een logische manier in elkaar. Je hoeft niet elke mogelijke route te checken, want je kunt slim schatten dat de oplossing niet oneindig lang zal zijn.
  • Het resultaat: Voor deze systemen is het probleem moeilijk, maar haalbaar. Een computer kan het oplossen, maar het kost wel tijd. Het is net als het oplossen van een Sudoku: het kost moeite, maar het is zeker mogelijk.

3. De "Simpele" Puzzel die Toch Moeilijk is (Procesbomen en T-systemen)

Je zou denken: "Als ik de regels heel simpel maak, zonder keuzes of met slechts één route, wordt het dan makkelijk?"

  • De verrassing: Nee! Zelfs bij heel simpele modellen, zoals een procesboom (een hiërarchische structuur van taken) of systemen zonder keuzes (T-systemen), blijft het probleem moeilijk.
  • De analogie: Stel je voor dat je een lange rij blokken hebt die je in een specifieke volgorde moet leggen. Maar er is een truc: je mag de blokken in willekeurige volgorde door elkaar heen schuiven (dit heet 'shuffle'). Zelfs als de regels simpel lijken, is het vinden van de juiste volgorde om een specifiek woord te vormen, een enorme uitdaging voor een computer. Het is alsof je moet raden welke van de miljarden mogelijke volgorde van letters het juiste woord vormt.

4. De Enige "Eenvoudige" Uitzondering (S-systemen met één token)

Er is één situatie waarin het echt makkelijk wordt.

  • De analogie: Stel je een trein voor die op een enkel spoor rijdt. Er is maar één trein (één "token" of muntje) en er zijn geen aftakkingen. De trein kan nooit vastlopen of ergens tegenaan rijden.
  • Het resultaat: Als het systeem zo simpel is (live, veilig en met slechts één muntje), dan kan een computer de uitlijning direct en snel vinden. Het is alsof je een trein volgt op een rechte lijn: er is geen twijfel, er zijn geen keuzes.

Waarom is dit belangrijk?

De auteurs zeggen eigenlijk: "Stop met proberen om een snelle oplossing te vinden voor ALLE bedrijfsprocessen."

  • Als je procescomplex is (veel keuzes, veel parallelle taken), moet je accepteren dat het berekenen van afwijkingen tijd kost.
  • Als je proces simpel is (zoals een simpele trein), dan is het snel.
  • Maar zelfs bij "simpele" modellen met parallelle taken (zoals mensen die tegelijkertijd werken), blijft het lastig.

Conclusie:
Deze studie is een waarschuwing en een gids. Het vertelt ons dat er geen "zilveren kogel" is die elk bedrijfsproces in een seconde perfect kan analyseren. We moeten kiezen voor de juiste modellen: als we snelheid willen, moeten we onze processen zo ontwerpen dat ze minder complex zijn (minder keuzes, minder parallelle taken). Als we complexe processen nodig hebben, moeten we rekenen op de tijd die het kost om ze te analyseren.

Kortom: Hoe meer vrijheid en keuzes in je proces, hoe moeilijker het is om te checken of het goed loopt.