Causal Structure Learning in Hawkes Processes with Complex Latent Confounder Networks

Deze paper introduceert een tweefasig iteratief algoritme dat, gebaseerd op een discretisatie van continue Hawkes-processen, effectief causale structuren herkent in systemen met complexe latente verstorende netwerken door zowel waargenomen als niet-waargenomen subprocessen te identificeren.

Songyao Jin, Biwei Huang

Gepubliceerd 2026-03-03
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een enorme, drukke verkeersknooppunt observeert. Je ziet auto's (gebeurtenissen) die van de ene weg naar de andere springen. Soms veroorzaakt een file op weg A een file op weg B. Dit is een Hawkes-proces: een wiskundig model dat beschrijft hoe gebeurtenissen in de tijd elkaar opwekken, zoals een dominosteen die de volgende doet vallen.

Het probleem is echter dat we niet alles zien. In de echte wereld zijn er vaak "spookauto's" of onzichtbare verkeersregelaars die we niet kunnen meten, maar die wel invloed hebben op het verkeer. In de wetenschap noemen we dit latente verstorende factoren (latent confounders).

Deze paper, geschreven door Songyao Jin en Biwei Huang, lost een groot mysterie op: Hoe kun je de ware oorzaak-gevolg-relaties vinden als je niet alle stukjes van de puzzel ziet?

Hier is de uitleg in simpele taal, met een paar creatieve metaforen:

1. Het Probleem: De Onzichtbare Regisseur

Stel je voor dat je een toneelstuk bekijkt, maar je zit in de zaal en ziet alleen de acteurs op het toneel. Je ziet acteur A huilen, en even later begint acteur B te schreeuwen.

  • De oude manier: De meeste wetenschappers zouden zeggen: "A heeft B gemaakt schreeuwen!" (Oorzaak: A, Gevolg: B).
  • De realiteit: Er zit misschien een onzichtbare regisseur in de coulissen die eerst A een duw gaf en toen B een duw gaf. A en B hebben niets met elkaar te maken, maar ze lijken wel verbonden omdat ze beiden door die onzichtbare regisseur worden aangestuurd.

Als je die regisseur niet ziet, trek je de verkeerde conclusies. De meeste bestaande methodes gaan er ten onrechte van uit dat je alles ziet. Deze paper zegt: "Nee, laten we aannemen dat er onzichtbare regisseurs zijn, en laten we bewijzen dat we ze toch kunnen vinden."

2. De Oplossing: Van Vloeibaar Water naar Blokken

Hawkes-processen werken in continu tijd (zoals een stromende rivier). Dat is lastig om te analyseren als er onzichtbare factoren zijn.
De auteurs hebben een slimme truc bedacht: ze snijden de rivier op in kleine, discrete blokjes (zoals blokken ijs).

  • De Metafoor: Stel je voor dat je een film hebt. In plaats van naar de vloeiende beweging te kijken, kijken we naar individuele frames. Als je de frames snel genoeg achter elkaar zet, zie je de beweging.
  • De Wiskundige Doorbraak: Ze bewijzen dat als je deze blokjes (tijdsintervallen) klein genoeg maakt, het complexe, continue gedrag van de gebeurtenissen zich laat vertalen naar een simpel lineair model. Dit is alsof je een ingewikkeld dansje kunt beschrijven als een simpele rij van stappen: "Stap 1, Stap 2, Stap 3".

3. De Detectie: Het "Rank"-Spel (De Drukke Kerk)

Hoe vinden ze nu die onzichtbare regisseur? Ze gebruiken een wiskundig concept dat "rang" (rank) heet, maar laten we het vergelijken met een drukke kerk.

Stel je voor dat je luistert naar wat mensen zeggen in een kerk:

  • Als er twee mensen praten en ze zeggen precies hetzelfde, is dat verdacht.
  • Als er een onzichtbare predikant is die aan beide mensen fluistert wat ze moeten zeggen, dan zullen hun stemmen perfect op elkaar lijken.

De auteurs kijken naar de correlaties (hoeveel lijken de signalen op elkaar) tussen de gebeurtenissen.

  • Zichtbare oorzaak: Als A B veroorzaakt, zie je een duidelijk patroon.
  • Onzichtbare oorzaak: Als een onzichtbare factor L zowel A als B beïnvloedt, dan ontstaat er een specifiek, herkenbaar patroon in de data. Het is alsof de "ruis" van A en B perfect op elkaar afgestemd is door die ene onzichtbare bron.

Ze hebben bewezen dat je dit patroon kunt herkennen door te kijken naar de dimensie van de data. Als de data "te strak" op elkaar lijkt (een lage rang), dan is er waarschijnlijk een onzichtbare factor die alles regelt. Ze noemen dit een "rank-deficiency".

4. Het Algorithm: Twee Fasen van Detectie

De auteurs hebben een algoritme bedacht dat werkt als een speurtocht in twee fasen:

  • Fase 1: De Bekende Verdachten: Eerst kijken ze naar de mensen die ze wel kunnen zien. Ze proberen uit te zoeken wie wie beïnvloedt. Als ze een patroon vinden dat logisch is, noteren ze dat.
  • Fase 2: De Onzichtbare Regisseurs: Als ze merken dat er nog steeds patronen zijn die ze niet kunnen verklaren met de zichtbare mensen, zeggen ze: "Aha! Er moet een onzichtbare regisseur zijn!" Ze gebruiken de wiskundige "rank-test" om te zeggen: "Er is hier een onzichtbare factor die deze twee groepen beïnvloedt."
  • De Cyclus: Zodra ze een onzichtbare factor hebben "ontdekt" (in feite een nieuwe variabele in hun model), gaan ze terug naar Fase 1. Nu kunnen ze kijken of deze nieuwe "onzichtbare" factor weer andere dingen beïnvloedt. Ze wisselen steeds tussen het vinden van nieuwe schuldigen en het oplossen van de puzzel.

5. De Resultaten: Van Theorie naar Werk

Ze hebben dit getest op twee manieren:

  1. Gemaakte data: Ze hebben computersimulaties gemaakt waar ze precies wisten wie de onzichtbare regisseurs waren. Hun methode vond ze bijna altijd.
  2. Echte data: Ze hebben gekeken naar een dataset van een mobielnetwerk (waar alarmen afgaan). Ze wisten dat er een bepaald type alarm (Alarm 7) niet direct zichtbaar was in hun selectie, maar wel invloed had op andere alarmen. Hun methode slaagde erin om dit "spookalarm" te vinden en de juiste oorzaak-gevolg-relaties te tekenen, terwijl andere methodes faalden.

Samenvatting in één zin

Deze paper leert ons hoe we de "onzichtbare regisseurs" in een chaotisch systeem kunnen vinden door de tijd op te splitsen in blokjes en te kijken naar de specifieke patronen in de data die alleen ontstaan als er een onzichtbare kracht aan het werk is.

Het is alsof je een detective bent die niet alleen kijkt naar wie er op het toneel staat, maar ook naar de schaduwen in de hoek, om te begrijpen wie de echte regisseur van het toneelstuk is.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →