Maintaining Leiden Communities in Large Dynamic Graphs

Dit paper introduceert HIT-Leiden, een nieuw algoritme voor het efficiënt bijwerken van Leiden-gemeenschappen in grote dynamische grafen dat, in tegenstelling tot bestaande methoden, de benodigde rekentijd voor kleine updates drastisch verlaagt en snelheidsverbeteringen tot vijf ordes van grootte bereikt zonder in te leveren op de kwaliteit.

Chunxu Lin, Yumao Xie, Yixiang Fang, Yongmin Hu, Yingqian Hu, Chen Cheng

Gepubliceerd 2026-03-05
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een enorme, levende stad hebt. In deze stad wonen miljarden mensen (de punten of nodes) die allemaal met elkaar verbonden zijn door wegen (de lijnen of edges). Soms ontmoeten mensen elkaar, soms verhuizen ze, en soms stoppen ze met praten.

In de wereld van grote bedrijven, zoals ByteDance (de maker van TikTok en Douyin), is deze stad hun hele bedrijf. Ze moeten begrijpen wie bij welke groep hoort: wie zijn vrienden, wie zijn collega's, en wie vormen een gevaarlijke bende die fraude pleegt?

Dit noemen we gemeenschapsdetectie. Een populaire manier om deze groepen te vinden is met een algoritme genaamd Leiden. Het is als een slimme burgemeester die de stad in wijken indeelt, zodat buren die veel met elkaar praten in dezelfde wijk zitten.

Het Probleem: De Stad Verandert Constant

Het probleem is dat deze stad nooit stilstaat. Elke seconde worden er nieuwe wegen aangelegd of verwijderd.

  • De oude manier: Als er één straatje verandert, gooide de oude software de hele kaart weg en begon hij opnieuw vanaf nul om de hele stad in te delen. Dit is alsof je, omdat er één nieuw huisje is gebouwd, de hele stad platbrandt en opnieuw bouwt. Het duurt uren, terwijl de gegevens al weer verouderd zijn.
  • De eerdere "slimme" manier: Er waren al methodes die probeerden alleen het veranderde stukje te bekijken. Maar de auteurs van dit paper ontdekten dat deze methodes vaak toch te veel werk deden. Het leek alsof ze dachten dat één nieuw huisje de hele stad in chaos zou brengen, waardoor ze toch bijna alles opnieuw berekenden.

De Oplossing: HIT-Leiden (De Slimme Wijkverzorger)

De auteurs, onderzoekers van de Chinese universiteit CUHK-Shenzhen en ByteDance, hebben een nieuwe methode bedacht: HIT-Leiden.

Stel je voor dat HIT-Leiden geen burgemeester is die alles opnieuw doet, maar een slimme wijkverzorger die een hiërarchisch systeem gebruikt.

  1. De Boomstructuur (Hiërarchie):
    De stad is niet alleen een platte kaart. Het is als een boom.

    • Op de bodem zitten de individuele mensen.
    • Boven hen zitten kleine groepjes (sub-gemeenschappen).
    • Boven die groepjes zitten grotere wijken.
    • Boven die wijken zit de hele stad.
      De oude methodes keken alleen naar de mensen op de grond. HIT-Leiden kijkt naar de hele boom. Als er iets verandert op de grond, weet de verzorger precies welke takken en welke tak van de boom dat beïnvloedt, zonder de hele boom te hoeven schudden.
  2. De Drie Slimme Stappen:
    Wanneer er een verandering is (bijvoorbeeld: twee mensen worden vrienden), doet HIT-Leiden drie dingen:

    • Verplaatsen (Movement): Hij kijkt alleen naar de mensen die direct betrokken zijn bij de nieuwe weg. Zullen ze hun wijk moeten veranderen?
    • Opknappen (Refinement): Soms breekt een groepje door een verandering in tweeën. De verzorger zorgt ervoor dat de stukken weer logisch zijn en niet "los" van elkaar hangen. Hij gebruikt een slimme index (zoals een kaart van de straten) om snel te zien wie nog bij elkaar hoort.
    • Samenvoegen (Aggregation): Als een hele wijk verandert, past hij de kaart van de grotere stad aan. Hij berekent niet de hele stad opnieuw, maar alleen de lijnen tussen de wijken die echt veranderd zijn.

Waarom is dit geweldig?

De auteurs hebben dit getest op enorme datasets, waaronder de echte data van ByteDance.

  • Snelheid: HIT-Leiden is tot 100.000 keer sneller dan de beste bestaande methodes. Dat is als het verschil tussen het lopen van Amsterdam naar Parijs (de oude methode) en het vliegen met een supersonisch vliegtuig (HIT-Leiden).
  • Kwaliteit: Ondanks dat het zo snel is, zijn de groepen die het vindt net zo goed en logisch als die van de oude, trage methodes.
  • In de praktijk: ByteDance gebruikt dit nu al. Of het nu gaat om het vinden van fraudebendes (waarbij je snel moet ingrijpen) of om het aanbevelen van video's: de data is altijd vers, zonder dat het systeem vastloopt.

De Kernboodschap

Vroeger dachten we dat je bij elke kleine verandering in een groot netwerk bijna alles opnieuw moest doen. Dit paper laat zien dat je dat niet hoeft te doen. Door slim te kijken naar de structuur van de groepen (als een boom) en alleen de takken te repareren die echt nodig zijn, kun je een levende, veranderende stad in real-time bijhouden.

Het is de difference tussen een trage, zware machine die alles opnieuw smeedt, en een soepele, slimme robot die alleen de beschadigde schroefjes vastdraait.