Interpretable Markov-Based Spatiotemporal Risk Surfaces for Missing-Child Search Planning with Reinforcement Learning and LLM-Based Quality Assurance

Dit paper introduceert Guardian, een interpreteerbaar besluitvormingssysteem dat Markov-ketens, versterkende leerling en LLM's combineert om dynamische zoekplannen voor vermiste kinderen te genereren op basis van ongestructureerde data.

Joshua Castillo, Ravi Mukkamala

Gepubliceerd Wed, 11 Ma
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je op zoek bent naar een verdwenen kind. De eerste 72 uur zijn cruciaal; elke minuut telt. Maar vaak hebben de rechercheurs te maken met een wirwar van losse stukjes papier, onduidelijke getuigenverklaringen en een enorme hoeveelheid informatie die niet direct te gebruiken is. Ze moeten een plan maken, maar weten niet precies waar het kind naartoe is gegaan.

Dit artikel introduceert Guardian, een slim digitaal assistent dat deze zoektocht helpt plannen. Het werkt als een drie-laags machine die een "risicokaart" maakt, zodat de zoekteams precies weten waar ze het eerst moeten kijken.

Hier is hoe Guardian werkt, uitgelegd in simpele termen:

1. De Vertaler (De Eerste Laag: Het Markov-model)

Stel je voor dat je een verdwaalde hond hebt. Je weet waar hij laatst gezien is. Maar waar gaat hij naartoe?
Guardian begint met een Markov-model. Dit is als een heel slimme, voorspellende kompasnaald.

  • Hoe het werkt: Het systeem kijkt niet alleen naar de plek waar het kind verdween, maar ook naar de omgeving. Kan het kind makkelijk over een snelweg lopen? Is er een bos waar het zich kan verstoppen? Is het dag of nacht?
  • De Analogie: Denk aan water dat uit een emmer stroomt. De emmer is de plek waar het kind verdween. Het water stroomt niet zomaar overal even snel naartoe. Het stroomt sneller over gladde wegen (snelwegen) en langzamer door struikgewas. 's Nachts stroomt het water misschien anders dan overdag (want mensen gedragen zich anders in het donker).
  • Het resultaat: Na 24, 48 en 72 uur heeft dit model een kaart gemaakt met kleuren. Rood betekent: "Hier is de kans het grootst dat het kind is." Blauw betekent: "Hier is de kans klein." Dit is de voorspelling.

2. De Strategist (De Tweede Laag: Reinforcement Learning)

Nu hebben we een kaart met rode plekken, maar de politie heeft niet genoeg mensen om overal tegelijk te zoeken. Ze moeten kiezen: "Waar zetten we onze zoekhonden in?"

  • Hoe het werkt: De tweede laag is een Reinforcement Learning-model (een AI die leert door te proberen). Dit is de strateeg. Hij kijkt naar de rode kaart van de eerste laag en bedenkt het beste plan.
  • De Analogie: Stel je voor dat je een spelletje Tetris speelt, maar dan met zoekgebieden. Je hebt een beperkt aantal puzzelstukken (zoekteams) en je moet ze zo leggen dat je de meeste rode plekken op de kaart bedekt, zonder dat de stukken elkaar overlappen. De AI probeert duizenden combinaties om het plan te vinden dat de meeste kans van slagen biedt in de kortst mogelijke tijd.
  • Het resultaat: Een lijst met prioriteiten: "Kijk eerst hier, dan daar, en zorg dat je binnen een straal van X kilometer bent."

3. De Controleur (De Derde Laag: LLM Kwaliteitscontrole)

Soms kan een computer een plan bedenken dat wiskundig perfect is, maar in de echte wereld belachelijk klinkt. Bijvoorbeeld: "Het plan zegt dat we moeten zoeken in een meer, terwijl het kind op een fiets is gezien."

  • Hoe het werkt: De derde laag is een LLM (een taalmodel, zoals een slimme chatbot). Deze leest het plan van de strateeg en de originele getuigenverklaringen.
  • De Analogie: Dit is als een ervaren rechercheur die het plan voor de laatste keer doorneemt. Hij zegt: "Wacht even, dit plan is slim, maar het klopt niet met wat de buurman zei. Het kind had geen fiets, dus die route langs de snelweg is onwaarschijnlijk." De AI past de prioriteiten dan iets aan om het plan realistischer te maken.
  • Het resultaat: Een veilig, gecontroleerd plan dat zowel slim als logisch is.

Waarom is dit belangrijk?

In het verleden moesten rechercheurs handmatig alle papieren lezen en zelf een plan schetsen. Dat kostte tijd en energie. Guardian doet dit in een handomdraai:

  1. Het leest de saaie rapporten.
  2. Het maakt een voorspellende kaart (waar is het kind waarschijnlijk?).
  3. Het bedenkt het beste zoekplan.
  4. Het laat een "digitale rechercheur" controleren of het plan klopt.

De conclusie: Guardian vervangt niet de mensen. Het is een hulpmiddel dat de mensen helpt om sneller en slimmer te beslissen. Het zorgt ervoor dat in die kritieke eerste 72 uur geen enkele minuut verloren gaat aan het uitzoeken van waar ze moeten zoeken, zodat ze zich kunnen focussen op het vinden van het kind.

Het systeem is getest met een nep-geval (om privacy te beschermen) en liet zien dat het de zoekgebieden heel goed kon voorspellen, vooral door rekening te houden met wegen, bossen en het tijdstip van de dag.