Each language version is independently generated for its own context, not a direct translation.
Stel je voor dat de Senegalese wetgeving een gigantische, oude bibliotheek is. Deze bibliotheek zit vol met duizenden boeken (wetten, decreten, regelingen), maar ze liggen in een enorme chaos. De boeken zijn in het Frans geschreven, vol met verwijzingen naar andere boeken, en sommige pagina's zijn zelfs verbleekt of in de vorm van oude foto's. Voor een gewone burger of zelfs een advocaat is het bijna onmogelijk om te vinden wat je precies moet doen als je een stuk land wilt kopen of een vergunning nodig hebt.
Dit onderzoek is als het bouwen van een super-intelligente bibliothecaris die deze hele chaos oplost. Hier is hoe ze dat gedaan hebben, vertaald naar alledaags taal:
1. Het Grote Schraapwerk (De Data)
Eerst moesten ze alle tekst uit de boeken halen. De onderzoekers hebben een slim computerprogramma geschreven dat als een digitale stofzuiger door 20 verschillende wetboeken is gegaan. Ze hebben 7.967 artikelen (de kleine regels binnen de wetten) eruit gehaald.
- De analogie: Het is alsof je een hele berg losse puzzelstukjes verzamelt. De meeste stukjes kwamen uit het "Land- en Openbaar Domein" boek, omdat dat zo'n ingewikkeld onderwerp is.
2. De Digitale Spinnenweb (De Kennisgrafiek)
Gewone databases zijn als lijsten in een Excel-blad: rijen en kolommen. Maar wetten zijn geen lijsten; ze zijn een web van verbindingen. Een wet verwijst naar een decreet, dat weer verwijst naar een artikel, dat weer verwijst naar een ministerieel besluit.
Om dit te visualiseren, bouwden ze een digitale spinnenweb (een zogenaamde "Knowledge Graph" in Neo4j).
- De analogie: Denk aan een gigantisch stadsplan. In plaats van alleen straten te hebben, zie je ook de gebouwen, de bussen die er rijden, en wie de eigenaar is.
- Ze hebben 2.872 knooppunten (zoals "Wet", "Decreet", "Persoon") en 10.774 lijnen (de verbindingen tussen ze) gemaakt.
- Nu kun je zien: "Als ik dit artikel lees, welke andere regels raken hieraan?" Het is alsof je een Google Maps hebt voor de wet, waar je kunt zien hoe alles met elkaar verbonden is.
3. De Slimme Vertalers (De AI en LLM's)
Nu hadden ze de tekst en de kaart, maar ze moesten de betekenis van de zinnen begrijpen. Hiervoor gebruikten ze Grote Taalmodellen (LLM's), zoals de slimme AI's GPT-4o en Mistral-Large.
- De analogie: Stel je voor dat je een groep zeer intelligente studenten (de AI's) voorlegt: "Lees dit moeilijke juridische stuk en vertel me in drie simpele zinnen wie wat doet."
- Ze noemen dit het extraheren van "kennis-drievoud" (triplets): Onderwerp - Werkwoord - Object. Bijvoorbeeld: "Artikel 5" - "verwijst naar" - "Decreet 2020".
- Ze testten verschillende AI's om te zien wie de beste "student" was. De winnaar? GPT-4o. Deze kon de verborgen verbanden het snelst en nauwkeurigst vinden, net als een detective die de kleine details ziet die anderen missen.
4. Waarom is dit belangrijk?
Vroeger moest je als burger door de bossen van de wetten lopen en hopen dat je niet verdwaalde. Met dit nieuwe systeem:
- Transparantie: Iedereen kan zien hoe de regels met elkaar verbonden zijn.
- Toegang: Mensen kunnen hun rechten en plichten sneller begrijpen.
- Toekomst: Het is de basis voor een slimme juridische assistent. Stel je een app voor waar je kunt vragen: "Mag ik mijn huis verhuren?" en de app, gebaseerd op dit web van wetten, je direct het juiste antwoord geeft, zonder dat je zelf door de wetboeken hoeft te bladeren.
Samenvattend
De onderzoekers hebben een digitale schatkaart gemaakt van de Senegalese wetten. Ze hebben duizenden regels opgehaald, ze in een slim netwerk gezet en de slimste AI's gebruikt om de verborgen verbanden te ontrafelen. Het doel is simpel: zorgen dat de wet niet langer een gesloten club is voor experts, maar iets waar iedereen toegang toe heeft en dat begrijpelijk is. Het is een stap in de richting van een eerlijker en transparantere rechtstaat.