Bridging National and International Legal Data: Two Projects Based on the Japanese Legal Standard XML Schema for Comparative Law Studies

Dit artikel presenteert een geïntegreerd kader voor computationeel vergelijkend recht dat de Japanse wettelijke XML-standaard koppelt aan internationale normen via conversie naar Akoma Ntoso en het gebruik van meertalige embeddings om juridische bepalingen over jurisdicties heen te identificeren en te visualiseren.

Makoto Nakamura

Gepubliceerd 2026-03-17
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat de wetten van de wereld een enorme bibliotheek zijn, maar dan met een groot probleem: elke land heeft zijn eigen soort boeken, geschreven in een andere taal, met een heel andere indeling en zelfs verschillende soorten kaft.

Als je als onderzoeker wilt weten hoe Nederland omgaat met 'huurcontracten' en hoe dat vergeleken kan worden met Japan, Duitsland of Frankrijk, moet je eerst alle boeken van die landen in elkaar kunnen lezen. Dat is heel lastig. Een Japanse wet staat misschien in een boekje met 100 pagina's, terwijl de Duitse versie in een dikke atlas van 500 pagina's staat, en ze gebruiken totaal andere woorden voor hetzelfde idee.

Dit artikel van Makoto Nakamura vertelt over twee projecten die samen een super-reisgids bouwen voor deze wereldwijde wettenbibliotheek. Ze doen dit in twee stappen:

Stap 1: Het uniform maken van de boeken (Project 1)

Stel je voor dat de Japanse wetboeken zijn geschreven in een heel specifiek formaat (de "JLS"-standaard). De rest van de wereld gebruikt echter een ander formaat (de "Akoma Ntoso" of AKN-standaard), dat wordt gebruikt door veel landen in Europa en daarbuiten. Het is alsof de Japanse boeken in vierkante dozen zitten, terwijl de internationale bibliotheek alleen ronde dozen accepteert. Je kunt ze niet zomaar op hetzelfde plankje leggen.

Het eerste project is als een slimme machine die alle Japanse vierkante dozen in ronde dozen verandert, zonder de inhoud van de boeken aan te raken.

  • Wat doen ze? Ze bouwen een computerprogramma dat de Japanse wetten "vertaalt" naar een internationaal standaardformaat.
  • Het resultaat: De Japanse wetten passen nu perfect in dezelfde kast als de wetten van andere landen. Ze hebben dezelfde structuur, dezelfde nummers en dezelfde metadata. Nu kunnen computers de Japanse wetten eindelijk "lezen" en vergelijken met die van anderen, omdat ze allemaal in hetzelfde formaat zitten.

Stap 2: Het vinden van de "tweeling" in de boeken (Project 2)

Nu de boeken allemaal in hetzelfde formaat zitten, is het tijd om te kijken naar de inhoud. Maar hier komt de taalproblematiek weer om de hoek kijken. Zelfs als de structuur hetzelfde is, zeggen een Japanse en een Franse wet misschien iets anders, of gebruiken ze heel andere woorden voor hetzelfde concept.

Het tweede project is als het bouwen van een slimme, meertalige zoekmachine die niet alleen zoekt op woorden, maar op betekenis.

  • De slimme truc: Ze gebruiken een soort "AI-brein" (gebaseerd op technologie zoals BERT) dat is getraind om de gevoelswaarde van een zin te begrijpen, ongeacht de taal. Het is alsof je een vertaler hebt die niet alleen woorden omzet, maar ook begrijpt dat "een hond mag niet blaffen" in het Nederlands en "un chien ne doit pas aboyer" in het Frans precies hetzelfde idee uitdrukken, zelfs als de woorden anders zijn.
  • Hoe werkt het?
    1. De computer leest elke wetartikel en maakt er een "digitale vingerafdruk" van (een vector).
    2. Vervolgens zoekt hij in de database van andere landen naar vingerafdrukken die er heel veel op lijken.
    3. Om zeker te zijn dat het geen toeval is, gebruikt hij een tweede, nog slimmere AI (een "Cross-Encoder") om de beste matches te controleren en te rangschikken.
    4. Uiteindelijk krijg je een netwerkkaart (een soort web van lijntjes) die laat zien welke Japanse wetten het meest lijken op welke Koreaanse of Franse wetten.

Waarom is dit belangrijk?

Vroeger moest je een expert zijn die meerdere talen vloeiend sprak en jarenlang in de bibliotheek zat om te zoeken naar vergelijkbare wetten. Dat was traag, duur en afhankelijk van de mening van één persoon.

Met dit nieuwe systeem kunnen we:

  • Schaalbaar onderzoek doen: In plaats van één artikel te vergelijken, kan de computer duizenden artikelen in één keer scannen.
  • Patronen zien: Je kunt plotseling zien dat drie landen op een heel specifiek punt in hun wetgeving heel erg op elkaar lijken, of juist heel verschillend zijn.
  • Nieuwe inzichten: De computer kan misschien koppelingen vinden die een mens over het hoofd zou zien, omdat hij niet wordt beperkt door vooroordelen of taalbarrières.

Conclusie

Kortom, dit onderzoek bouwt de fundering voor een wereldwijde, digitale wettenbibliotheek.

  1. Eerst zorgen ze dat alle boeken in dezelfde kast passen (structuur).
  2. Dan bouwen ze een slimme gids die de inhoud van die boeken met elkaar vergelijkt, ongeacht de taal (betekenis).

Het is nog een prototype (een werkend model, maar niet nog niet perfect), maar het laat zien dat we in de toekomst wetten niet meer alleen met de hand hoeven te vergelijken, maar dat we een krachtige, datagedreven manier hebben om de wereldwijde rechtspraak te begrijpen. Het is alsof we van een handgeschreven kaart zijn gegaan naar een interactieve Google Maps voor de wetten van de wereld.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →