Towards Trustworthy Legal AI through LLM Agents and Formal Reasoning

Dit paper introduceert L4L, een framework dat LLM-agenten combineert met SMT-gebaseerde verificatie om juridische redenering formeel af te stemmen op wetgeving en zo verifieerbare en betrouwbare juridische AI mogelijk te maken.

Linze Chen, Yufan Cai, Zhe Hou, Jin Song Dong

Gepubliceerd 2026-03-06
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een rechter bent in een heel complexe rechtszaak. Je moet beslissen of iemand schuldig is en wat de straf moet zijn. In het echte leven doe je dit door de wetboeken te lezen, te kijken naar wat er precies is gebeurd, en te luisteren naar zowel de aanklager als de verdediging.

Nu proberen computers (kunstmatige intelligentie) dit ook te doen. Maar tot nu toe waren deze computers als een slimme, maar dromerige student. Ze kunnen prachtige verhalen vertellen en lijken alles te begrijpen, maar ze verzinnen soms feiten, verwarren wetten met elkaar, en kunnen niet bewijzen waarom ze tot een bepaalde conclusie komen. Ze zeggen: "Ik denk dat dit strafbaar is," maar kunnen niet laten zien hoe ze daar bij zijn gekomen.

De auteurs van dit paper hebben een nieuwe manier bedacht, genaamd L4L. Ze willen een AI bouwen die niet alleen slim is, maar ook betrouwbaar en controleerbaar.

Hier is hoe ze dat doen, vertaald in een simpel verhaal:

1. De Bouwplaat van de Wet (Formalisering)

Stel je voor dat de wetboeken (zoals het Wetboek van Strafrecht) een enorme, ingewikkelde legpuzzel zijn in gewone taal. De AI moet deze puzzel eerst omzetten in een strikt bouwplaat met meetlatjes en schroeven.

  • In plaats van te lezen "het is verboden om veel drugs te vervoeren", zet de AI dit om in een wiskundige formule: Als gewicht > 20 gram EN type = MDMA, DAN = strafbaar.
  • Dit is als het vertalen van een recept in een taal die een robot kan begrijpen, zodat er geen twijfel mogelijk is over de hoeveelheden of voorwaarden.

2. Het Toneelstuk met Twee Spelers (De Agenten)

In een echte rechtzaal heb je een aanklager en een verdediger. Ze kijken naar hetzelfde verhaal, maar proberen het op hun eigen manier te interpreteren.

  • De Aanklager-AI probeert zo veel mogelijk feiten te vinden die de verdachte in de problemen brengen.
  • De Verdediger-AI probeert twijfels te zaaien en feiten te vinden die de verdachte vrijpleiten.
  • Ze werken onafhankelijk van elkaar. Dit voorkomt dat de AI in één kant van het verhaal vastloopt. Het is alsof je twee detectives hebt die elk hun eigen dossier maken.

3. De Rekenmachine die Altijd Wint (De Oplosser)

Dit is het belangrijkste deel. Na dat de twee AI's hun dossiers hebben gemaakt, gooien ze alles in een super-rekenmachine (een zogenaamde SMT-oplosser).

  • Deze rekenmachine is niet slim in de zin van "verhalen vertellen", maar hij is onfeilbaar in logica.
  • Hij kijkt naar de bouwplaat (de wet) en de dossiers (de feiten) en zegt: "Dit klopt wiskundig niet" of "Dit is wiskundig bewezen".
  • Als de rekenmachine zegt dat een bepaalde wet niet van toepassing is, dan is dat zo. Geen discussie, geen "misschien". Het is als een keurslager die controleert of een deur precies 2 meter breed is; als hij 1,99 meter is, past hij niet.

4. De Rechter die het Verhaal Vertelt (De Uitspraak)

Nu hebben we een wiskundig bewezen feit, maar mensen willen een verhaal lezen.

  • Een Rechter-AI neemt de harde, wiskundige resultaten van de rekenmachine en schrijft daar een menselijk, begrijpelijk vonnis over.
  • Deze rechter kijkt ook naar eerdere vergelijkbare zaken (precedenten) om de straf te verfijnen, maar altijd binnen de grenzen die de rekenmachine heeft vastgesteld.
  • Het resultaat is een vonnis dat klinkt als een menselijke rechter, maar dat stevig verankerd is in onweerlegbare logica.

Waarom is dit zo cool?

Stel je voor dat je een brug bouwt.

  • De oude AI's waren als een architect die een prachtige brug tekende op papier, maar die soms dacht dat de brug zou staan terwijl hij eigenlijk zou instorten.
  • L4L is als een architect die eerst een computermodel gebruikt om te berekenen of de brug wiskundig kan staan. Pas als de computer zegt "Ja, dit is veilig", tekent de architect het mooie plaatje voor de mensen.

De voordelen:

  1. Geen hallucinaties: De AI kan niet zomaar een wet verzinnen die niet bestaat.
  2. Controleerbaar: Je kunt precies zien welke logische stappen de AI heeft genomen. Het is als een audit-spoor.
  3. Betrouwbaar: Omdat de harde logica de "rechter" is, zijn de uitspraken eerlijker en consistenter.

Kortom: L4L combineert de creativiteit en taalvaardigheid van een moderne computer met de strenge, onwrikbare logica van een wiskundige formule. Het zorgt ervoor dat AI in de rechtbank niet alleen slim klinkt, maar ook wiskundig correct is.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →