LEXA: Legal Case Retrieval via Graph Contrastive Learning with Contextualised LLM Embeddings

Each language version is independently generated for its own context, not a direct translation.

LEXA: De Slimme Juridische Rechercheur

Stel je voor dat je een advocaat bent. Je hebt een nieuwe zaak en moet snel zoeken in een enorme bibliotheek met miljoenen oude rechtszaken om te zien of er eerdere gevallen zijn die op jouw situatie lijken. Dit heet Legal Case Retrieval (het terugvinden van juridische zaken). Vroeger deden computers dit door simpelweg te kijken of woorden als "dief" of "stelen" in beide teksten voorkwamen. Dat werkt vaak niet goed, omdat twee zaken dezelfde woorden kunnen hebben, maar totaal verschillende juridische problemen beschrijven.

De auteurs van dit paper hebben een nieuw systeem bedacht, genaamd LEXA, dat veel slimmer is. Hier is hoe het werkt, vertaald naar alledaagse taal:

1. Het Probleem: Woorden zijn niet genoeg

Stel je voor dat je een zoektocht doet in een stad.

De oude methode (zoals BM25 of simpele taalmodellen) kijkt alleen naar de naam van de straten. Als je zoekt naar "Hoofdstraat", vindt het alle straten met die naam, maar het ziet niet dat één straat een drukke winkelstraat is en de andere een rustige woonstraat.
De vorige versie (CaseGNN) probeerde een kaart te maken van de stad. Het zag dat huizen (mensen) verbonden waren via wegen (relaties). Maar deze kaart was nog niet perfect: de wegen zelf werden niet bijgewerkt, en de kaart was gebaseerd op een beetje verouderde kennis.

2. De Oplossing: LEXA (De Super-Advocaat)

LEXA is de volgende stap. Het combineert drie krachtige ingrediënten om de perfecte juridische kaart te maken:

A. De "Levende Wegen" (EUGAT)

In een juridische zaak zijn de relaties tussen mensen (bijv. "verdachte", "slachtoffer", "getuige") heel belangrijk.

De oude manier: De wegen op de kaart waren statisch. Ze veranderden niet, zelfs niet als je meer over de huizen leerde.
LEXA's manier: LEXA gebruikt een speciale techniek (EUGAT) waarbij de wegen zelf ook leren. Stel je voor dat de wegen op je kaart dynamisch van kleur veranderen naarmate je meer over de huizen weet. Als je merkt dat een bepaalde verbinding tussen twee mensen heel belangrijk is voor de uitspraak, wordt die "weg" op de kaart dikker en helderder. Hierdoor ziet het systeem de echte structuur van de zaak veel beter.

B. De "Oefenpuzzels" (Graph Contrastive Learning)

Om een slimme AI te trainen, moet je haar veel oefenen. Maar in de juridische wereld zijn er weinig goede oefenexamens (gelabelde data), omdat juristen kostbaar zijn en het veel tijd kost om zaken te labelen.

De truc: LEXA maakt zelf extra oefenmateriaal. Het neemt een goede zaak en knipt er een stukje van af (zoals een weg verwijderen) of verwisselt een paar details. Vervolgens vraagt het de AI: "Is deze geknipte versie nog steeds dezelfde zaak als het origineel, of is het een heel andere zaak?"
Door dit duizenden keren te doen, leert de AI de essentie van een zaak te begrijpen, zelfs als er details ontbreken. Het is alsof je iemand leert een gezicht herkennen, zelfs als de persoon een bril opzet of een hoed draagt.

C. De "Super-Vertaler" (LLM Embeddings)

Juridische taal is moeilijk en vol nuances. Een simpele computer begrijpt niet het verschil tussen "vermoedelijk" en "bewezen".

De oplossing: LEXA gebruikt een zeer slimme taalcomputer (een Large Language Model, specifiek een aangepaste versie van Qwen3). Deze computer fungeert als een super-vertaler.
In plaats van alleen woorden te tellen, leest deze vertaler de hele tekst en begrijpt de context. Hij vertaalt de complexe juridische feiten en problemen naar een soort "gevoelscode" (embeddings) die de AI perfect begrijpt. Hij zegt niet alleen "dit is een diefstal", maar "dit is een diefstal waarbij de verdachte dacht dat hij het recht had, wat cruciaal is voor de straf."

3. Het Resultaat

Wanneer LEXA een nieuwe zaak krijgt, doet hij het volgende:

Hij leest de tekst met zijn Super-Vertaler om de diepere betekenis te snappen.
Hij tekent een dynamische kaart van de zaak, waarbij de wegen (relaties) continu worden bijgewerkt.
Hij vergelijkt deze kaart met duizenden andere kaarten in zijn geheugen, gebruikmakend van zijn oefenpuzzels om de meest vergelijkbare zaken te vinden.

Conclusie:
In tests (op de COLIEE 2022 en 2023 wedstrijden) bleek LEXA veel beter te zijn dan alle andere methoden. Het is alsof je een beginnende rechercheur vervangt door een ervaren detective die niet alleen kijkt naar wat er op papier staat, maar ook begrijpt hoe de mensen in de zaak met elkaar verbonden zijn en wat de echte bedoeling van de tekst was.

Kortom: LEXA maakt juridisch zoeken sneller, nauwkeuriger en slimmer, zodat advocaten en burgers sneller de juiste antwoorden vinden.

LEXA: Legal Case Retrieval via Graph Contrastive Learning with Contextualised LLM Embeddings

1. Het Probleem: Woorden zijn niet genoeg

2. De Oplossing: LEXA (De Super-Advocaat)

A. De "Levende Wegen" (EUGAT)

B. De "Oefenpuzzels" (Graph Contrastive Learning)

C. De "Super-Vertaler" (LLM Embeddings)

3. Het Resultaat

Probleemstelling

Methodologie: Het LEXA Framework

Belangrijkste Bijdragen

Resultaten

Betekenis en Conclusie

LEXA: Legal Case Retrieval via Graph Contrastive Learning with Contextualised LLM Embeddings

1. Het Probleem: Woorden zijn niet genoeg

2. De Oplossing: LEXA (De Super-Advocaat)

A. De "Levende Wegen" (EUGAT)

B. De "Oefenpuzzels" (Graph Contrastive Learning)

C. De "Super-Vertaler" (LLM Embeddings)

3. Het Resultaat

Probleemstelling

Methodologie: Het LEXA Framework

Belangrijkste Bijdragen

Resultaten

Betekenis en Conclusie

Meer zoals dit

Keep Ballots Secret: On the Futility of Social Learning in Decision Making by Voting

Social Teaching: Being Informative vs. Being Right in Sequential Decision Making

Beyond Binomial and Negative Binomial: Adaptation in Bernoulli Parameter Estimation

Homotopy type theory as a language for diagrams of ∞\infty∞-logoses

One is all you need: Second-order Unification without First-order Variables

Homotopy type theory as a language for diagrams of $\infty$ -logoses