Each language version is independently generated for its own context, not a direct translation.
Mawarith: De Digitale Erfgoedrekenaar voor Islamitisch Recht
Stel je voor dat je een enorme, ingewikkelde puzzel moet oplossen. Maar dit is geen gewone puzzel met stukjes die je in elkaar moet klikken; het is een juridische puzzel gebaseerd op eeuwenoude islamitische regels. Als iemand overlijdt, moet precies worden uitgerekend wie er erft en hoeveel. Dit heet Mawarith (erfrecht).
In dit onderzoek introduceren de auteurs MAWARITH, een nieuw hulpmiddel om te testen hoe goed kunstmatige intelligentie (AI) dit soort puzzels kan oplossen. Hier is hoe het werkt, vertaald naar alledaagse taal:
1. Het Probleem: AI is slim, maar niet altijd logisch
Grote taalmodellen (zoals de slimme chatbots die we vandaag de dag kennen) zijn geweldig in het schrijven van verhalen of het beantwoorden van algemene vragen. Maar als het gaat om stap-voor-stap logisch redeneren met strikte regels, raken ze vaak in de war.
Stel je voor dat je een AI vraagt: "Wie erft er van deze familie en hoeveel krijgen ze?"
Een menselijke jurist zou denken:
- Wie zijn er allemaal? (Kinderen, echtgenoot, ouders?)
- Wie mag er niet erfen omdat er iemand dichter bij staat? (Dit heet 'blokkeren' of Hajb).
- Hoeveel krijgt elke persoon precies?
- Moeten we de bedragen aanpassen als het totaal te hoog of te laag is?
Veel AI-modellen springen hierin direct naar het antwoord, zonder de tussenstappen goed te doen. Ze maken een foutje in stap 1, en dat zorgt ervoor dat stap 2, 3 en 4 ook fout zijn. Het is alsof je een cake bakt, maar vergeet het meel toe te voegen; je kunt de rest van het recept nog zo perfect volgen, de cake wordt een mislukking.
2. De Oplossing: MAWARITH (De Grote Oefenboeken)
De onderzoekers hebben een gigantisch oefenboek gemaakt met 12.500 voorbeelden van erfzaken in het Arabisch.
- Niet alleen het antwoord: In plaats van alleen te vragen "Wat is het antwoord?", eist MAWARITH dat de AI elke stap uitlegt.
- De 'Gedachtenkrant': De AI moet eerst zijn gedachten opschrijven (wie erft, wie wordt geblokkeerd, welke regels gelden) en pas daarna het eindantwoord geven.
- De Expert: Elk voorbeeld is gemaakt door echte experts in islamitisch recht, zodat de 'goede oplossing' perfect is.
3. De Nieuwe Scorebord: MIR-E
Vroeger keek je alleen naar het eindantwoord: "Is het getal goed?" Nieuw is het MIR-E systeem. Dit is als een sportjury die niet alleen kijkt naar wie de finish haalt, maar ook naar hoe ze rennen.
- Als de AI de verkeerde mensen in de lijst zet, krijgt ze een straf, zelfs als het eindbedrag per toeval klopt.
- Als ze de regels voor 'blokkeren' verkeerd toepast, wordt dat ook bestraft.
- Het systeem kijkt dus naar de reis, niet alleen naar de bestemming.
4. Wat hebben ze ontdekt? (De Uitslag)
Ze hebben vijf verschillende AI-modellen getest. Het resultaat was verrassend duidelijk:
- De Winnaar: Gemini-2.5-flash (een commercieel model) deed het fantastisch. Het haalde een score van bijna 90%. Het kon de regels goed volgen en de stappen logisch doorlopen.
- De Verliezers: De andere modellen (vaak open-source of gespecialiseerde Arabische modellen) haalden nauwelijks 50%.
- Ze vergeten vaak familieleden die er wel mogen zijn.
- Ze laten familieleden erbij die er juist niet mogen zijn (bijvoorbeeld een oom die erft terwijl er nog een zoon is; volgens de regels blokkeert de zoon de oom).
- Ze maken rekenfouten in de verdeling.
5. Waarom is dit belangrijk?
Dit onderzoek toont aan dat AI nog niet zover is om complexe juridische taken volledig zelfstandig en betrouwbaar uit te voeren. Ze kunnen wel 'praten' als een expert, maar als je ze dwingt om de logica stap voor stap te bewijzen, vallen ze vaak door de mand.
De kernboodschap in één zin:
AI kan nu goed praten over erfrecht, maar om het echt te begrijpen en correct toe te passen, moeten we hen leren om niet alleen het antwoord te raden, maar de hele redenering stap voor stap te bouwen, net als een echte jurist.
De onderzoekers hopen dat hun nieuwe dataset (MAWARITH) helpt om toekomstige AI's te trainen die niet alleen slim praten, maar ook juridisch en wiskundig correct kunnen denken.