MAWARITH: A Dataset and Benchmark for Legal Inheritance Reasoning with LLMs

O artigo apresenta o MAWARITH, um grande conjunto de dados e benchmark em árabe com 12.500 casos de herança islâmica projetado para treinar e avaliar a capacidade de raciocínio estruturado de modelos de linguagem, introduzindo também a métrica MIR-E para uma avaliação detalhada das etapas de inferência jurídica.

Abdessalam Bouchekif, Shahd Gaben, Samer Rashwani, Somaya Eltanbouly, Mutaz Al-Khatib, Heba Sbahi, Mohammed Ghaly, Emad Mohamed

Publicado 2026-03-10
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você é um juiz encarregado de dividir a herança de uma pessoa que acabou de falecer. Não é apenas uma questão de "quem recebe o quê"; é como resolver um quebra-cabeça matemático e legal extremamente complexo, onde cada peça depende da outra. Se você errar a primeira peça, todo o resto do quebra-cabeça fica errado.

Este é o desafio que o artigo "MAWARITH" apresenta. Vamos descomplicar tudo isso usando analogias do dia a dia.

1. O Problema: O "Quebra-Cabeça" da Herança Islâmica

A lei de herança islâmica (ʿilm al-mawārīth) é como uma receita de bolo muito rigorosa. Você não pode apenas misturar os ingredientes; precisa seguir passos exatos:

  1. Quem está na festa? (Identificar os herdeiros).
  2. Quem fica de fora? (Aplicar regras de "bloqueio" ou exclusão).
  3. Quanto cada um ganha? (Calcular frações exatas).
  4. Ajuste final: Às vezes, a soma das partes é maior que o bolo todo (precisa cortar um pedaço de todos) ou menor (precisa distribuir o que sobrou).

O problema é que os Modelos de Linguagem (IA) atuais, como o ChatGPT ou o Gemini, são ótimos em escrever textos bonitos, mas péssimos em seguir essa "receita" passo a passo. Eles tendem a alucinar (inventar herdeiros que não existem) ou errar a matemática no final.

2. A Solução: O "MAWARITH" (O Novo Treinamento)

Os autores criaram um novo banco de dados gigante chamado MAWARITH.

  • O que é: Um livro de exercícios com 12.500 casos de herança, todos escritos em árabe.
  • A Mágica: Diferente de testes antigos que só perguntavam "Qual é a resposta certa? (A, B, C ou D)", o MAWARITH exige que a IA mostre todo o raciocínio. É como se o aluno tivesse que mostrar a conta no caderno, não apenas o resultado final.
  • O Objetivo: Ensinar a IA a pensar como um especialista jurídico, passo a passo, citando as regras corretas e fazendo os cálculos exatos.

3. O "MIR-E": O Professor que Corrige o Caderno

Como saber se a IA realmente aprendeu ou só chutou a resposta? Os autores criaram uma nova régua de medição chamada MIR-E.

  • A Analogia: Imagine um professor corrigindo uma prova de matemática.
    • Se o aluno erra a primeira linha (identificou o herdeiro errado), o professor não olha só o resultado final; ele dá zero porque a lógica inteira está quebrada.
    • O MIR-E pontua cada etapa: "Você achou os herdeiros corretos?", "Você aplicou a regra de bloqueio certo?", "A matemática bateu?".
    • Isso permite ver onde a IA está falhando, não apenas se ela falhou.

4. O Grande Teste: Quem é o "Campeão"?

Os autores colocaram 5 IAs famosas para resolver esses 12.500 problemas. O resultado foi um choque:

  • O Vencedor: O Gemini-2.5-flash (uma IA comercial da Google) foi o único que realmente entendeu a lógica. Ele acertou cerca de 90% do processo completo. Foi como se ele tivesse lido todos os livros de direito antes da prova.
  • Os Perdedores: Modelos de código aberto (como LLaMA, Qwen e Fanar) ficaram muito abaixo, com notas entre 30% e 45%.
    • O Motivo: Eles costumavam errar logo no início. Por exemplo, achavam que um primo distante tinha direito à herança mesmo quando existia um filho vivo (o que a lei proíbe). Como erraram o primeiro passo, todo o cálculo final ficou errado.

5. Onde eles erram? (A Análise dos Erros)

O estudo descobriu padrões engraçados e preocupantes:

  • Confusão de Parentesco: A IA às vezes lê "quatro filhas de um filho" e acha que são dois grupos diferentes de herdeiros, criando pessoas que não existem.
  • Bloqueio Errado: A lei diz que se há um filho, ele "bloqueia" certos parentes. As IAs frequentemente ignoram isso e dão herança para quem não deveria receber.
  • Falta de "Sentido Comum" Jurídico: Mesmo quando a IA sabe a regra, ela não consegue aplicá-la em conjunto com as outras. É como saber que "água ferve a 100°C" e "gelo derrete a 0°C", mas não saber o que acontece se você misturar os dois.

Conclusão: Por que isso importa?

Este trabalho é como construir uma ponte entre a inteligência artificial e o direito complexo.

  • Hoje, as IAs são ótimas em conversar, mas ruins em seguir regras rígidas de herança.
  • O MAWARITH é o primeiro passo para criar IAs que podem realmente ajudar juízes, advogados e famílias a resolverem disputas de herança com precisão, sem inventar leis ou errar cálculos.

Em resumo: A IA ainda precisa ir muito mais à escola de direito antes de poder ser um juiz confiável, mas agora temos um "livro de exercícios" perfeito para ajudá-la a estudar.