An Senegalese Legal Texts Structuration Using LLM-augmented Knowledge Graph

Cette étude propose une structuration des textes juridiques sénégalais, notamment du Code foncier et du domaine public, en utilisant des modèles de langage avancés pour extraire près de 8 000 articles et construire un graphe de connaissances facilitant l'accès à l'information juridique pour les citoyens et les professionnels.

Oumar Kane, Mouhamad M. Allaya, Dame Samb, Mamadou Bousso

Publié 2026-03-10
📖 4 min de lecture☕ Lecture pause café

Each language version is independently generated for its own context, not a direct translation.

Voici une explication simple et imagée de cette recherche, comme si nous en parlions autour d'un café à Dakar.

🇸🇳 Le Projet : Transformer le "Labyrinithe" Juridique Sénégalais en une Carte au Trésor

Imaginez que le système juridique du Sénégal est une immense bibliothèque ancienne, remplie de milliers de livres (les lois, les décrets, les codes). Le problème ?

  1. Les livres sont en désordre.
  2. Ils sont écrits dans un langage très technique.
  3. Si vous cherchez une information précise (par exemple : "Combien coûte un terrain à Thiès ?"), vous devez fouiller pendant des heures, et souvent, vous ne trouvez rien.

C'est là que cette équipe de chercheurs (Oumar Kane et ses collègues) intervient. Ils ont utilisé l'intelligence artificielle (IA) pour transformer cette bibliothèque chaotique en une carte interactive et intelligente.


1. La Mission : Ranger les Livres (L'Extraction)

Les chercheurs ont pris 7 967 articles de lois sénégalaises (comme le Code du Domaine National, le Code des Marchés Publics, etc.).

  • L'analogie : C'est comme si un robot super-rapide prenait chaque page de chaque livre, arrachait les phrases importantes, et les classait dans des tiroirs étiquetés.
  • Le résultat : Ils ont réussi à extraire ces textes et à les structurer, même pour les documents complexes comme les tarifs de location de terrains.

2. Le Cerveau : La "Toile d'Araignée" (La Base de Données Graphique)

Au lieu de mettre ces lois dans un simple fichier Excel ou une liste, ils les ont placés dans une base de données en forme de toile d'araignée (appelée Graph Database ou Neo4j).

  • L'analogie : Imaginez un réseau de métro géant.
    • Chaque gare est un élément de loi (un Décret, un Article, un Ministre).
    • Chaque voie ferrée est un lien logique (par exemple : "Ce décret modifie cet article" ou "Cet article dépend de cette loi").
  • Pourquoi c'est génial ? Dans un livre, vous devez lire page par page. Dans ce réseau, si vous cliquez sur une gare (une loi), vous voyez instantanément toutes les autres gares connectées. Vous voyez l'histoire de la loi, qui l'a signée, et ce qu'elle a changé.
  • Les chiffres : Ils ont créé 2 872 gares (nœuds) reliées par 10 774 voies ferrées (relations). C'est une carte précise du domaine foncier au Sénégal.

3. Le Magicien : L'Intelligence Artificielle (Les LLM)

Pour construire cette toile d'araignée, ils n'ont pas tout fait à la main. Ils ont demandé à des "super-intelligences" (des modèles comme GPT-4o, GPT-4 et Mistral-Large) de lire les textes et de trouver les liens cachés.

  • L'analogie : Imaginez que vous donnez un texte juridique à un détective très brillant et lui dites : "Trouve-moi tous les liens entre cet article et les autres lois, et écris-les sous forme de phrases simples."
  • La technique : Ils ont utilisé une méthode appelée "Chain of Thought" (Chaîne de Pensée). C'est comme demander au détective de parler à voix haute et de dire : "D'abord, je regarde le titre. Ensuite, je vois qu'il cite la loi X. Donc, je crée un lien entre les deux."
  • Le verdict : Le modèle GPT-4o s'est révélé être le meilleur détective, trouvant les liens les plus précis et les plus rapides. Mais Mistral-Large était aussi très performant et parfois plus rapide.

4. Pourquoi est-ce important pour le citoyen sénégalais ?

Avant ce projet, comprendre ses droits était comme essayer de lire une carte au trésor dessinée sur un brouillard.

  • Avant : "Je ne sais pas quel article s'applique à ma situation. Je dois payer un avocat cher ou chercher pendant des jours."
  • Après : Grâce à cette "carte intelligente", un citoyen ou un juriste peut poser une question simple (ex: "Quelles sont les règles pour construire une maison à Saint-Louis ?") et l'IA, en consultant cette toile d'araignée, peut lui donner la réponse exacte en quelques secondes.

En Résumé

Cette recherche est comme la construction d'un GPS pour le droit sénégalais.

  1. Ils ont numérisé les lois (7 967 articles).
  2. Ils ont connecté les idées entre elles (la base de données graphique).
  3. Ils ont utilisé des robots intelligents (IA) pour faire le travail de connexion.

L'objectif final est de créer un assistant juridique virtuel qui aidera chaque Sénégalais à mieux comprendre ses droits et ses devoirs, rendant la justice plus transparente et accessible à tous. C'est une étape majeure pour moderniser la justice au Sénégal grâce à la technologie.