Let's Talk, Not Type: An Oral-First Multi-Agent Architecture for Guaraní

Ce papier de position propose une architecture multi-agents axée sur l'oralité pour le guarani, visant à dépasser les approches textocentriques de l'IA afin de respecter la souveraineté des données autochtones et les pratiques conversationnelles vivantes du Paraguay.

Samantha Adorno, Akshata Kishore Moharir, Ratna Kandala

Publié 2026-03-09
📖 5 min de lecture🧠 Analyse approfondie

Each language version is independently generated for its own context, not a direct translation.

Voici une explication simple et imagée de ce papier de recherche, conçue pour être comprise par tout le monde, sans jargon technique.

🗣️ Le Titre : « Parlons, ne tapons pas »

Imaginez que l'intelligence artificielle (IA) actuelle est comme un secrétaire très rigide qui ne comprend que si vous lui écrivez des lettres parfaites. Même quand vous lui parlez, il vous écoute comme s'il lisait un texte : il attend que vous finissiez, il ne vous coupe jamais la parole, et s'il ne comprend pas, il vous demande de répéter mot pour mot.

Pour les communautés qui parlent principalement à l'oral, comme les locuteurs du guaraní au Paraguay, ce système est comme essayer de danser une valse avec des chaussures de ski : ça ne colle pas du tout.

C'est pourquoi les auteurs (Samantha, Akshata et Ratna) proposent une nouvelle idée : une IA qui « pense » comme une conversation humaine, pas comme un formulaire à remplir.


🇵🇾 Le Problème : La « Double Vie » du Paraguay

Au Paraguay, les gens vivent une sorte de « double vie » linguistique (ce qu'on appelle la diglossie) :

  • Le Guaraní est la langue du cœur, de la maison, des rires et des discussions informelles. C'est une langue vivante, fluide, où l'on mélange parfois les mots avec l'espagnol (le jopará).
  • L'Espagnol est la langue des papiers officiels, de l'école et des administrations.

Le problème ? Aujourd'hui, les ordinateurs et les téléphones sont construits pour l'espagnol écrit. Si vous voulez utiliser un assistant vocal, vous devez souvent passer par l'espagnol ou écrire des mots. C'est comme si on vous obligeait à porter un costume cravate pour aller jouer au ballon dans le jardin. Les auteurs veulent créer un assistant qui accepte le « costume de maison » (le guaraní parlé) tel qu'il est.


🤖 La Solution : Une Équipe de 6 Experts (L'Architecture Multi-Agent)

Au lieu d'avoir un seul robot géant qui essaie de tout faire (et qui échoue souvent), les auteurs proposent de créer une équipe de 6 petits experts qui travaillent ensemble, comme un orchestre ou une équipe de secours.

Voici qui sont ces 6 membres de l'équipe :

  1. L'Écouteur (Le Gardien du Silence) 🎧

    • Son rôle : Il ne comprend pas les mots, il écoute le rythme.
    • L'analogie : Imaginez un ami très attentif à une fête. Il sait exactement quand vous avez fini votre phrase et quand vous faites juste une petite pause pour respirer. Au Paraguay, on fait parfois de petites pauses dans les mots sans pour autant avoir fini de parler. Cet expert sait ne pas vous couper la parole trop tôt.
  2. L'Interprète Culturel (Le Traducteur d'Âme) 🗣️

    • Son rôle : Il comprend ce que vous voulez dire, même si vous mélangez le guaraní et l'espagnol.
    • L'analogie : C'est comme un grand-père qui connaît tous les proverbes et les expressions locales. Il ne cherche pas une traduction mot à mot dans un dictionnaire, il comprend l'intention derrière les mots, même si vous utilisez des mots empruntés à l'espagnol.
  3. Le Gardien de la Mémoire (Le Chroniqueur) 📓

    • Son rôle : Il se souvient de tout ce qui a été dit précédemment.
    • L'analogie : C'est le meilleur ami qui dit : « Tu parlais de cette chanson tout à l'heure, donc quand tu dis "Je n'aime pas ça", il sait que tu parles de la chanson, pas de la météo ». Il garde le fil de la conversation pour qu'elle ne soit pas une suite de commandes isolées.
  4. Le Gardien de la Souveraineté (Le Gardien de la Porte) 🛡️

    • Son rôle : Il protège la vie privée et le consentement de la communauté.
    • L'analogie : C'est le gardien d'un village qui vérifie les passeports. Avant que l'IA ne fasse quoi que ce soit, ce gardien demande : « Est-ce que le locuteur est d'accord pour qu'on enregistre sa voix ? ». Il s'assure que les données restent entre les mains des Guaraní et ne sont pas volées par des géants technologiques.
  5. Le Conversateur (Le Répondeur) 💬

    • Son rôle : Il répond de manière naturelle, comme un humain.
    • L'analogie : Au lieu de dire « Ordre reçu », il dit « D'accord, je vais faire ça » ou « Attends, je n'ai pas bien compris, peux-tu répéter ? ». Il maintient le ton de la conversation.
  6. Les Spécialistes (Les Exécutants) 🛠️

    • Son rôle : Ce sont les petits ouvriers qui font le travail (allumer la musique, chercher une info).
    • L'analogie : Ce sont les musiciens de l'orchestre qui jouent leur partition une fois que le chef d'orchestre (les autres agents) a donné le feu vert.

🌟 Pourquoi c'est révolutionnaire ?

L'idée centrale est simple : ne pas essayer de transformer la langue parlée en texte pour la faire entrer dans un ordinateur.

Au lieu de forcer le guaraní à devenir du texte (ce qui est difficile et perd la richesse de la langue), on construit l'ordinateur pour qu'il comprenne la conversation telle qu'elle se passe : avec des pauses, des répétitions, des oublis, et des corrections.

  • La sécurité : L'IA ne stocke pas tout ce qu'elle entend sans permission. C'est crucial pour les communautés autochtones qui ont peur que leur culture soit exploitée.
  • La fluidité : L'IA sait attendre. Elle ne vous coupe pas la parole si vous réfléchissez.

🏁 En résumé

Ce papier nous dit que pour que l'intelligence artificielle soit vraiment utile à tout le monde, elle doit arrêter de penser comme un livre et commencer à penser comme une conversation autour d'un feu de camp.

Pour les Guaraní, cela signifie enfin pouvoir parler à leur technologie dans leur langue, avec leurs propres règles, sans avoir à porter le « costume » de l'espagnol écrit. C'est un pas vers une technologie qui respecte la culture plutôt que de l'effacer.