DocSage: An Information Structuring Agent for Multi-Doc Multi-Entity Question Answering

Le papier présente DocSage, un cadre agentique innovant qui améliore significativement la réponse aux questions multi-documents et multi-entités en intégrant la découverte dynamique de schémas, l'extraction d'informations structurées et un raisonnement relationnel, surpassant ainsi les systèmes RAG et les LLMs à contexte étendu de plus de 27 % en précision.

Teng Lin, Yizhang Zhu, Zhengxuan Zhang, Yuyu Luo, Nan Tang

Publié 2026-03-13
📖 4 min de lecture☕ Lecture pause café

Each language version is independently generated for its own context, not a direct translation.

Imaginez que vous devez répondre à une question très complexe, comme : « Quelle est la relation entre les médicaments A et B, et comment ont-ils affecté les patients dans les 500 rapports médicaux différents que nous avons ? »

C'est là que DocSage entre en jeu. C'est un nouvel outil intelligent conçu pour résoudre ce genre de casse-tête, là où les autres intelligences artificielles actuelles échouent souvent.

Voici comment cela fonctionne, expliqué simplement avec des images du quotidien :

1. Le Problème : Le Chaos des Documents

Imaginez que vous avez une bibliothèque remplie de milliers de livres, de journaux et de notes éparpillés sur le sol. On vous demande de trouver un lien précis entre deux personnages qui apparaissent dans des livres différents.

  • Les IA classiques (LLMs) sont comme des lecteurs très rapides, mais qui ont une mémoire limitée. Si vous leur donnez trop de livres d'un coup, ils se perdent, oublient les détails importants ou mélangent les histoires. C'est ce qu'on appelle la « dilution de l'attention ».
  • Les systèmes de recherche actuels (RAG) sont comme des bibliothécaires qui cherchent des mots-clés. Ils vous donnent les pages qui contiennent les mots « médicament » ou « patient », mais ils ne comprennent pas toujours comment ces pages s'assemblent pour raconter une histoire logique. Ils vous donnent des pièces de puzzle, mais pas le puzzle assemblé.

2. La Solution : DocSage, le « Chef de Cuisine » des Données

DocSage ne se contente pas de lire ; il organise. Il transforme ce chaos de documents en une cuisine parfaitement rangée. Il fonctionne en trois étapes clés :

Étape 1 : Le Détective (Découverte de Schéma)

Au lieu de lire tout le bazar au hasard, DocSage agit comme un détective qui pose des questions intelligentes.

  • L'analogie : Imaginez que vous cherchez une recette de gâteau. Au lieu de fouiller dans tous les placards, DocSage demande : « De quoi ai-je besoin ? De farine ? D'œufs ? ». Il crée instantanément une liste de courses personnalisée (un « schéma ») basée uniquement sur votre question. Il ne garde que les informations utiles et jette le reste.

Étape 2 : Le Chef d'Équipe Rigoureux (Extraction Structurée)

Une fois la liste de courses établie, DocSage commence à préparer les ingrédients. Mais attention, il ne se contente pas de copier-coller le texte.

  • L'analogie : C'est comme un chef qui transforme des légumes bruts en un plat prêt à être servi. Il nettoie les données, les met dans des boîtes étiquetées (des tableaux) et vérifie deux fois la cohérence.
  • Le super-pouvoir : Si une information semble bizarre (par exemple, un patient âgé de 180 ans), DocSage a un mécanisme de « correction d'erreur ». Il dit : « Attends, ça ne colle pas », et il retourne chercher la vérité dans les documents originaux avant de valider l'information.

Étape 3 : Le Logicien (Raisonnement Relationnel)

Maintenant que toutes les données sont rangées dans des tableaux bien ordonnés, DocSage peut répondre à la question.

  • L'analogie : Au lieu de chercher dans une montagne de papiers, DocSage utilise un tableau Excel géant et intelligent. Il peut faire des « jointures » (relier des lignes) entre différents documents instantanément.
  • Il transforme votre question en une requête de base de données (comme du SQL, le langage des bases de données) pour trouver la réponse exacte. C'est comme passer d'une recherche manuelle dans une bibliothèque à une recherche par ordinateur ultra-rapide.

3. Pourquoi c'est révolutionnaire ?

Les tests montrent que DocSage est bien meilleur que les meilleurs systèmes actuels (plus de 27 % de précision en plus).

  • Précision chirurgicale : Il ne rate jamais les détails importants car il sait exactement où chercher.
  • Gestion du chaos : Même si vous lui donnez 100 000 pages de documents, il ne se perd pas, car il a tout rangé dans des cases logiques.
  • Confiance : Chaque réponse est accompagnée de sa « preuve ». Vous pouvez remonter le fil pour voir exactement dans quel document l'information a été trouvée.

En résumé

Si les autres IA sont comme des étudiants brillants qui lisent trop de livres et finissent par confondre les histoires, DocSage est comme un architecte de données. Il prend le chaos, dessine un plan précis, construit une maison solide avec les briques d'information, et vous donne la réponse exacte, étayée par des preuves solides.

C'est une avancée majeure pour les domaines où la précision est vitale, comme la médecine, la finance ou le droit, où une erreur de détail peut avoir de lourdes conséquences.