DocSage: An Information Structuring Agent for Multi-Doc Multi-Entity Question Answering

O DocSage é um framework agêntico inovador que supera as limitações dos sistemas RAG e LLMs existentes na resposta a perguntas sobre múltiplos documentos e entidades, utilizando descoberta dinâmica de esquemas, extração estruturada de informações e raciocínio relacional para alcançar melhorias significativas de precisão.

Teng Lin, Yizhang Zhu, Zhengxuan Zhang, Yuyu Luo, Nan Tang

Publicado 2026-03-13
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você precisa resolver um mistério complexo, como descobrir a relação entre o preço de ações de uma empresa, o histórico de saúde de seus executivos e as notícias sobre um novo produto. O problema é que essas informações estão espalhadas em centenas de documentos diferentes: alguns são relatórios financeiros, outros são notícias de jornal, e mais alguns são transcrições de reuniões.

Se você tentar ler tudo isso de uma vez só, seu cérebro (ou um computador comum) vai se perder. É aqui que entra o DocSage.

O Que é o DocSage?

O DocSage é como um detetive superorganizado que não apenas lê os documentos, mas cria um "mapa do tesouro" antes mesmo de começar a procurar as respostas.

A maioria dos sistemas de Inteligência Artificial atuais funciona como alguém que tenta encontrar uma agulha em um palheiro apenas cheirando o palheiro (busca por palavras-chave ou similaridade). Se a agulha estiver escondida de um jeito diferente, eles falham. O DocSage, por outro lado, primeiro constrói uma caixa de ferramentas personalizada para o mistério específico que você quer resolver.

Como Funciona? (A Analogia da Cozinha)

Para entender o DocSage, vamos imaginar que ele é um Chef de Cozinha tentando preparar um prato complexo usando ingredientes que estão espalhados em 100 despensas diferentes.

1. O Chef Descobre o Que Precisa (Descoberta de Esquema)

Antes de começar a cozinhar, o Chef não pega todos os ingredientes aleatoriamente. Ele olha para a receita (sua pergunta) e pergunta: "O que exatamente eu preciso?".

  • O que ele faz: Ele cria uma lista dinâmica e minimalista. Se você quer saber "Qual a relação entre o CEO e a queda nas vendas?", ele ignora receitas de bolo e foca apenas em "Nome do CEO", "Datas de Vendas" e "Relatórios Financeiros".
  • A mágica: Ele interage com os documentos como se estivesse conversando com eles. Se algo parece confuso, ele faz perguntas de volta para os documentos para esclarecer: "Espera, este 'CEO' é o mesmo daquele relatório de 2020?". Isso evita que ele se perca em informações inúteis.

2. O Chef Organiza os Ingredientes (Extração Estruturada)

Agora que ele sabe o que precisa, ele vai às despensas (os documentos) e não apenas joga os ingredientes numa pilha bagunçada.

  • O que ele faz: Ele transforma o texto bagunçado em tabelas organizadas (como planilhas do Excel). Ele coloca o "Nome" numa coluna, a "Data" em outra e o "Valor" em mais uma.
  • O Segredo: Ele é muito rigoroso. Se ele pega um número que parece errado (ex: "Idade: 180 anos"), ele para, verifica a lógica e corrige o erro antes de colocar na mesa. Isso garante que a "comida" (os dados) esteja limpa e confiável.

3. O Chef Cozinha a Resposta (Raciocínio Relacional)

Com tudo organizado em tabelas perfeitas, o Chef não precisa mais "adivinhar" ou "ler tudo de novo".

  • O que ele faz: Ele usa a lógica da tabela para conectar os pontos. É como usar uma fórmula no Excel: ele cruza a tabela de "Vendas" com a tabela de "CEO" e vê o padrão.
  • O Resultado: Como os dados já estão organizados, ele consegue fazer conexões complexas entre documentos diferentes sem se perder. Ele responde: "O CEO X assumiu em Janeiro, e logo depois as vendas caíram 20% em Março".

Por Que Isso é Tão Importante?

Os sistemas atuais de IA (como o RAG comum) são como alguém que tenta ler 500 páginas de livros ao mesmo tempo. Eles tendem a:

  1. Esquecer detalhes importantes (perdem a agulha no palheiro).
  2. Confundir personagens (acham que o CEO do documento A é o do documento B).
  3. Se perder em textos longos (o "cérebro" da IA satura e para de prestar atenção).

O DocSage resolve isso transformando o caos de textos soltos em dados estruturados e lógicos.

O Resultado na Prática

Nos testes, o DocSage foi muito melhor do que os melhores modelos atuais:

  • Ele acertou 27% mais respostas complexas do que os concorrentes.
  • Funcionou tão bem em documentos curtos quanto em textos gigantes (de centenas de milhares de palavras), onde os outros sistemas falhavam miseravelmente.

Resumo Final

O DocSage é como trocar um caçador de agulhas (que fica procurando no escuro) por um arquiteto que primeiro desenha o plano da casa, organiza os materiais e só então constrói a resposta. Ele transforma a bagunça de documentos desconexos em uma história clara e lógica, garantindo que a resposta não seja apenas uma "chute", mas uma conclusão baseada em fatos organizados.