Agentic DAG-Orchestrated Planner Framework for Multi-Modal, Multi-Hop Question Answering in Hybrid Data Lakes

O artigo apresenta o A.DOT, um framework agêntico que orquestra planos de execução em grafos acíclicos direcionados para responder a perguntas complexas em múltiplas etapas, integrando de forma eficiente dados estruturados e não estruturados em lagos de dados híbridos com maior precisão e rastreabilidade.

Kirushikesh D B, Manish Kesarwani, Nishtha Madaan, Sameep Mehta, Aldrin Dennis, Siddarth Ajay, Rakesh B R, Renu Rajagopal, Sudheesh Kairali

Publicado 2026-03-17
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você é um detetive tentando resolver um caso complexo. Para achar a resposta, você precisa de duas coisas: um arquivo de banco de dados (com tabelas organizadas de números e nomes) e uma pilha de documentos soltos (contratos, e-mails e relatórios em texto livre).

O problema é que, na maioria das empresas hoje, os sistemas de Inteligência Artificial (IA) são como detetives desajeitados: eles pegam tudo o que têm, misturam tudo num monte e tentam adivinhar a resposta. Isso é lento, gasta muita energia e, pior, muitas vezes eles inventam fatos (alucinações) porque não sabem exatamente onde procurar cada pedaço da informação.

Aqui entra o A.DOT, o novo sistema criado pelos pesquisadores da IBM. Vamos explicar como ele funciona usando uma analogia simples: A Orquestra de Detetives.

1. O Chefe de Orquestra (O Planejador DAG)

Em vez de mandar todos os detetives correrem aleatoriamente, o A.DOT tem um Chefe de Orquestra inteligente. Quando você faz uma pergunta em linguagem natural (como: "Quanto pagamos em média para clientes do Texas e quais são os termos de pagamento?"), o Chefe não apenas busca a resposta.

Ele desenha um mapa de missão (chamado de DAG - um gráfico de tarefas conectadas).

  • Passo 1: Ele diz ao "Detetive SQL": "Vá até o banco de dados e encontre apenas os clientes do Texas".
  • Passo 2: Ele pega a lista de nomes que o Detetive SQL trouxe e diz ao "Detetive de Documentos": "Agora, vá até a pilha de contratos e leia apenas os termos de pagamento desses nomes específicos".

Isso é chamado de raciocínio multi-hop (múltiplos saltos). O sistema sabe que precisa ir do banco de dados para o documento e voltar, passo a passo, sem perder o foco.

2. A Validação de Segurança (O Inspetor de Obras)

Antes de qualquer detetive sair para a rua, o plano passa por um Inspetor de Obras.

  • Ele verifica: "Esse plano faz sentido? Os nomes das tabelas existem? A lógica está correta?"
  • Se o plano estiver errado, ele não deixa o sistema rodar. Ele avisa o Sistema DataOps (uma equipe de reparo automática) para consertar o erro antes que ele aconteça. É como um corretor ortográfico que impede você de enviar um e-mail com erros graves.

3. A Execução Paralela (O Tráfego Inteligente)

Aqui está a mágica da velocidade. Se duas tarefas não dependem uma da outra (ex: "buscar dados do Texas" e "buscar dados da Califórnia"), o A.DOT manda os dois detetives trabalharem ao mesmo tempo.

  • Ele não espera um terminar para começar o outro.
  • Ele só passa a informação necessária (como um número de ID) de um detetive para o outro, evitando carregar "mochilas pesadas" de dados desnecessários. Isso economiza tempo e evita vazamento de dados.

4. A Memória de Longo Prazo (O Cache)

Se você perguntar a mesma coisa de um jeito diferente ("Quero saber a média de pagamentos do Texas" vs "Mostre o valor médio pago por clientes do Texas"), o sistema reconhece que é a mesma pergunta.

  • Ele usa um sistema de cache para reutilizar o mapa de missão que já foi desenhado e validado antes. É como ter um "atalho" no GPS que já sabe que o caminho está livre, economizando tempo de cálculo.

5. O Rastro de Papel (Prova e Confiança)

Diferente de outras IAs que dão uma resposta e somem, o A.DOT deixa um rastro de papel (evidência) de cada passo.

  • Você pode clicar na resposta e ver exatamente: "Onde esse número veio? Qual linha da tabela? Qual parágrafo do contrato?".
  • Isso é crucial para empresas, pois permite auditoria e garante que a resposta não foi inventada.

Os Resultados na Prática

Os pesquisadores testaram esse sistema em um "campo de treinamento" difícil (o dataset HybridQA), onde as perguntas exigem misturar tabelas e textos.

  • O resultado: O A.DOT foi muito mais preciso e completo do que os sistemas atuais (como RAG ou ReAct). Ele acertou 14,8% mais e foi 10,7% mais completo nas respostas.
  • O futuro: Esse sistema já está sendo testado para entrar no produto IBM Watsonx.data, ou seja, em breve, empresas poderão usá-lo para fazer perguntas complexas aos seus dados com a mesma facilidade de conversar com um humano, mas com a precisão de um engenheiro de dados.

Em resumo: O A.DOT transforma a busca por informações em uma operação militar bem coordenada, onde cada agente sabe exatamente o que fazer, quando fazer e como se comunicar, garantindo respostas rápidas, precisas e 100% verificáveis.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →