Agentic DAG-Orchestrated Planner Framework for Multi-Modal, Multi-Hop Question Answering in Hybrid Data Lakes

Each language version is independently generated for its own context, not a direct translation.

Imagine que você é um detetive tentando resolver um caso complexo. Para achar a resposta, você precisa de duas coisas: um arquivo de banco de dados (com tabelas organizadas de números e nomes) e uma pilha de documentos soltos (contratos, e-mails e relatórios em texto livre).

O problema é que, na maioria das empresas hoje, os sistemas de Inteligência Artificial (IA) são como detetives desajeitados: eles pegam tudo o que têm, misturam tudo num monte e tentam adivinhar a resposta. Isso é lento, gasta muita energia e, pior, muitas vezes eles inventam fatos (alucinações) porque não sabem exatamente onde procurar cada pedaço da informação.

Aqui entra o A.DOT, o novo sistema criado pelos pesquisadores da IBM. Vamos explicar como ele funciona usando uma analogia simples: A Orquestra de Detetives.

1. O Chefe de Orquestra (O Planejador DAG)

Em vez de mandar todos os detetives correrem aleatoriamente, o A.DOT tem um Chefe de Orquestra inteligente. Quando você faz uma pergunta em linguagem natural (como: "Quanto pagamos em média para clientes do Texas e quais são os termos de pagamento?"), o Chefe não apenas busca a resposta.

Ele desenha um mapa de missão (chamado de DAG - um gráfico de tarefas conectadas).

Passo 1: Ele diz ao "Detetive SQL": "Vá até o banco de dados e encontre apenas os clientes do Texas".
Passo 2: Ele pega a lista de nomes que o Detetive SQL trouxe e diz ao "Detetive de Documentos": "Agora, vá até a pilha de contratos e leia apenas os termos de pagamento desses nomes específicos".

Isso é chamado de raciocínio multi-hop (múltiplos saltos). O sistema sabe que precisa ir do banco de dados para o documento e voltar, passo a passo, sem perder o foco.

2. A Validação de Segurança (O Inspetor de Obras)

Antes de qualquer detetive sair para a rua, o plano passa por um Inspetor de Obras.

Ele verifica: "Esse plano faz sentido? Os nomes das tabelas existem? A lógica está correta?"
Se o plano estiver errado, ele não deixa o sistema rodar. Ele avisa o Sistema DataOps (uma equipe de reparo automática) para consertar o erro antes que ele aconteça. É como um corretor ortográfico que impede você de enviar um e-mail com erros graves.

3. A Execução Paralela (O Tráfego Inteligente)

Aqui está a mágica da velocidade. Se duas tarefas não dependem uma da outra (ex: "buscar dados do Texas" e "buscar dados da Califórnia"), o A.DOT manda os dois detetives trabalharem ao mesmo tempo.

Ele não espera um terminar para começar o outro.
Ele só passa a informação necessária (como um número de ID) de um detetive para o outro, evitando carregar "mochilas pesadas" de dados desnecessários. Isso economiza tempo e evita vazamento de dados.

4. A Memória de Longo Prazo (O Cache)

Se você perguntar a mesma coisa de um jeito diferente ("Quero saber a média de pagamentos do Texas" vs "Mostre o valor médio pago por clientes do Texas"), o sistema reconhece que é a mesma pergunta.

Ele usa um sistema de cache para reutilizar o mapa de missão que já foi desenhado e validado antes. É como ter um "atalho" no GPS que já sabe que o caminho está livre, economizando tempo de cálculo.

5. O Rastro de Papel (Prova e Confiança)

Diferente de outras IAs que dão uma resposta e somem, o A.DOT deixa um rastro de papel (evidência) de cada passo.

Você pode clicar na resposta e ver exatamente: "Onde esse número veio? Qual linha da tabela? Qual parágrafo do contrato?".
Isso é crucial para empresas, pois permite auditoria e garante que a resposta não foi inventada.

Os Resultados na Prática

Os pesquisadores testaram esse sistema em um "campo de treinamento" difícil (o dataset HybridQA), onde as perguntas exigem misturar tabelas e textos.

O resultado: O A.DOT foi muito mais preciso e completo do que os sistemas atuais (como RAG ou ReAct). Ele acertou 14,8% mais e foi 10,7% mais completo nas respostas.
O futuro: Esse sistema já está sendo testado para entrar no produto IBM Watsonx.data, ou seja, em breve, empresas poderão usá-lo para fazer perguntas complexas aos seus dados com a mesma facilidade de conversar com um humano, mas com a precisão de um engenheiro de dados.

Em resumo: O A.DOT transforma a busca por informações em uma operação militar bem coordenada, onde cada agente sabe exatamente o que fazer, quando fazer e como se comunicar, garantindo respostas rápidas, precisas e 100% verificáveis.

Agentic DAG-Orchestrated Planner Framework for Multi-Modal, Multi-Hop Question Answering in Hybrid Data Lakes

1. O Chefe de Orquestra (O Planejador DAG)

2. A Validação de Segurança (O Inspetor de Obras)

3. A Execução Paralela (O Tráfego Inteligente)

4. A Memória de Longo Prazo (O Cache)

5. O Rastro de Papel (Prova e Confiança)

Os Resultados na Prática

Resumo Técnico: Framework A.DOT para Resposta a Perguntas em Data Lakes Híbridos

1. O Problema

2. Metodologia: O Framework A.DOT

3. Principais Contribuições

4. Resultados Experimentais

5. Significância e Futuro

Agentic DAG-Orchestrated Planner Framework for Multi-Modal, Multi-Hop Question Answering in Hybrid Data Lakes

1. O Chefe de Orquestra (O Planejador DAG)

2. A Validação de Segurança (O Inspetor de Obras)

3. A Execução Paralela (O Tráfego Inteligente)

4. A Memória de Longo Prazo (O Cache)

5. O Rastro de Papel (Prova e Confiança)

Os Resultados na Prática

Resumo Técnico: Framework A.DOT para Resposta a Perguntas em Data Lakes Híbridos

1. O Problema

2. Metodologia: O Framework A.DOT

3. Principais Contribuições

4. Resultados Experimentais

5. Significância e Futuro

Mais como este

The Non-Optimality of Scientific Knowledge: Path Dependence, Lock-In, and The Local Minimum Trap

Self-Monitoring Benefits from Structural Integration: Lessons from Metacognition in Continuous-Time Multi-Timescale Agents

GoodPoint: Learning Constructive Scientific Paper Feedback from Author Responses

The Long-Horizon Task Mirage? Diagnosing Where and Why Agentic Systems Break

When to Forget: A Memory Governance Primitive