STRUCTUREDAGENT: Planning with AND/OR Trees for Long-Horizon Web Tasks

O artigo apresenta o STRUCTUREDAGENT, um framework de planejamento hierárquico que utiliza árvores AND/OR dinâmicas e um módulo de memória estruturada para superar as limitações de agentes web existentes em tarefas de longo horizonte, resultando em melhor desempenho e planos interpretáveis.

ELita Lobo, Xu Chen, Jingjing Meng, Nan Xi, Yang Jiao, Chirag Agarwal, Yair Zick, Yan Gao

Publicado 2026-03-06
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você pediu para um assistente de IA encontrar a receita perfeita de um bolo de chocolate vegano com uma nota de 4 estrelas ou mais em um site de culinária gigante.

Um agente de IA comum (os "agentes básicos") agiria como um turista perdido: ele clicaria em algo, leria a página, talvez clicasse em outra coisa e, se não encontrasse o que queria logo de cara, desistiria ou ficaria preso em um loop, sem lembrar do que já viu. É como tentar montar um quebra-cabeça gigante sem a caixa de referência e sem anotar as peças que já tentou.

O STRUCTUREDAGENT (o "Agente Estruturado") proposto neste artigo é diferente. Pense nele como um detetive experiente com um caderno de anotações organizado e um mapa mental dinâmico.

Aqui está como ele funciona, usando analogias simples:

1. A Árvore de Decisão (O Mapa Mental)

Em vez de apenas "pensar e agir" de forma linear, o StructuredAgent constrói uma árvore de decisões (chamada de árvore AND/OR).

  • Nós AND (E): São como uma lista de compras. Para o bolo ficar pronto, você precisa de farinha E ovos E açúcar. Todos os itens são obrigatórios. Se um falhar, a receita não sai.
  • Nós OR (OU): São como ter opções de transporte. Para chegar ao mercado, você pode pegar o ônibus OU o carro. Se o ônibus estiver lotado (falhar), o agente tenta o carro.
  • A Mágica: Se o agente tenta uma opção (ex: clicar no primeiro link) e falha, ele não desiste. Ele volta na árvore, risca essa opção e tenta a próxima (o segundo link). Ele sabe exatamente onde estava e o que já tentou.

2. A Memória Estruturada (O Caderno de Detetive)

A maior falha dos outros agentes é a "amnésia". Eles esquecem o que viram há 10 clizos atrás.
O StructuredAgent tem um caderno de anotações estruturado. Imagine que ele tem uma planilha onde ele anota:

  • "Encontrei um bolo vegano, mas a nota é 3.5 (não serve)."
  • "Encontrei um bolo com nota 4.5, mas não é vegano (não serve)."
  • "Encontrei um bolo vegano com nota 4.2 (BOM CANDIDATO!)."

Isso permite que ele compare as opções como um humano faria, garantindo que ele não esqueça de uma boa opção só porque navegou para outra página.

3. O Planejamento Hierárquico (O Chefe de Cozinha)

O agente não tenta fazer tudo de uma vez. Ele divide o problema grande em tarefas pequenas, como um chefe de cozinha dividindo o serviço:

  1. Tarefa Principal: Encontrar a receita.
  2. Sub-tarefa 1: Pesquisar "bolo vegano".
  3. Sub-tarefa 2: Filtrar por "nota 4+".
  4. Sub-tarefa 3: Verificar se é vegano.

Se a "Sub-tarefa 2" falhar (o site não tem filtro), o agente não trava. Ele usa a árvore para ver que pode tentar "Sub-tarefa 2.1: Ler os títulos manualmente" ou "Sub-tarefa 2.2: Ir para a próxima página". Ele se adapta dinamicamente.

Por que isso é importante?

O mundo da web é caótico. Sites mudam, links quebram e informações estão escondidas.

  • Agentes comuns: São como crianças que tentam adivinhar o caminho. Se erram uma vez, desistem.
  • StructuredAgent: É como um explorador profissional. Ele traça um mapa, anota onde já pisou, sabe que se a porta A estiver trancada, a porta B pode estar aberta, e se a porta B também falhar, ele volta e tenta a porta C, sem perder a cabeça.

Em resumo: O papel apresenta um sistema que ensina a IA a planejar como um humano, lembrar como um detetive e se adaptar como um explorador, tornando-a muito mais capaz de resolver tarefas complexas na internet, como fazer compras online com regras específicas ou pesquisar informações detalhadas, sem se perder no meio do caminho.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →