GenePlan: Evolving Better Generalized PDDL Plans using Large Language Models

O GenePlan é um novo framework que utiliza algoritmos evolutivos assistidos por modelos de linguagem de grande escala para gerar planejadores generalizados em Python, alcançando desempenho comparável aos planejadores de última geração e superando significativamente outras abordagens baseadas em LLMs em tarefas de planejamento clássico PDDL.

Andrew Murray, Danial Dervovic, Alberto Pozanco, Michael Cashmore

Publicado Wed, 11 Ma
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você precisa ensinar um robô a resolver um quebra-cabeça complexo, como organizar caixas, entregar jornais ou gerenciar um laboratório de pesquisa. O problema é que cada vez que o cenário muda um pouco (mais caixas, mais pessoas, mais obstáculos), o robô precisa aprender tudo de novo do zero, o que é lento e caro.

Aqui entra o GenePlan, uma nova ideia criada por pesquisadores do J.P. Morgan AI Research. Vamos explicar como funciona usando uma analogia simples: a "Fábrica de Receitas Evolutiva".

1. O Problema: O Chef que Esquece Tudo

Normalmente, quando usamos Inteligência Artificial (como o GPT-4) para planejar ações, ela age como um chef que tenta cozinhar um prato novo toda vez que você pede. Ele lê o pedido, tenta adivinhar os ingredientes e cozinhar. Às vezes, ele acerta, mas muitas vezes faz um prato sem graça ou queimado. Além disso, ele não "aprende" com os erros de forma permanente; na próxima vez, ele começa do zero.

2. A Solução: A Evolução das Receitas (GenePlan)

O GenePlan muda a regra do jogo. Em vez de pedir para a IA criar uma solução única, ele cria uma população de "receitas" (pequenos programas em Python) e as faz evoluir, como na natureza.

Pense no GenePlan como um chef de cozinha que contrata um time de cozinheiros e os coloca em uma competição de TV:

  • A Geração 1 (Os Iniciantes): O sistema pede para a IA criar várias receitas iniciais. Algumas são boas, outras são terríveis (o robô cai no buraco ou esquece de pegar o jornal).
  • O Teste de Sabores (Avaliação): Cada receita é testada em vários cenários diferentes (entregar 5 jornais, depois 10, depois 20). O sistema mede: "Quanto tempo levou? Quantos passos foram necessários?".
  • A Seleção Natural (O Pulo do Gato): As receitas que falharam ou foram lentas são descartadas (como cozinheiros que não passam na prova). As receitas que funcionaram bem são mantidas.
  • A Mistura e a Mutação (Cruzamento e Mutação): Aqui está a mágica. O GenePlan pega as duas melhores receitas e as "copia e cola" uma na outra (como misturar o molho da Receita A com o tempero da Receita B). Depois, ele faz pequenas alterações aleatórias (mutação), como "adicionar um pouco mais de sal" ou "trocar o forno por uma panela".
  • A Nova Geração: Essas novas receitas misturadas são testadas novamente. Com o tempo, a população inteira de receitas fica cada vez mais eficiente.

3. O Resultado: O "Super Chef"

Depois de várias rodadas dessa evolução, o GenePlan entrega uma única receita perfeita.

  • Não é mais uma conversa: Diferente de pedir para a IA "pensar" a cada vez, o GenePlan gera um código de computador (um plano generalizado) que você pode salvar e usar para sempre.
  • Velocidade Relâmpago: Uma vez que esse "Super Chef" é criado, ele resolve novos problemas em menos de meio segundo. É como ter um GPS que já conhece o caminho de cor, em vez de ter que perguntar a alguém a cada esquina.
  • Qualidade: O teste mostrou que esse método é tão bom quanto os melhores sistemas de planejamento do mundo (como o Fast Downward), mas muito mais rápido e barato de criar.

4. Por que isso é importante?

Imagine que você tem uma empresa de entregas.

  • Sem GenePlan: Você paga caro para a IA pensar em um roteiro para cada novo dia de entregas.
  • Com GenePlan: Você paga uma vez (cerca de US$ 1,80 por domínio) para a IA "evoluir" o roteiro perfeito. Depois disso, o sistema roda sozinho, super rápido, resolvendo milhares de entregas por dia sem gastar mais nada.

Resumo da Ópera

O GenePlan não tenta adivinhar a resposta certa na hora. Ele cria um laboratório de testes onde milhares de ideias são geradas, as ruins são jogadas fora, as boas são misturadas e melhoradas, até que reste apenas a melhor estratégia possível para aquele tipo de problema. É como se a natureza tivesse que criar um super-herói para resolver quebra-cabeças, e a IA fosse o processo de evolução que o criou.

Em suma: O GenePlan transforma a IA de um "pensador lento" em um "criador de ferramentas rápidas e inteligentes".