PRECEPT: Planning Resilience via Experience, Context Engineering & Probing Trajectories A Unified Framework for Test-Time Adaptation with Compositional Rule Learning and Pareto-Guided Prompt Evolution

O PRECEPT é uma estrutura unificada para adaptação em tempo de teste que combina recuperação determinística de regras, memória consciente de conflitos e evolução de prompts guiada por Pareto para superar a degradação de recuperação, melhorar a generalização composicional e garantir robustez contra conhecimento desatualizado ou adversário em agentes LLM.

Arash Shahmansoori

Publicado Wed, 11 Ma
📖 5 min de leitura🧠 Leitura aprofundada

Each language version is independently generated for its own context, not a direct translation.

Imagine que você tem um assistente de IA superinteligente, mas que, às vezes, age como um turista perdido em uma cidade grande: ele lê o mapa, mas se o mapa tiver um erro de digitação ou se a rua mudou de nome, ele continua insistindo no caminho errado, mesmo que você lhe diga "não, olhe aqui!".

O artigo que você enviou apresenta o PRECEPT, uma nova "arquitetura" para esses assistentes. Em vez de depender apenas da memória bagunçada do cérebro da IA (que é como tentar lembrar de tudo apenas conversando), o PRECEPT dá ao assistente um sistema de organização rigoroso, como um bibliotecário extremamente eficiente e um detetive cético.

Aqui está a explicação simples, usando analogias do dia a dia:

1. O Problema: O "Turista" que se Perde

Os assistentes de IA atuais (chamados de Agentes LLM) aprendem conversando e lendo textos. O problema é que, quando as coisas ficam complexas (muitas regras, muitas condições), eles começam a se confundir.

  • A analogia: Imagine que você pede para um turista encontrar um restaurante específico. Se você der 3 dicas, ele consegue. Se você der 10 dicas ("está perto do parque, mas não do cinema, é azul, mas não verde..."), o turista começa a alucinar e a escolher o restaurante errado, porque tentou "adivinhar" o significado em vez de seguir as regras exatas.
  • O erro: Eles confundem "parecido" com "exato". Se o assistente acha que "rua A" é parecida com "rua B", ele pode ir para a errada.

2. A Solução: O PRECEPT (O Bibliotecário e o Detetive)

O PRECEPT resolve isso com três ferramentas principais, que trabalham juntas como uma equipe:

A. A Busca Exata (O Bibliotecário Rigoroso)

Em vez de perguntar à IA "o que você acha que devemos fazer?", o PRECEPT usa um índice de busca exata.

  • A analogia: Pense em um dicionário ou um código de barras. Se você tem um código "A1", você vai direto para a página exata onde está escrito o que fazer. Não há "achismo".
  • Como funciona: O sistema transforma cada situação em uma "chave" única. Se a chave for "A1", ele busca a regra exata para "A1". Isso elimina 100% dos erros de interpretação quando a regra existe. É como ter um GPS que não pergunta "será que é aqui?", ele apenas diz "vire à direita".

B. O Detetive de Conflitos (O Chefe Cético)

Às vezes, o assistente tem duas informações: uma antiga (de um manual) e uma nova (o que acabou de acontecer). Elas podem brigar.

  • A analogia: Imagine que você tem um manual antigo que diz "o trem sai às 8h", mas você acabou de ver um aviso no celular dizendo "o trem atrasou". Um assistente comum pode ignorar o celular e seguir o manual. O PRECEPT tem um Detetive.
  • Como funciona: O Detetive usa matemática (Bayesiana) para perguntar: "Qual fonte é mais confiável agora?". Se o manual diz uma coisa e a experiência recente diz outra, o Detetive descarta o manual antigo e confia na experiência nova. Ele aprende a desconfiar de informações "velhas" ou "adversárias" (que parecem verdadeiras, mas são armadilhas).

C. O Treinador de Prompts (O Coach que Evolui)

O sistema tem uma camada chamada COMPASS. Imagine que o assistente está jogando um jogo de tabuleiro.

  • A analogia: O COMPASS é como um treinador que observa o jogo. Se o jogador erra muito, o treinador não apenas diz "tente de novo", ele reescreve as regras do jogo para o jogador, criando uma estratégia melhor.
  • Como funciona: O sistema testa várias versões de "instruções" (prompts) e escolhe a que funciona melhor, mantendo uma diversidade de estratégias para não ficar preso em um único jeito de pensar (evitando que o assistente fique "teimoso").

3. O Resultado: Por que isso é incrível?

O artigo mostra testes onde o PRECEPT foi muito superior aos concorrentes:

  1. Não se perde em labirintos complexos: Enquanto outros assistentes falhavam quando havia muitas regras misturadas (como tentar combinar 10 ingredientes diferentes), o PRECEPT acertava quase sempre na primeira tentativa.
  2. Aprende rápido e esquece o errado: Se uma regra antiga se torna inútil (porque o mundo mudou), o PRECEPT a apaga rapidamente. Outros assistentes continuam insistindo na regra velha, como se estivessem presos no passado.
  3. Economia de energia: O PRECEPT usa muito menos "tentativas" (passos) para resolver um problema. Enquanto outros tentam 5 ou 6 vezes para acertar, o PRECEPT geralmente acerta em 2 ou 3.

Resumo em uma frase

O PRECEPT transforma um assistente de IA que "adivinha" e se confunde em um operador de precisão que usa um índice exato para encontrar regras, um detetive para filtrar informações falsas e um treinador para melhorar suas estratégias continuamente.

A lição final: Para criar agentes de IA confiáveis no mundo real (como em logística, saúde ou finanças), não basta apenas ter um modelo de IA "maior" ou "mais inteligente". É preciso dar a ele estrutura, regras claras e mecanismos para corrigir seus próprios erros, em vez de depender apenas da sorte ou da interpretação de texto.