PRECEPT: Planning Resilience via Experience, Context Engineering & Probing Trajectories A Unified Framework for Test-Time Adaptation with Compositional Rule Learning and Pareto-Guided Prompt Evolution

Het paper introduceert PRECEPT, een unified framework voor testtijd-adaptatie dat de prestaties van LLM-agenten verbetert door deterministische regelretrieval, conflictbewust geheugen en een door Pareto-gestuurde prompt-evolutie (COMPASS) te combineren, wat leidt tot aanzienlijke winsten in generalisatie, robuustheid en leerefficiëntie.

Arash Shahmansoori

Gepubliceerd Wed, 11 Ma
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een zeer slimme, maar soms wat verwarde assistent hebt. Deze assistent (een AI) kan geweldig praten en redeneren, maar als je hem te veel regels tegelijk geeft, of als de wereld om hem heen verandert, raakt hij in de war. Hij vergeet dingen, verwardt oude informatie met nieuwe, en maakt dezelfde fouten keer op keer.

Het paper PRECEPT introduceert een nieuwe manier om zo'n assistent te bouwen. In plaats van te hopen dat de AI "slimmer" wordt door meer te leren, bouwen we hem een strakke, onbreekbare structuur om.

Hier is hoe PRECEPT werkt, vertaald naar alledaagse analogieën:

1. Het Grote Probleem: De "Verwarde Bibliothecaris"

Stel je een bibliotheek voor waar alle boeken (kennis) in de taal van de AI geschreven zijn. Als je vraagt: "Wat moet ik doen als het regent én de weg dicht is?", moet de AI alle boeken doorzoeken, samenvatten en hopen dat hij de juiste zin vindt.

  • Het probleem: Bij één vraag lukt dat. Maar bij tien verschillende voorwaarden (regens, weg, tijd, budget, etc.) raakt de AI in de war. Hij begint halve zinnen te combineren die niet kloppen. Het is alsof je probeert een recept te maken door zinnen uit verschillende kookboeken te plakken; het resultaat is vaak onsmakelijk.

2. De Oplossing: PRECEPT (De "Drie-Voudige Superkracht")

PRECEPT lost dit op met drie slimme trucjes:

A. De Perfecte Adreslijst (Deterministische Zoeking)

In plaats van te zoeken in een hoop tekst, geeft PRECEPT elke regel een exact adres (een soort postcode).

  • Analogie: Stel je voor dat je in plaats van te vragen aan een bibliothecaris "Waar staat het boek over regen?", je direct naar Schril 123 loopt. Je vindt het boek direct. Geen gissen, geen "misschien".
  • Het resultaat: De AI maakt geen interpretatiefouten meer. Als de voorwaarden precies overeenkomen met het adres, pakt hij de juiste regel. Dit werkt zelfs als je 10 of 20 voorwaarden tegelijk hebt.

B. De Slimme Hoed (Conflicthantering)

Soms zegt een oud document (statische kennis) "Doe A", maar zegt je ervaring van vandaag (dynamische kennis) "Doe B".

  • Analogie: Stel je voor dat je een oude kaart hebt die zegt dat de brug open is, maar je ziet met je eigen ogen dat hij dicht is. Een normale AI zou verward raken. PRECEPT heeft een Slimme Hoed die zegt: "Hé, mijn ogen (nieuwe ervaring) zijn betrouwbaarder dan die oude kaart. Ik vertrouw de kaart niet meer."
  • Hoe werkt het? De AI houdt bij welke bronnen vaak gelijk hebben en welke niet. Als een oude regel vaak fout blijkt, wordt hij automatisch uitgeschakeld.

C. De Oefenmeester (COMPASS)

Soms is de AI niet alleen verward, maar ook gewoon niet efficiënt. Hij doet dingen in de verkeerde volgorde.

  • Analogie: Stel je voor dat je een sporter traint. De Oefenmeester (COMPASS) kijkt niet alleen of hij wint, maar ook hoe hij wint. Als de sporter een snelle maar onzeker manier gebruikt, probeert de Oefenmeester een nieuwe strategie uit. Hij houdt een lijst bij van de beste manieren om een taak te doen, zodat de AI nooit vastloopt in een slechte gewoonte.

3. Wat levert dit op? (De Resultaten)

In de tests die in het paper worden beschreven, deed deze nieuwe AI het veel beter dan de oude methoden:

  • Sneller: Hij had minder pogingen nodig om een taak te voltooien (zoals iemand die de weg kent, in plaats van iemand die rondrijdt om te zoeken).
  • Betrouwbaarder: Als de wereld verandert (bijvoorbeeld: een nieuwe regel of een gesloten weg), past hij zich direct aan. Oude methoden blijven vastzitten in hun oude, foutieve regels.
  • Niet verwarrend: Zelfs met heel veel regels tegelijk bleef hij kalm en correct, terwijl andere AI's in de war raakten.

Samenvattend: Waarom is dit belangrijk?

Vroeger hoopten we dat AI's "slimmer" zouden worden door ze meer data te geven. PRECEPT leert ons dat structuur belangrijker is dan alleen maar "slimmer" zijn.

Het is het verschil tussen:

  1. Iemand die probeert een complex recept uit het hoofd te onthouden (vaak fouten, vooral als je veel ingrediënten hebt).
  2. Iemand die een perfect georganiseerd kookboek heeft met een index, waar elke stap exact staat beschreven, en die weet welke stappen hij moet overschrijven als de ingrediënten veranderen.

PRECEPT bouwt die perfecte index en dat zelfcorrigerende systeem. Hierdoor kunnen AI's veilig en betrouwbaar worden ingezet voor echte, moeilijke taken zoals logistiek, medische zorg of financiële regels, zonder dat ze in paniek raken of dezelfde fouten blijven maken.