GenePlan: Evolving Better Generalized PDDL Plans using Large Language Models

GenePlan is een nieuw raamwerk dat grote taalmodellen combineert met evolutionaire algoritmen om interpreteerbare, domein-specifieke PDDL-planners te genereren die presteren op het niveau van de state-of-the-art en aanzienlijk beter zijn dan andere LLM-baselines.

Andrew Murray, Danial Dervovic, Alberto Pozanco, Michael Cashmore

Gepubliceerd Wed, 11 Ma
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een super slimme, maar soms wat chaotische assistent hebt die je kunt vragen om een route te plannen voor een vrachtwagen, een robot die blokken moet stapelen, of een agent die kranten moet bezorgen. Je geeft de assistent de regels (in een speciale taal genaamd PDDL) en vraagt: "Hoe kom ik van A naar B met de minste stops?"

Het probleem is dat deze assistent (een Groot Taalmodel of LLM, zoals de AI die dit artikel schreef) vaak wel een goed idee heeft, maar de oplossing niet altijd perfect is. Soms maakt hij een omweg, soms vergeet hij een regel, en soms is de route gewoon niet de kortste.

GenePlan is een nieuwe methode ontwikkeld door onderzoekers van J.P. Morgan om dit probleem op te lossen. Ze noemen het een "evolutionaire planner". Laten we het uitleggen met een paar creatieve vergelijkingen.

1. De "Kookwedstrijd" in plaats van één chef-kok

Stel je voor dat je een perfecte recept wilt voor een taart die in precies 10 minuten klaar is.

  • De oude manier (Chain-of-Thought): Je vraagt één beroemde chef-kok (de AI) om het recept te bedenken. Hij denkt na, schrijft het op, en hopelijk lukt het. Maar als hij een foutje maakt, heb je een mislukte taart.
  • De GenePlan-methode: Je start een kookwedstrijd. Je nodigt 10 chefs uit (een "populatie"). Ze proberen allemaal een recept te bedenken.
    • De chefs die de taart te langzaam bakken of hem verbranden, krijgen een lage score.
    • De chefs die het snelst en lekkerst bakken, krijgen een hoge score.
    • Nu komt het slimme deel: Je neemt de beste chefs en laat hen hun geheimen mixen (zoals een kruising in de natuur). Ze nemen de beste ingrediënten van elkaars recepten en maken een nieuw, nog beter recept.
    • Soms laten ze een beetje "geluk" toe: ze voegen een heel klein, raar nieuw ingrediënt toe (een mutatie) om te zien of dat misschien nog beter werkt.

Dit proces herhalen ze keer op keer. Na een paar rondes (generaties) hebben ze niet zomaar één goed recept, maar een ultieme, geoptimaliseerde taart die perfect is.

2. De AI als "Evolutionair Bioloog"

In de wereld van GenePlan is de AI niet de persoon die het plan direct maakt, maar de bioloog die de evolutie stuurt.

  • De AI kijkt naar de recepten (de Python-code) van de vorige ronde.
  • Hij zegt: "Jullie waren goed, maar jullie maakten te veel omwegen. Laten we de beste stukjes van jullie code samenvoegen en een nieuwe versie maken."
  • De AI schrijft dan de nieuwe code, test hem, en kijkt of het beter werkt.

3. Waarom is dit zo slim?

De onderzoekers hebben dit getest op 8 verschillende soorten puzzels (zoals het verplaatsen van auto's met een veerboot, of het stapelen van zware dozen).

  • Snelheid: Zodra GenePlan de "ultieme planner" heeft gevonden, kan die planner nieuwe problemen oplossen in 0,49 seconden. Dat is sneller dan bliksem!
  • Kwaliteit: De oplossingen die GenePlan vond, waren net zo goed als die van de allerbeste, traditionele planningssystemen (die vaak duizenden keren meer rekenkracht nodig hebben).
  • Kosten: Het kostte slechts ongeveer $1,82 om een planner voor een hele domein te "evoluëren". Dat is heel goedkoop voor zo'n slimme oplossing.

4. Wat levert het op?

Het mooie aan GenePlan is dat het geen "zwarte doos" is. De AI schrijft leesbare Python-code. Je kunt dus echt zien hoe de planner denkt.

  • Bijvoorbeeld: "Neem eerst de zwaarste doos, leg die onderop, en stapel daarna de lichtere erboven."
  • Dit is heel anders dan een AI die gewoon een antwoord geeft zonder te kunnen uitleggen waarom. Hier zien we de logica van de oplossing.

Samenvattend

GenePlan is als een slimme kweektunnel voor ideeën. In plaats van te hopen dat een AI in één keer het perfecte antwoord vindt, laat je de AI duizenden kleine versies van een oplossing "evolueren". De slechte vallen af, de goede worden gemixt en verbeterd, tot er één overblijft die zo efficiënt is dat hij elke puzzel in een flits oplost.

Het is een manier om de creativiteit van AI te combineren met de discipline van evolutie, zodat we niet alleen een oplossing krijgen, maar de beste oplossing.