GenePlan: Evolving Better Generalized PDDL Plans using Large Language Models

Le papier présente GenePlan, un cadre novateur utilisant des algorithmes évolutionnaires assistés par des modèles de langage pour générer des planificateurs généralisés interprétables en Python qui surpassent les méthodes basées sur le prompting et rivalisent avec les planificateurs de l'état de l'art en termes de performance et d'efficacité.

Andrew Murray, Danial Dervovic, Alberto Pozanco, Michael Cashmore

Publié Wed, 11 Ma
📖 4 min de lecture☕ Lecture pause café

Each language version is independently generated for its own context, not a direct translation.

🚀 GenePlan : L'Art de faire grandir un "Super-Planificateur"

Imaginez que vous devez organiser un voyage complexe pour des milliers de personnes, avec des règles strictes : qui peut monter dans quel bus, où ils doivent aller, et comment éviter les embouteillages. C'est ce qu'on appelle un problème de planification.

Habituellement, les ordinateurs sont très forts pour résoudre ces énigmes, mais ils doivent recalculer tout le trajet à chaque fois qu'une nouvelle personne s'ajoute au groupe. C'est lent et énergivore.

GenePlan, c'est une nouvelle méthode inventée par des chercheurs de J.P. Morgan qui change la donne. Au lieu de demander à l'ordinateur de résoudre le problème à chaque fois, GenePlan apprend à l'ordinateur à écrire son propre manuel d'instructions (un programme informatique) qui fonctionne pour n'importe quelle situation dans ce domaine.

Voici comment cela fonctionne, étape par étape, avec des analogies simples :

1. Le Défi : L'IA qui "rêve" mais ne "réfléchit" pas assez

Les grands modèles de langage (comme ceux qui écrivent des textes ou du code) sont comme des génies très créatifs mais un peu étourdis. Si vous leur demandez de planifier un trajet, ils peuvent proposer une solution qui semble logique, mais qui contient des erreurs cachées ou qui n'est pas la plus courte. C'est comme si un chef cuisinier vous donnait une recette qui manque de sel ou qui brûle le gâteau.

2. La Solution : L'Évolution par "Survie du Plus Apt"

GenePlan utilise une idée tirée de la nature : l'évolution. Imaginez une pépinière où l'on fait pousser des milliers de plantes (des programmes informatiques).

  • La Graine (Le LLM) : On demande à l'IA de générer une première ébauche de programme (une "plante").
  • Le Test (L'Environnement) : On lance ce programme sur plusieurs problèmes différents.
  • La Sélection (Le Jardinier) :
    • Si le programme plante (fait des erreurs) ou prend trop de temps, il est éliminé.
    • Si le programme fonctionne bien, il est gardé.
  • La Reproduction (La Mutation) : On prend les meilleurs programmes et on demande à l'IA de les "croiser" (mélanger leurs meilleures parties) et de les "muter" (faire de petits changements pour les améliorer).

C'est comme si vous aviez un coach sportif (l'IA) qui entraîne une équipe de coureurs. À chaque séance, il observe qui court le mieux, garde les meilleurs, et leur donne de nouveaux conseils pour courir encore plus vite à la séance suivante. Au bout de quelques générations, vous avez un champion du monde.

3. Le Résultat : Un "Cerveau" sur mesure

À la fin de ce processus, GenePlan ne vous donne pas juste une réponse. Il vous donne un programme Python (un petit logiciel) qui est :

  • Interprétable : On peut le lire et comprendre ce qu'il fait (contrairement à une "boîte noire" mystérieuse).
  • Rapide : Une fois créé, ce programme résout de nouveaux problèmes en moins d'une demi-seconde.
  • Économique : Cela coûte très peu cher (environ 1,80 $ par domaine) pour entraîner ce "cerveau".

4. Pourquoi c'est impressionnant ?

Dans les tests, GenePlan a réussi à créer des planificateurs aussi bons que les meilleurs logiciels spécialisés du monde (qui sont très complexes et lents à exécuter), mais en étant beaucoup plus rapide à utiliser une fois entraîné.

  • Avant (Méthodes classiques) : C'est comme si vous deviez dessiner un itinéraire à la main à chaque fois que vous sortez de chez vous.
  • Avec GenePlan : C'est comme si vous appreniez une fois pour toutes la logique de votre ville, et que vous aviez un GPS intégré dans votre cerveau qui vous dit instantanément le meilleur chemin, peu importe où vous allez.

En résumé

GenePlan, c'est comme un jardinier numérique qui utilise l'intelligence artificielle pour faire évoluer, génération après génération, des programmes informatiques capables de résoudre des énigmes complexes de manière intelligente, rapide et efficace. Au lieu de chercher la solution à chaque fois, il apprend comment chercher la solution.

C'est une avancée majeure car cela rend l'IA plus fiable, plus rapide et moins coûteuse pour des tâches réelles comme la logistique, la gestion de stocks ou l'organisation de ressources.