When both Grounding and not Grounding are Bad -- A Partially Grounded Encoding of Planning into SAT (Extended Version)

Cet article propose une nouvelle approche de planification SAT qui maintient les actions sous forme levée tout en ancrant partiellement les prédicats, permettant une complexité linéaire par rapport à la longueur du plan et surpassant les méthodes actuelles sur des domaines difficiles à ancrer.

João Filipe, Gregor Behnke

Publié 2026-03-23
📖 4 min de lecture☕ Lecture pause café

Each language version is independently generated for its own context, not a direct translation.

🚀 Le Dilemme du Planificateur : Trop gros ou trop lent ?

Imaginez que vous êtes un chef d'orchestre (un planificateur d'IA) chargé d'organiser une symphonie complexe. Votre but est de trouver la séquence parfaite de notes (actions) pour transformer un chaos initial en une mélodie magnifique (l'objectif).

Le problème, c'est que votre partition est écrite dans un langage très abstrait et général (le "lifted"). Par exemple, au lieu d'écrire "Le violoniste Jean joue la note Do", on écrit "Tout violoniste peut jouer n'importe quelle note". C'est élégant et compact, mais l'ordinateur ne peut pas jouer de musique avec des concepts abstraits ; il a besoin de noms précis.

Traditionnellement, les ordinateurs font deux choses :

  1. Tout détailler (Grounding) : Ils écrivent une partition pour chaque violoniste, chaque note, chaque instrument. C'est précis, mais si vous avez 1000 violonistes, la partition devient un livre de 10 000 pages. L'ordinateur s'étouffe (explosion combinatoire).
  2. Tout garder abstrait (Lifting) : Ils essaient de jouer avec les concepts. C'est rapide au début, mais pour vérifier si la musique est juste, ils doivent faire des liens complexes entre chaque note potentielle et chaque musicien potentiel. Plus la symphonie est longue, plus ces liens deviennent un enchevêtrement impossible à démêler (croissance quadratique).

💡 La Solution : L'Approche "Hybride"

Les auteurs de ce papier (João Filipe et Gregor Behnke) proposent une troisième voie, un juste milieu intelligent.

Imaginez que vous organisez un grand banquet avec 1000 invités.

  • L'approche classique (Tout détailler) : Vous imprimez une carte de place pour chaque combinaison possible de chaise et d'invité. C'est énorme.
  • L'approche abstraite (Tout garder flou) : Vous dites "Assieds-toi quelque part", mais vous devez vérifier à chaque seconde si cette personne ne gêne pas les autres, ce qui prend un temps fou.
  • L'approche de ce papier (Partiellement ancré) : Vous gardez les actions floues ("Le serveur apporte un plat"), mais vous gérez les places assises de manière intelligente.

Ils utilisent une astuce appelée Groupes de Mutex Levés (PLMG).

  • Analogie : Imaginez que vous savez qu'un invité ne peut jamais être assis à deux tables en même temps. Au lieu de vérifier chaque chaise individuellement, vous créez un "groupe de chaises" pour cet invité. Vous dites simplement : "L'invité est soit à la table A, soit à la table B, soit nulle part".
  • Cela permet de garder la description de l'état (qui est où) beaucoup plus petite, sans avoir à lister chaque possibilité individuelle.

⚡ Le Résultat : Une Croissance Linéaire vs Quadratique

C'est ici que la magie opère.

  • L'ancienne méthode (LiSAT) : Si vous voulez planifier une action de plus, le travail de l'ordinateur augmente de façon explosive (comme le carré d'un nombre : 2, 4, 9, 16...). C'est comme si chaque nouvelle note ajoutée à la symphonie obligeait à réécrire toute la partition précédente.
  • La nouvelle méthode : Le travail augmente de façon proportionnelle (linéaire : 1, 2, 3, 4...). Ajouter une note ne demande que d'ajouter une petite ligne à la fin.

En résumé :

  1. Actions : On les garde "floues" (lifted) pour ne pas les multiplier inutilement.
  2. État (le monde) : On le "détaille" partiellement en utilisant des groupes logiques (les mutex) pour éviter de lister chaque fait individuellement.
  3. Encodage binaire : Pour les très grands nombres d'objets, ils utilisent une sorte de code binaire (comme des interrupteurs ON/OFF) au lieu de lister chaque objet un par un, ce qui économise énormément d'espace.

🏆 Les Résultats : Qui gagne ?

Les auteurs ont testé leur méthode sur des problèmes difficiles (comme la logistique, les robots, les labyrinthes).

  • Sur les plans courts et optimaux : Leur méthode bat souvent l'état de l'art (LiSAT), surtout dans les domaines où il y a beaucoup d'objets et où les anciennes méthodes s'effondrent sous le poids des détails.
  • Sur les plans longs : Grâce à leur croissance linéaire, ils ne s'essoufflent pas. Là où les autres méthodes deviennent trop lentes, la leur reste efficace.

🎯 Conclusion Simple

Ce papier nous dit qu'on n'a pas besoin de choisir entre "tout détailler" (trop lourd) et "tout garder abstrait" (trop complexe à vérifier). En utilisant une représentation hybride intelligente (garder les actions floues mais structurer l'état avec des groupes logiques), on peut résoudre des problèmes de planification beaucoup plus grands et plus longs que jamais auparavant.

C'est comme passer d'une carte routière dessinée à la main pour chaque kilomètre, à un GPS qui utilise des zones géographiques intelligentes pour vous guider rapidement, même sur un trajet de 10 000 km.