Synthesizing Interpretable Control Policies through Large Language Model Guided Search
Cet article propose une méthode novatrice utilisant des modèles de langage pour générer et faire évoluer des politiques de contrôle interprétables sous forme de programmes Python, offrant une alternative transparente et modifiable aux approches par réseaux de neurones pour des tâches dynamiques complexes comme le balancement d'un pendule ou la gestion d'une balle dans une coupe.