GAR: Generative Adversarial Reinforcement Learning for Formal Theorem Proving
Ce papier présente GAR, un cadre d'apprentissage par renforcement adversarial qui entraîne conjointement un générateur de problèmes et un prouveur dans une boucle itérative, permettant d'améliorer significativement l'efficacité de l'entraînement et la performance des modèles sur la preuve de théorèmes formels complexes.