Achieving Olympia-Level Geometry Large Language Model Agent via Complexity Boosting Reinforcement Learning

Le papier présente InternGeometry, un agent LLM entraîné par renforcement à complexité croissante qui résout 44 problèmes de géométrie olympique sur 50 avec une efficacité de données exceptionnelle, surpassant les scores moyens des médaillés d'or grâce à une interaction itérative avec un moteur symbolique pour générer des constructions auxiliaires novatrices.

Haiteng Zhao, Junhao Shen, Yiming Zhang, Songyang Gao, Kuikun Liu, Tianyou Ma, Fan Zheng, Dahua Lin, Wenwei Zhang, Kai Chen

Publié 2026-03-06
📖 4 min de lecture☕ Lecture pause café

Each language version is independently generated for its own context, not a direct translation.

🌟 Le Grand Défi : Résoudre les énigmes de géométrie comme un champion olympique

Imaginez que les problèmes de géométrie du niveau des Olympiades Internationales de Mathématiques (IMO) soient des énormes labyrinthes. Pour en sortir, il ne suffit pas de marcher tout droit ; il faut parfois creuser des tunnels secrets, construire des ponts invisibles ou trouver des passages cachés que personne n'avait vus avant.

Jusqu'à présent, les ordinateurs (les "experts" comme AlphaGeometry 2) étaient capables de résoudre ces labyrinthes, mais ils le faisaient de manière très "bête" : ils essayaient des milliards de combinaisons au hasard, comme un fourmis qui testerait chaque chemin possible en utilisant une quantité astronomique de nourriture (données). C'est efficace, mais c'est lourd et ça ne demande pas vraiment d'intelligence créative.

🚀 La Nouvelle Star : InternGeometry

Les chercheurs de Shanghai ont créé un nouveau personnage : InternGeometry. C'est un agent intelligent (une sorte de super-étudiant) qui ne se contente pas de tester des chemins au hasard. Il réfléchit, planifie et apprend de ses erreurs, exactement comme un humain.

Voici comment il fonctionne, avec trois ingrédients magiques :

1. Le "Crayon Magique" et le "Miroir de Vérité"

Imaginez que notre étudiant a un crayon magique pour dessiner des lignes supplémentaires sur son papier (ce qu'on appelle des constructions auxiliaires).

  • L'action : Il dessine une ligne ou un point.
  • Le miroir : Il utilise ensuite un "miroir de vérité" (un moteur symbolique) qui vérifie instantanément : "Est-ce que cette ligne aide vraiment ? Est-ce que ça mène à la solution ?"
  • La boucle : Si le miroir dit "Non", il efface, réfléchit, et essaie autre chose. Il peut faire cela plus de 200 fois pour un seul problème ! C'est comme un détective qui ne lâche rien, même après des centaines de fausses pistes.

2. La Mémoire Dynamique (Le Carnet de Notes)

Dans un labyrinthe de 200 passages, on oublie vite ce qu'on a essayé il y a 10 minutes.

  • InternGeometry a un carnet de notes intelligent. Au lieu de tout relire (ce qui serait trop long), il résume l'essentiel : "J'ai essayé le pont A, ça a échoué. J'ai essayé le tunnel B, ça a fonctionné un peu."
  • Cela lui permet de ne pas tourner en rond et de garder le cap sur la solution finale.

3. L'Entraînement "Escalade de Difficulté" (CBRL)

C'est ici que la magie opère pour l'apprentissage.

  • Imaginez un entraîneur sportif. Si vous donnez un problème de niveau "Olympiade" à un débutant, il va abandonner. Si vous lui donnez des problèmes trop faciles, il ne progresse pas.
  • L'algorithme CBRL agit comme un coach parfait. Il commence par des problèmes faciles. Dès que l'élève réussit, le coach augmente légèrement la difficulté.
  • C'est comme monter un escalier : on ne saute pas d'un coup au sommet, on monte marche par marche. À force de s'entraîner sur des problèmes de plus en plus durs, l'IA devient un champion.

🏆 Les Résultats : Un Record Étonnant

Le résultat est stupéfiant :

  • Performance : InternGeometry a résolu 44 problèmes sur 50 des Olympiades de 2000 à 2024. C'est mieux que la moyenne des médailles d'or humaines (qui est de 40,9) et mieux que les meilleurs experts précédents.
  • Efficacité : C'est là que ça devient fou. Les anciens experts avaient besoin de 300 millions d'exemples pour apprendre. InternGeometry n'en a besoin que de 13 000.
    • L'analogie : C'est comme si un ancien champion devait lire toute la bibliothèque nationale pour apprendre à jouer aux échecs, alors que notre nouvel étudiant n'a besoin que d'un seul cahier de notes bien rempli pour devenir le meilleur.

🎨 La Créativité : Plus que des maths

Le plus beau, c'est que l'IA ne se contente pas de copier les solutions humaines. Parfois, elle trouve des solutions totalement nouvelles que les humains n'avaient jamais imaginées. Elle invente de nouvelles façons de construire des lignes pour résoudre le problème, montrant une forme de créativité géométrique pure.

En résumé

Cette recherche prouve qu'on n'a pas besoin de "forcer" les ordinateurs avec des milliards de données pour qu'ils deviennent intelligents. En leur apprenant à réfléchir longuement, à apprendre de leurs erreurs et à progresser pas à pas, on peut créer des agents capables de résoudre les problèmes les plus complexes du monde, avec une efficacité et une créativité surprenantes.

C'est le passage d'un ordinateur qui "calcule tout" à un ordinateur qui "comprend et invente".

Recevez des articles comme celui-ci dans votre boîte mail

Digests quotidiens ou hebdomadaires personnalisés selon vos intérêts. Résumés Gist ou techniques, dans votre langue.

Essayer Digest →