Each language version is independently generated for its own context, not a direct translation.
Stel je voor dat je een wiskundepuzzel moet oplossen, zoals die op de Internationale Wiskunde Olympiade (IMO). Deze puzzels zijn berucht moeilijk. Ze vereisen niet alleen dat je de regels kent, maar ook dat je creatieve "hulplijnen" trekt die je niet direct ziet.
Vroeger waren computers hier slecht in. Ze konden de regels wel, maar ze misten de "flits van genialiteit" om die creatieve lijnen te bedenken. De beste systemen (zoals AlphaGeometry 2) waren als supercomputers die miljoenen keer probeerden, maar ze hadden enorme hoeveelheden data nodig om te leren.
Dit nieuwe papier introduceert InternGeometry. Dit is geen simpele rekenmachine, maar een AI-agent die werkt als een slimme, doorzettingsvermogen hebbende wiskundestudent. Hier is hoe het werkt, vertaald naar alledaagse taal:
1. De Agent: Een Detective met een Onuitputtelijk Notitieblok
Stel je een detective voor die een moordzaak oplost.
- Het probleem: De zaak is complex. De detective moet niet alleen kijken naar wat er is, maar ook bedenken: "Wat als ik hier een extra getuige toevoeg?" of "Wat als ik deze twee lijnen verleng?"
- De oude manier: De oude AI's probeerden willekeurig duizenden dingen en hoopten dat ze iets raakten.
- De nieuwe manier (InternGeometry): Deze AI denkt eerst na (in mensentaal), bedenkt een idee, en zegt dan tegen een strenge "rekenmachine" (een symbolische engine): "Kijk, als ik dit punt hier zet, klopt het dan?"
- Als de rekenmachine zegt: "Ja, dat klopt!", houdt de AI het idee vast.
- Als de rekenmachine zegt: "Nee, dat werkt niet", denkt de AI: "Oké, dat was een slecht idee. Waarom? Wat heb ik geleerd?" en probeert het opnieuw.
2. Het geheugen: De "Gouden Notitie"
Het grootste probleem bij deze puzzels is dat ze zo lang zijn dat je het vergeten bent wat je 50 stappen geleden hebt geprobeerd.
- De oplossing: InternGeometry heeft een dynamisch geheugen. Stel je voor dat de detective een notitieblok heeft. Na elke poging schrijft hij niet alles letterlijk over, maar vat hij samen: "Ik heb geprobeerd lijn X te trekken, dat werkte niet. Maar ik heb wel ontdekt dat hoek A gelijk is aan hoek B."
- Hierdoor kan de agent meer dan 200 keer met de rekenmachine praten over één probleem, zonder de draad kwijt te raken. Hij bouwt stap voor stap een "trap" van kennis op om bij het antwoord te komen.
3. De Leermethode: "Complexiteit-Boosting" (Van Baby tot Olympiër)
Hoe leer je iemand wiskunde? Je begint niet met de moeilijkste vraag van de dag. Je begint met iets simpels.
- De oude fout: Als je een student direct de zwaarste IMO-problemen geeft, geeft hij op. Als je alleen maar simpele sommen geeft, wordt hij niet slim genoeg voor de echte wedstrijd.
- De nieuwe methode (CBRL): De AI krijgt een geautomatiseerde leraar.
- De AI begint met simpele geometrische puzzels.
- Zodra hij die goed kan, maakt de computer automatisch iets moeilijkere puzzels.
- Zodra hij die kan, maakt hij nog moeilijkere.
- Het is alsof je een video-game speelt waarbij het niveau automatisch omhoog gaat zodra je te makkelijk wint. Zo wordt de AI geleidelijk aan een expert, zonder dat mensen handmatig duizenden voorbeelden hoeven te maken.
4. Het Resultaat: Een Gouden Medaille met een Klap
De resultaten zijn verbazingwekkend:
- Data-efficiëntie: De vorige top-systemen hadden 300 miljoen voorbeelden nodig om te leren. InternGeometry deed het met slechts 13.000. Dat is 0,004% van de data! Het is alsof je een taal leert door 100 zinnen te lezen in plaats van de hele bibliotheek.
- Score: De AI loste 44 van de 50 moeilijkste meetkundige problemen op uit de afgelopen 25 jaar. Dat is meer dan het gemiddelde van een gouden medaille-winnaar bij de Olympiade (die gemiddeld 40,9 punten haalt).
- Creativiteit: Soms bedacht de AI een oplossing die zelfs de menselijke winnaars niet zagen. Hij vond nieuwe, elegante manieren om de puzzel op te lossen die niet in de standaardboeken staan.
Samenvattend
InternGeometry is een AI die niet alleen "rekenen" kan, maar ook nadenken, fouten maken, leren van die fouten en creatieve oplossingen bedenken. Door slim te leren (van makkelijk naar moeilijk) en slim te onthouden (via een dynamisch geheugen), heeft deze AI bewezen dat een "algemeen" taalmodel (LLM) net zo goed kan zijn als de gespecialiseerde, zware systemen van vroeger, maar dan veel slimmer en efficiënter.
Het is de eerste keer dat een AI-agent de meetkunde op het allerhoogste niveau onder de knie heeft, en dat met een fractie van de rekenkracht en data die daarvoor nodig was.
Ontvang papers zoals deze in je inbox
Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.