IntSeqBERT: Learning Arithmetic Structure in OEIS via Modulo-Spectrum Embeddings

Het paper introduceert IntSeqBERT, een dubbelstroom Transformer-model dat door het combineren van logaritmische magnitude-embeddings en modulo-embeddings de rekenkundige structuur van geheeltallige rijen in de OEIS effectiever leert dan standaard modellen, wat leidt tot aanzienlijk betere voorspellingen van volgende termen via een op het Chinese Reststelling-gebaseerde solver.

Kazuhisa Nakasho

Gepubliceerd 2026-03-09
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

🧠 De Wiskundige Gokker: IntSeqBERT

Stel je voor dat je een enorme bibliotheek hebt vol met rijen getallen. Dit is de OEIS (de Online Encyclopedia of Integer Sequences). In deze bibliotheek staan rijen die variëren van simpele patronen (zoals 1, 2, 3, 4...) tot onbegrijpelijk grote getallen, zoals de hoeveelheid manieren om een heel groot aantal sterren te rangschikken (factoren en exponenten).

Het probleem voor computers is dat ze deze getallen vaak niet begrijpen. Voor een standaard computerprogramma is het getal 1.000.000 slechts een woordje in een woordenboek. Als ze een getal zien dat ze niet kennen (bijvoorbeeld 10.000.000.000), raken ze in de war en zeggen ze: "Ik heb dit woord nog nooit gehoord."

IntSeqBERT is een nieuwe, slimme computer die deze bibliotheek leest, maar op een heel andere manier dan zijn voorgangers.

🎻 Twee Sporen in plaats van Eén

Stel je voor dat je een symfonieorkest hebt. Een standaard computer (de "Vanilla Transformer") luistert alleen naar de melodie (de grootte van de getallen). Maar IntSeqBERT luistert naar twee dingen tegelijk:

  1. De Grootte (De Melodie): Hoe groot is het getal? Is het klein als een muis of groot als een olifant?
  2. De Rest (Het Ritme): Dit is het geheim. Als je getallen deelt door andere getallen (bijvoorbeeld door 2, 3, of 7), wat is dan de rest?
    • Analogie: Denk aan een klok. Als het 13:00 uur is, is dat op de klok 1:00 uur. De "grootte" is 13, maar de "klok-positie" is 1. Veel wiskundige patronen verstoppen zich in deze klok-positie (de rest), niet in de enorme grootte.

IntSeqBERT kijkt naar 100 verschillende klokken tegelijk (van 2 uur tot 101 uur). Het leert dat als een getal op de "2-uurs klok" een rest van 0 heeft, het een even getal is. Als het op de "3-uurs klok" een rest van 1 heeft, is het een specifiek type oneven getal.

🧩 De Puzzel Oplossen: De "Solver"

Het doel van het spel is: "Hier zijn de eerste 10 getallen van een rij. Wat is het 11e getal?"

  1. De Standaard Computer: Probeer het 11e getal te raden door te kijken naar zijn woordenlijst. Als het antwoord een getal is dat niet in zijn lijst staat (bijvoorbeeld een heel groot getal), raadt hij verkeerd.
  2. IntSeqBERT:
    • Het schat eerst hoe groot het getal ongeveer is (de "grootte").
    • Het berekent de resten voor al die 100 klokken (de "ritmes").
    • Dan komt de Solver (de puzzeloplosser) in actie. Deze gebruikt een oude wiskundige truc, de Chinese Reststelling.
    • Analogie: Stel je voor dat je een sleutel zoekt. Je weet niet precies hoe hij eruitziet, maar je weet dat hij:
      • Op de "2-klok" past (even getal).
      • Op de "3-klok" past (rest 1).
      • Op de "5-klok" past (eindigt op 0 of 5).
        De Solver combineert al deze hints om de unieke sleutel (het getal) te vinden die aan alle regels tegelijk voldoet.

🏆 Wat hebben ze ontdekt?

De onderzoekers hebben getest hoe goed dit werkt en ontdekten drie interessante dingen:

  1. Het Ritme is Koning: De computer werd veel beter in het raden van getallen toen hij naar de "klokken" (de resten) keek. Zonder deze klokken was hij veel minder succesvol. Het bewijst dat wiskundige patronen vaak beter te zien zijn in de rest van een deling dan in het getal zelf.
  2. Samenwerking werkt: De "grootte" en de "klokken" werken samen. Als je weet dat een getal een rest van 1 heeft bij deling door 100, helpt dat de computer om de grootte van het getal beter te schatten. Het is alsof je een raadsel oplost: als je weet dat het antwoord een "paard" is, is het makkelijker om te raden of het een "klein paard" of een "groot paard" is.
  3. Grotere hersenen = Beter ritme: Hoe groter het model (meer parameters), hoe beter het werd in het begrijpen van deze complexe ritmes. De grootte van de getallen werd al snel goed voorspeld, maar het begrijpen van de complexe patronen (de resten) bleef verbeteren naarmate het model groeide.

🚀 Het Resultaat

In de test bleek IntSeqBERT 7,4 keer beter dan de oude methode om het volgende getal in een rij te voorspellen.

  • De oude methode had maar 2,6% kans op een goed antwoord.
  • IntSeqBERT had bijna 19% kans.

Dat klinkt misschien niet als 100%, maar in de wereld van wiskundige voorspellingen met enorme getallen is dit een enorme sprong voorwaarts. Het laat zien dat als je computers leert om naar de "resten" (de muziek van de getallen) te luisteren in plaats van alleen naar de "woorden" (de getallen zelf), ze veel slimmer worden in het ontdekken van wiskundige geheimen.

Kortom: IntSeqBERT is een computer die niet alleen naar de grootte van getallen kijkt, maar ook naar hun "klok-ritme", waardoor het veel beter kan voorspellen wat er als volgende in een wiskundige rij komt.