mAceReason-Math: A Dataset of High-Quality Multilingual Math Problems Ready For RLVR

Dit paper introduceert mAceReason-Math, een dataset van meer dan 10.000 hoogwaardige, vertaalde wiskundeproblemen in 14 talen die specifiek zijn ontworpen om Reinforcement Learning with Verifiable Rewards (RLVR) voor meertalige modellen te ondersteunen.

Konstantin Dobler, Simon Lehnerer, Federico Scozzafava, Jonathan Janke, Mohamed Ali

Gepubliceerd 2026-03-12
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

De "McDonald's van Wiskundige Puzzels": Een Verhaal over mAceReason-Math

Stel je voor dat je een enorme bibliotheek hebt vol met de moeilijkste wiskundepuzzels ter wereld. Maar er is één groot probleem: al deze puzzels zijn geschreven in het Engels. Voor een computer (een zogenaamd "groot taalmodel") is het alsof je een supersterke atleet traint, maar alleen in het Engels. Hij wordt een wereldkampioen in het oplossen van Engelse raadsels, maar als je hem vraagt een probleem in het Nederlands, Japans of Swahili op te lossen, staart hij je alleen maar verward aan.

Dit is precies het probleem dat de onderzoekers van Apple en het Hasso Plattner Institute wilden oplossen met hun nieuwe project: mAceReason-Math.

Hier is hoe ze het aanpakken, vertaald naar alledaagse taal:

1. Het Probleem: Alleen Engels is niet genoeg

Vroeger waren er wel wat wiskundepuzzels in andere talen, maar die waren vaak te makkelijk. Het was alsof je een Formule 1-coureur traint op een fietsbaan voor kinderen. Het helpt niet om zijn echte vaardigheden te verbeteren. De beste, moeilijkste puzzels waren allemaal in het Engels.

2. De Oplossing: Een Vertaal- en Schoonmaakfabriek

De onderzoekers hebben een gigantische fabriek opgezet om deze Engelse puzzels om te toveren naar 14 verschillende talen. Maar ze deden het niet zomaar. Ze volgden een strikt proces, alsof ze een dure diamant slijpen:

  • Stap 1: De Vuilnisbak (Schoonmaken)
    Eerst keken ze naar de originele Engelse puzzels. Sommige waren kapot: ze verwezen naar plaatjes die er niet waren, of het antwoord stond al in de vraag zelf (een beetje alsof je een raadsel oplost en het antwoord al op de achterkant van de envelop staat). Die "rotte appels" gooiden ze direct weg.
  • Stap 2: De Vertalers (De AI en de Mens)
    Vervolgens lieten ze een slimme computer (een AI) de puzzels vertalen. Maar een computer kan soms rare fouten maken, zoals het verkeerd interpreteren van wiskundige symbolen of de verkeerde komma's gebruiken (in Nederland gebruiken we een komma voor decimalen, in de VS een punt).
    Daarom kwamen er moedertaalsprekers (echte mensen) kijken. Zij waren de "kwaliteitscontroleurs". Als de computer een fout maakte, corrigeerden de mensen het. Ze zorgden ervoor dat de wiskunde klopte en dat de tekst natuurlijk klinkt in het Italiaans, Chinees of Russisch.
  • Stap 3: De Herhaling (De "Loop")
    Als de vertaling nog niet perfect was, gaf de computer hem een tweede kans. Dit deden ze tot wel vijf keer totdat de puzzel perfect was.

3. Het Resultaat: Een Wereldwijde Wiskundewedstrijd

Het eindresultaat is een enorme verzameling van meer dan 140.000 wiskundepuzzels.

  • Er zijn 14 talen bij, van grote talen als Chinees en Spaans tot kleinere zoals Swahili en Bengaals.
  • Voor elke taal zijn er meer dan 10.000 puzzels.
  • Er is zelfs een "parallele" deel: 7.620 puzzels die in alle talen exact hetzelfde zijn. Dit is als een wereldkampioenschap waar iedereen dezelfde vraag krijgt, zodat je eerlijk kunt vergelijken wie er het beste is.

4. Waarom is dit belangrijk?

Stel je voor dat je een school hebt waar kinderen uit de hele wereld leren rekenen. Als je alleen Engelse boeken hebt, leren alleen de kinderen die Engels spreken goed rekenen. De anderen blijven achter.

Met mAceReason-Math geven onderzoekers nu de tools om computers te leren denken in hun eigen taal. Dit helpt om slimme computers te bouwen die niet alleen Engels begrijpen, maar ook kunnen helpen bij wiskundeproblemen in het Nederlands, het Japans of het Portugees.

Kortom: Ze hebben een sleutel gemaakt die de deur opent naar wiskundige genialiteit voor de hele wereld, niet alleen voor de Engelstalige helft. En ze hebben deze sleutel gratis beschikbaar gesteld voor iedereen die het wil gebruiken!