CONE: Embeddings for Complex Numerical Data Preserving Unit and Variable Semantics

In dit paper stellen de auteurs CONE voor, een hybride transformer-model dat getallen, bereiken en gaussische verdelingen samen met eenheden en attribuutnamen encodeert in een semantisch rijke vectorruimte, waardoor het aanzienlijk betere prestaties behaalt dan bestaande modellen op taken met numeriek redeneren.

Gyanendra Shrestha, Anna Pyayt, Michael Gubanov

Gepubliceerd 2026-03-06
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een zeer slimme robot hebt die alles leest wat er op internet staat. Deze robot is geweldig in het begrijpen van woorden: hij weet dat "hond" en "kat" dieren zijn, en dat "lief" en "mooi" positieve woorden zijn. Maar als je hem vraagt: "Wat is het verschil tussen 10 kilo en 10 kilometer?", dan raakt hij in de war. Voor deze robot zijn het gewoon twee woorden die beginnen met een '1' en een '0'. Hij ziet niet dat het ene gewicht is en het andere afstand.

Dit is precies het probleem waar de auteurs van dit paper, CONE, tegenaan lopen. Bestaande AI-modellen zijn vaak "blind" voor de echte betekenis van getallen, vooral als die getallen een eenheid hebben (zoals euro's, graden, of milligrammen) of als ze een bereik zijn (zoals "tussen 20 en 30 jaar").

Hier is een simpele uitleg van wat ze hebben bedacht, met een paar creatieve vergelijkingen:

1. Het Probleem: De "Blinde" Robot

Stel je voor dat je een lijst hebt met gegevens over mensen.

  • Persoon A is 30 jaar oud.
  • Persoon B heeft 30 minuten gewacht.

Voor een gewone computer zijn "30 jaar" en "30 minuten" bijna hetzelfde. Ze zien alleen het getal "30". Het is alsof je twee verschillende soorten fruit (een appel en een sinaasappel) in een zak doet en ze allebei "rond" noemt. De computer vergeet dat ze van een heel ander type zijn. Dit zorgt voor fouten als de robot moet rekenen of beslissingen moet nemen op basis van data.

2. De Oplossing: CONE (De "Drie-Dimensionale" Vertaler)

De auteurs hebben een nieuw systeem bedacht, genaamd CONE. Ze noemen het een "embeddings"-model, maar je kunt het zien als een slimme vertaler die niet alleen naar het getal kijkt, maar naar het hele plaatje.

In plaats van dat het getal "30" alleen maar een getal is, maakt CONE er een drie-delige identiteitskaart van:

  1. Het Getal: (De "30")
  2. De Eenheid: (Is het "jaar" of "minuut"?)
  3. De Context: (Is het "leeftijd" of "wachtijd"?)

De Metafoor van de Legoblokken:
Stel je voor dat je een getal wilt voorstellen met Legoblokken.

  • Een oude computer pakt één grijs blokje met daarop "30".
  • CONE pakt drie gekleurde blokjes en klikt ze stevig aan elkaar:
    • Een blauw blokje voor het getal (30).
    • Een rood blokje voor de eenheid (jaar).
    • Een geel blokje voor het onderwerp (leeftijd).

Door deze blokjes aan elkaar te klikken, weet de computer: "Ah, dit is een leeftijd van 30 jaar". Als je nu "30 minuten" hebt, zijn de blokjes anders gekleurd (rood = minuut, geel = wachtijd). De computer ziet direct dat dit iets heel anders is, ook al is het getal hetzelfde.

3. Speciale Trucs voor Moeilijke Getallen

Soms zijn getallen niet alleen maar één cijfer. Soms zijn het een bereik (bijvoorbeeld: "tussen 5 en 10 jaar") of een gemiddelde met een foutmarge (bijvoorbeeld: "1302 ± 0,25").

CONE heeft speciale "gereedschapskisten" voor deze gevallen:

  • Voor bereiken: In plaats van het hele getal "5-10" als één rommelig woord te zien, splitst CONE het op in het midden (7,5) en de grootte van het gat (5). Zo begrijpt de robot dat "5-10" en "6-11" heel dicht bij elkaar liggen, maar "5-10" en "20-25" ver uit elkaar.
  • Voor onzekerheid: Als er staat "1302 ± 0,25", ziet CONE dit als een centrale waarde met een kleine "wankelende rand". De robot leert dat dit een heel precieze meting is, en niet zomaar een willekeurig getal.

4. Waarom is dit zo belangrijk?

In de echte wereld zitten we vol met tabellen: medische dossiers (bloeddruk, cholesterol), financiële rapporten (euro's, procenten) en overheidsdata. Als een AI deze data niet goed begrijpt, kan het gevaarlijk of dom zijn.

  • Voorbeeld: Als een arts een AI vraagt om patiënten te vergelijken, wil hij niet dat de AI denkt dat iemand met een tumor van 5 cm hetzelfde is als iemand met een bloedverlies van 5 ml. Voor een oude AI waren het beide "5". Voor CONE is het een groot verschil, omdat de eenheid en het onderwerp anders zijn.

5. De Resultaten: De Robot wordt Slimmer

De auteurs hebben hun nieuwe robot (CONE) getest op enorme hoeveelheden data uit de medische wereld, financiën en het internet.

  • De test: Ze gaven de robot vragen die rekenen vereisten (zoals in de populaire test "DROP").
  • Het resultaat: CONE scoorde veel beter dan alle andere slimme modellen. Het maakte minder fouten en kon veel beter onderscheid maken tussen "5 kilo" en "5 meter".

Conclusie

Kortom: CONE is een manier om computers te leren dat getallen niet alleen cijfers zijn, maar verhalen met een eenheid en een context. Het is alsof je een kind leert dat "5" niet alleen een getal is, maar dat "5 appels" iets heel anders is dan "5 kilometer". Door deze nuance toe te voegen, wordt de AI veel slimmer, veiliger en nuttiger voor het analyseren van complexe data.