Quantifying and extending the coverage of spatial categorization data sets

Dit artikel toont aan dat labels gegenereerd door grote taalmodellen goed overeenkomen met menselijke labels en kunnen worden gebruikt om ruimtelijke categorisatiedatasets, zoals de TRPS, efficiënt uit te breiden voor betere dekking van scènes en talen.

Wanchun Li, Alexandra Carstensen, Yang Xu, Terry Regier, Charles Kemp

Gepubliceerd Wed, 11 Ma
📖 5 min leestijd🧠 Diepgaand

Each language version is independently generated for its own context, not a direct translation.

Hoe AI ons helpt om de wereld in woorden te vangen: Een verhaal over ruimtelijke taal

Stel je voor dat je een enorme, lege kaart hebt. Deze kaart is niet van land en water, maar van ruimtelijke relaties: hoe we dingen ten opzichte van elkaar beschrijven. Is de kop op het tafelblad? Is de vis in de kom? Of staat hij er naast?

Elke taal in de wereld heeft zijn eigen manier om deze kaart in te vullen. In het Nederlands zeggen we misschien "onder", terwijl een ander volk datzelfde beeld misschien beschrijft met een woord dat "hangend" betekent. Taalkundigen willen deze verschillen bestuderen, maar ze zitten met een groot probleem: ze hebben geen complete kaart. Ze hebben alleen een paar oude, willekeurige plekken op de kaart die ze al hebben gemarkeerd.

Dit artikel vertelt het verhaal van hoe onderzoekers, met hulp van Kunstmatige Intelligentie (AI), deze kaart eindelijk compleet maken.

1. Het oude probleem: De "Topografische" puzzel

Sinds jaar en dag gebruiken onderzoekers een set van 71 plaatjes (de TRPS) om te kijken hoe mensen ruimtelijke relaties benoemen. Het is als een oude, uitgeknipte puzzel. Hij is handig, maar hij dekt niet alles. Er zijn veel situaties die op de puzzel ontbreken, zoals "tussen de bloemen" of "links van de boom".

Vroeger moesten onderzoekers zelf nieuwe plaatjes bedenken en mensen vragen ze te labelen. Dat is heel veel werk, vooral als je het in 50 verschillende talen wilt doen. Het is alsof je probeert een wereldwijde atlas te tekenen door alleen maar met de hand te tekenen, terwijl je duizenden landen moet afdekken.

2. De nieuwe oplossing: De AI als "Super-Vertaler"

De onderzoekers (Li, Carstensen, Xu en anderen) hadden een slim idee. Waarom niet een Groot Taalmodel (LLM) – zoals de AI die je nu gebruikt – vragen om de puzzelstukjes in te vullen?

Ze gaven de AI 220 plaatjes en vroegen: "Hoe zou een moedertaalspreker van het Chinees, het Spaans of het Japans deze situatie beschrijven?"

De test:
Eerst twijfelden ze. Werkt een computer wel goed genoeg? Kunnen ze de AI vertrouwen?
Ze lieten de AI de oude 71 plaatjes labelen en vergeleken dit met wat echte mensen hadden gezegd. Het resultaat? De AI deed het verrassend goed!

  • De analogie: Het is alsof je een nieuwe student vraagt om een examen te maken. Als die student bijna hetzelfde antwoord geeft als de beste docent, dan mag je die student misschien wel helpen met het nakijken van de rest van de klas. De AI is die slimme student die de basisbegrippen snapt.

3. De "Afdekkings-meter": Hoe vullen we de gaten?

Nu de AI betrouwbaar bleek, gebruikten ze hem als een radar.

Stel je voor dat je een net hebt om vissen te vangen (de data-set). Je wilt weten of je net groot genoeg is om alle soorten vissen te vangen, of dat er nog gaten in zitten waar de vissen doorheen zwemmen.

  • De onderzoekers lieten de AI alle 220 mogelijke plaatjes labelen in 23 talen.
  • Vervolgens maten ze met een wiskundige formule (de "coveragemeter") hoe goed een set plaatjes de hele wereld van mogelijke situaties afdekt.

Het resultaat:
Ze ontwierpen een nieuwe set van 42 plaatjes (de LCXRK-set).

  • De oude sets (TRPS, Zhang, LJSP) waren als netten met kleine gaten: ze misten belangrijke situaties.
  • De nieuwe set vulde precies die gaten op. Het was alsof ze eindelijk de "gaten" in hun net dichten met stukken die precies de vorm hadden van de vissen die eerder ontsnapt waren.

4. Welke talen moeten we toevoegen?

De AI hielp ook bij een andere vraag: "Welke talen moeten we bestuderen?"
Stel, je hebt al data van het Engels, Chinees en Frans. Welke taal voegt het meest toe aan je kennis?

  • De AI keek naar de "afstand" tussen talen. Als twee talen heel veel op elkaar lijken (zoals Chinees en Kantonees), hoef je ze niet allebei direct te testen.
  • Maar talen die ver weg staan in het "taal-landschap" (zoals Portugees of Roemeens in dit onderzoek), zijn goud waard. Ze vullen de gaten in je kennis het snelst op.

De conclusie: Een samenwerking tussen mens en machine

Dit artikel zegt niet dat we mensen niet meer nodig hebben. Integendeel!

  • De AI is de ontdekkingsreiziger die snel de hele wereldkaart verkent en zegt: "Hier en hier zijn nog grote witte vlekken!"
  • De mensen zijn de cartografen die die specifieke plekken dan met zorg en precisie gaan inkleuren.

Samengevat in één zin:
Door slimme AI te gebruiken als een kompas, kunnen onderzoekers nu veel sneller en slimmer bepalen welke plaatjes en welke talen ze moeten bestuderen, zodat we eindelijk een complete kaart krijgen van hoe de hele wereld de ruimte in woorden vult.

Het is alsof je eindelijk een GPS hebt gekregen voor een wereld die tot nu toe alleen maar met schetsen was ingevuld.