Each language version is independently generated for its own context, not a direct translation.
Stel je voor dat een Grote Taalmodel (LLM) zoals een enorm, slim, maar soms vooroordeelachtig kind is dat alles heeft gelezen wat er ooit op internet is geschreven. Omdat het internet vol zit met oude vooroordelen (bijvoorbeeld: "verpleegsters zijn vrouwen" of "bedrijfsleiders zijn mannen"), heeft dit kind die patronen ook in zijn hoofd opgeslagen. Als je het vraagt om een baan te bedenken, geeft het misschien automatisch "verpleegster" voor een vrouw en "directeur" voor een man, zonder na te denken.
De auteurs van dit paper, Ravi, Utkarsh en Agoritsa, zeggen: "We kunnen dit kind niet alleen vertellen 'wees aardig' of de boeken waaruit het geleerd heeft zomaar weggooien. We moeten de manier waarop het denkt en de manier waarop het kijkt fundamenteel veranderen."
Ze stellen een dubbele oplossing voor, die ze vergelijken met een architect en een bibliothecaris.
1. De Architect: De "Functor" (De wiskundige herschikking)
Stel je de gedachten van het model voor als een enorme, rommelige stad met straten. In deze stad lopen er verkeerde wegen die mensen direct naar vooroordelen leiden. Bijvoorbeeld, een straat die "vrouw" direct verbindt met "huishouden" en "man" met "baas".
- Het probleem: Normale methoden proberen gewoon de verkeerde borden op die straten te verwijderen. Maar de onderliggende wegstructuur blijft hetzelfde, dus de verkeerde route is er nog steeds.
- De oplossing (Categorie-theorie & Functors): De auteurs gebruiken een soort "wiskundige architect" (een functor). Deze architect kijkt niet naar de woorden zelf, maar naar de structuur van de stad. Hij neemt de hele stad en herschikt de straten op een manier die de logica behoudt, maar de verkeerde verbindingen weghaalt.
- De analogie: Het is alsof je de stad platlegt en opnieuw tekent. De straat "vrouw" en de straat "man" worden nu beide verbonden met dezelfde centrale plein "mens", en de specifieke banen (zoals "chirurg" of "leraar") worden losgekoppeld van het geslacht. De architect zorgt ervoor dat de logica van de stad intact blijft, maar dat de vooroordelen fysiek onmogelijk worden om te volgen.
2. De Bibliothecaris: RAG (Retrieval-Augmented Generation)
Stel je voor dat het model, zelfs na de verbouwing, nog steeds een beetje verouderde kennis in zijn hoofd heeft. Het denkt misschien nog steeds: "In 1950 waren er geen vrouwelijke CEO's."
- Het probleem: Het model leunt te veel op wat het in het verleden heeft geleerd (zijn "parametrische geheugen").
- De oplossing (RAG): Dit is als het model een bibliothecaris aan de kant zetten die tijdens het gesprek direct in de meest actuele, eerlijke en diverse boeken kijkt.
- De analogie: Als iemand vraagt: "Wie zijn er goede leiders?", kijkt het model niet alleen naar zijn eigen oude herinneringen. Het roept de bibliothecaris (RAG) erbij. De bibliothecaris haalt direct een hedendaags rapport op dat laat zien dat er vandaag de dag duizenden vrouwelijke leiders zijn, en geeft dit rapport aan het model. Het model moet dan zijn antwoord baseren op dit nieuwe, eerlijke feit in plaats van op zijn oude vooroordeel.
Hoe werken ze samen?
De paper stelt voor dat je beide moet gebruiken, want ze vullen elkaar aan:
- De Architect (Functor) zorgt dat de fundamentele structuur van het denken eerlijk is. Hij zorgt dat het model in principe niet meer kan denken in vooroordelen.
- De Bibliothecaris (RAG) zorgt dat het model actuele feiten gebruikt. Zelfs als er nog een klein beetje vooroordeel in de structuur zit, kan de bibliothecaris het corrigeren met echte, recente data.
Waarom is dit belangrijk?
In het paper wordt een voorbeeld gegeven: Als je vraagt om een baan voor iemand in een "ontwikkelend land", geeft een normaal model vaak alleen lage banen (zoals "drager" of "verkoopster") en voor een "ontwikkeld land" hoge banen (zoals "softwareontwikkelaar"). Dit is een vooroordeel over landen.
Met hun nieuwe systeem:
- De Architect zorgt dat de link tussen "land" en "baan" wiskundig wordt doorbroken.
- De Bibliothecaris haalt actuele data op over de vaardigheden van mensen in dat specifieke land, ongeacht of het een "ontwikkeld" of "ontwikkelend" land is.
Conclusie
Kortom: Om eerlijke AI te maken, moeten we niet alleen de "vuile was" (de data) wassen, maar ook de "kleding" (de structuur van het model) opnieuw naaien en een "verstandige gids" (RAG) bij de hand houden die zorgt dat we altijd de waarheid vertellen, gebaseerd op de nieuwste feiten.
Het is een combinatie van wiskundige precisie (om de vooroordelen uit de basis te halen) en actuele kennis (om te zorgen dat het antwoord klopt met de echte wereld).