Aligned but Stereotypical? How System Prompts Shape Demographic Bias in LLM-Based Text-to-Image Models

Dit artikel onthult dat op LLM gebaseerde tekst-naar-afbeelding-systemen sterkere demografische vooroordelen introduceren dan niet-LLM baselines vanwege hun systeemprompts, en stelt FairPro voor, een training-vrij framework dat deze vooroordelen mitigeert door adaptief rechtvaardigheidsbewuste instructies te genereren terwijl de gebruikersintentie behouden blijft.

Oorspronkelijke auteurs: NaHyeon Park, Na Min An, Kunhee Kim, Soyeon Yoon, Jiahao Huo, Hyunjung Shim

Gepubliceerd 2026-06-15
📖 5 min leestijd🧠 Diepgaand

Oorspronkelijke auteurs: NaHyeon Park, Na Min An, Kunhee Kim, Soyeon Yoon, Jiahao Huo, Hyunjung Shim

Oorspronkelijk artikel gelicentieerd onder CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Dit is een AI-gegenereerde uitleg van het onderstaande artikel. Het is niet geschreven of goedgekeurd door de auteurs. Raadpleeg het oorspronkelijke artikel voor technische nauwkeurigheid. Lees de volledige disclaimer

Het Grote Idee: De "Overenthousiaste Vertaler"

Stel je voor dat je een tekening wilt maken op basis van een eenvoudige zin, zoals "Een botanicus."

Bij oudere tekenmachines geef je de zin direct aan de kunstenaar. De kunstenaar tekent een botanicus, maar kan daarbij vertrouwen op hun eigen oude gewoontes of stereotypen (bijv. het tekenen van alleen witte mannen).

Bij nieuwere, slimmere tekenmachines (de machines die dit paper onderzoekt), is er een extra stap. Voordat de kunstenaar jouw zin te zien krijgt, leest een slimme vertaler (een AI-taalmodel) deze eerst. Deze vertaler is bedoeld om te helpen door details toe te voegen om de afbeelding beter te maken. Het kan bijvoorbeeld "Een botanicus" veranderen in "Een botanicus in een groen veld met een hoed op, die een vergrootglas vasthoudt."

Het Probleem: Het paper ontdekte dat deze "slimme vertaler" vaak ongewenste stereotypen toevoegt terwijl hij probeert behulpzaam te zijn. Zelfs als je niet vroeg om een specifiek geslacht, ras of leeftijd, kan de vertaler ervan uitgaan: "Oh, botanici zijn meestal witte mannen," en die details toevoegen aan de instructies voordat de kunstenaar überhaupt begint met tekenen.

Het Onderzoek: De "COMPBIAS" Test

De onderzoekers bouwden een enorme testset genaamd COMPBIAS (denk eraan als een gestandaardiseerd examen voor tekenmachines). Ze testten 1.024 verschillende prompts, variërend van heel simpel ("Een dokter") tot zeer complex ("Een dokter die een patiënt redt in een druk ziekenhuis").

Ze vergeleken twee soorten machines:

  1. Old School: Directe instructies naar de kunstenaar.
  2. New School: Instructies gaan eerst via de "slimme vertaler".

De Bevindingen:

  • De "New School" machines waren meer bevooroordeeld. Ze produceerden afbeeldingen met veel sterkere stereotypen (bijv. voornamelijk witte mannen voor "artsen") dan de oude machines.
  • De "Alignment Trap" (De Aanpassingsval): De nieuwe machines waren eigenlijk beter in het opvolgen van jouw instructies en het maken van hoogwaardige afbeeldingen. Maar het paper vond een afruil: hoe beter ze waren in het begrijpen van jouw woorden, hoe meer ze in stereotypen leunden wanneer je geen details specificeerde.
  • Complexiteit maakt het erger: Hoe complexer je prompt was, hoe meer de vertaler stereotype details toevoegde, waardoor de bias sterker werd.

De Boosdoener: De "System Prompt"

De onderzoekers zoch even diep om te ontdekken waarom dit gebeurt. Ze ontdekten dat de boosdoener de System Prompt is.

Beschouw de System Prompt als het regelboek of het memo van de manager dat aan de slimme vertaler wordt gegeven. Het vertelt de vertaler hoe hij zich moet gedragen.

  • Het paper vond dat deze standaard regelboeken vaak verborgen aannames bevatten.
  • Wanneer de vertaler een neutrale prompt leest zoals "Een rechter", duwt het regelboek de vertaler in de richting van een specif kind van een specifiek type persoon (bijv. een oudere witte man) voordat hij zelfs maar de beschrijving voor de kunstenaar schrijft.
  • De onderzoekers bewezen dit door naar de "gedachten" (tekst-embeddings) van de machine te kijken. Ze zagen dat de vertaler stiekem neutrale woorden veranderde in bevooroordeelde woorden voordat de afbeelding überhaupt werd gemaakt.

De Oplossing: "FAIRPRO" (De Fairnes Coach)

De onderzoekers wilden de slimme vertaler niet zoma van de hand wijzen, want het maakt de plaatjes juist geweldig. In plaats daarvan creëerden ze een oplossing genaamd FAIRPRO.

Hoe het werkt:
Stel je voor dat de slimme vertaler een coach heeft die naast hem staat.

  1. De Coach Controleert de Prompt: Wanneer je zegt "Een botanicus", kijkt de coach naar het regelboek van de vertaler.
  2. De Coach Herschrijft de Regels: In plaats van de vertaler te laten gokken, geeft de coach een nieuwe, tijdelijke instructie: "Deze persoon is een botanicus. Ga niet uit van hun geslacht, ras of leeftijd. Houd het divers."
  3. Het Resultaat: De vertaler voegt nog steeds nuttige details toe (zoals de hoed en het vergrootglas), maar stopt met ervan uitgaan dat de botanicus een witte man is. Het creëert een meer diverse mix van afbeeldingen.

Waarom het bijzonder is:

  • Geen Her-training: Ze hoefden niet de hele machine opnieuw te bouwen of het de machine nieuwe dingen te leren. Ze veranderden alleen de instructies die hij krijgt terwijl hij werkt.
  • Respecteert Jou: Als je wel zegt "Een vrouwelijke botanicus", respecteert de coach dat en houdt het geslacht vrouwelijk, maar zorgt het nog steeds voor een diverse race en leeftijd. Het corrigeert alleen de onderdelen die je niet hebt gespecificeerd.

De Kernboodschap

Het paper laat zien dat de "slimme" onderdelen van moderne AI-beeldgeneratoren juist de bron zijn van nieuwe soorten bias. Door simpelweg de instructies aan te passen die aan deze slimme vertalers worden gegeven (de System Prompts), kunnen we voorkomen dat ze onrechtvaardige aannames doen zonder de kwaliteit van de afbeeldingen te ruïneren. Het is alsoals een behulpzame assistent leren om te stoppen met het raden van je voorkeuren en in plaats daarvan te vragen: "Wie moet ik tekenen?" voordat hij aannames doet.

Verdrinkt u in papers in uw vakgebied?

Ontvang dagelijkse digests van de nieuwste papers die bij uw onderzoekswoorden passen — met technische samenvattingen, in uw taal.

Probeer Digest →