Each language version is independently generated for its own context, not a direct translation.
CompDiff: De "Lego-meester" voor eerlijke medische foto's
Stel je voor dat je een kunstenaar bent die foto's maakt van mensen voor een medische studie. Je wilt dat je kunstwerk zo eerlijk mogelijk is: foto's van oude mensen, jonge mensen, mannen, vrouwen, en mensen van alle verschillende achtergronden moeten er allemaal even goed uitzien.
Het probleem is dat de kunstenaars (de computerprogramma's) die we vandaag de dag gebruiken, vaak een slechte gewoonte hebben. Ze zijn getraind op foto's waar veel witte mannen op staan, maar heel weinig foto's van bijvoorbeeld een oudere Aziatische vrouw. Als je de computer vraagt om een foto van die specifieke vrouw te maken, komt hij in de problemen. Hij probeert het, maar het resultaat ziet er wazig, raar of zelfs onherkenbaar uit.
De auteurs van dit paper noemen dit het "ongelijkheids-probleem": de kunstenaar is zelf niet eerlijk, dus hij kan geen eerlijke foto's maken voor iedereen.
De oude manier: "Meer oefenen" werkt niet
Vroeger probeerden onderzoekers dit op te lossen door de computer te dwingen om meer aandacht te besteden aan de zeldzame groepen. Het was alsof je een leerling die slecht wiskunde doet, dwingt om 10 uur per dag te oefenen, terwijl hij al 10 uur per dag wiskunde doet. Het helpt niet echt als de leerling de basisconcepten nog niet snapt.
De nieuwe manier: CompDiff (De Lego-benadering)
De auteurs van dit paper, Mahmoud Ibrahim en zijn team, hebben een slimme nieuwe manier bedacht die ze CompDiff noemen. In plaats van de computer te dwingen om meer te oefenen, geven ze hem een nieuwe manier van denken.
Stel je voor dat je een enorme doos met Lego-blokken hebt.
- Je hebt blokken voor "Leeftijd" (oud, jong).
- Je hebt blokken voor "Geslacht" (man, vrouw).
- Je hebt blokken voor "Herkomst" (Aziatisch, Europees, etc.).
De oude computers probeerden een foto te maken alsof ze een compleet, nieuw Lego-kasteel moesten bouwen voor elke combinatie. Als ze nooit een "Oud-Aziatisch-Vrouwelijk" kasteel hadden gezien, wisten ze niet hoe ze die moesten bouwen.
CompDiff werkt als een echte Lego-meester.
Deze computer heeft een speciale module (de Hierarchical Conditioner Network) die de blokken eerst loskoppelt. Hij leert eerst perfect hoe je een "Oud"-blok bouwt, hoe je een "Aziatisch"-blok bouwt en hoe je een "Vrouwelijk"-blok bouwt.
Als je nu vraagt om een foto van een "Oude Aziatische Vrouw", pakt de computer gewoon die drie losse, goed gebouwde blokken en plakt ze aan elkaar. Omdat hij de losse onderdelen al perfect kent, kan hij ook de combinatie maken die hij nog nooit eerder heeft gezien. Dit noemen ze compositional generalization (samenstellende generalisatie).
Wat levert dit op?
- Beter voor iedereen: De foto's die de computer maakt zijn scherper en realistischer, niet alleen voor de grote groepen, maar ook voor de zeldzame groepen.
- Eerlijkheid: De kwaliteit van de foto's is nu voor iedereen gelijk. Er is geen "wazige foto" meer voor de zeldzame groepen.
- Beter voor artsen: Als artsen deze gegenereerde foto's gebruiken om hun diagnose-apparatuur te trainen, maken die apparaten minder fouten. Ze zien bijvoorbeeld ziektes bij vrouwen van verschillende achtergronden net zo goed als bij mannen.
De conclusie in één zin
In plaats van de computer te dwingen om meer te oefenen op moeilijke gevallen, geven we hem een slimme bouwset (Lego) zodat hij zelfstandig nieuwe combinaties kan maken. Hierdoor worden medische foto's niet alleen mooier, maar ook eerlijker voor iedereen, ongeacht hun leeftijd, geslacht of afkomst.
Het is een stap in de richting van een toekomst waarin kunstmatige intelligentie niemand uitsluit, zelfs niet als de data daarvoor schaars is.
Verdrinkt u in papers in uw vakgebied?
Ontvang dagelijkse digests van de nieuwste papers die bij uw onderzoekswoorden passen — met technische samenvattingen, in uw taal.