The Algorithmic Gaze of Image Quality Assessment: An Audit and Trace Ethnography of the LAION-Aesthetics Predictor

Cette étude révèle que le prédicteur LAION-Aesthetics, utilisé pour entraîner des modèles de génération d'images, perpétue des biais culturels et de genre en privilégiant les perspectives occidentales et masculines, ce qui appelle à une évaluation esthétique plus pluraliste.

Jordan Taylor, William Agnew, Maarten Sap, Sarah E. Fox, Haiyi Zhu

Publié 2026-03-10
📖 4 min de lecture☕ Lecture pause café

Each language version is independently generated for its own context, not a direct translation.

Imaginez que vous avez un grand chef cuisinier robot (l'Intelligence Artificielle générative) qui veut apprendre à cuisiner les plus beaux plats du monde. Pour apprendre, ce robot a besoin de millions de recettes et d'images de nourriture. Mais comme il ne peut pas tout manger, il a besoin d'un sommelier (un expert en goût) pour trier les ingrédients et ne garder que les "meilleurs".

Ce papier de recherche, c'est l'histoire de ce sommelier, appelé LAP (le Prédicteur d'Esthétique LAION), et de ce qui se passe quand on lui demande de juger la beauté.

Voici ce que les chercheurs ont découvert, expliqué simplement :

1. Le Sommelier a un Goût Très Étroit

Le robot (comme Stable Diffusion) utilise ce sommelier pour décider quelles images sont "belles" et méritent d'être utilisées pour apprendre.

  • L'analogie : Imaginez que le sommelier est un homme blanc, occidental, qui adore les paysages de montagne, les portraits réalistes et les photos de femmes.
  • La découverte : Quand les chercheurs ont regardé ce que le sommelier choisissait, ils ont vu qu'il gardait tout ce qui ressemblait à l'art occidental classique ou japonais (des paysages, des portraits réalistes). En revanche, il jetait à la poubelle l'art africain, amérindien, islamique ou égyptien. C'est comme si le robot apprenait à cuisiner uniquement avec des ingrédients français et japonais, en ignorant le reste du monde.

2. Le "Regard" du Sommelier est Biaisé

Le papier parle de trois types de "regards" (ou biais) que ce robot a hérités :

  • Le Regard Impérial : Le robot pense que l'art "parfait" doit ressembler à celui des grandes musées occidentaux. Si une œuvre vient d'une culture non-occidentale, le robot la trouve "moche" ou "de mauvaise qualité", même si elle est magnifique.
  • Le Regard Réaliste : Le robot adore le réalisme. Il aime les photos qui ressemblent à la vraie vie. Il n'aime pas l'art abstrait, le cubisme ou les dessins bizarres. C'est un peu comme si quelqu'un disait qu'une photo de votre chat est "de la haute cuisine", mais qu'un tableau de Picasso est "de la nourriture pour chien". Cela limite la créativité du robot.
  • Le Regard Masculin : C'est le plus inquiétant. Le robot garde beaucoup plus d'images où l'on parle de femmes (souvent présentées de manière objectivée) et jette celles où l'on parle d'hommes ou de personnes LGBTQ+. C'est comme si le robot pensait que les femmes sont là pour être regardées, mais que les hommes ou les minorités ne sont pas "esthétiques" assez pour être dans le livre de recettes.

3. D'où vient ce mauvais goût ? (L'Enquête)

Pour comprendre pourquoi ce sommelier a ce goût étrange, les chercheurs ont fait une "enquête policière" (une ethnographie) sur la façon dont il a été construit.

  • La Révélation : Le sommelier n'a pas été créé par une équipe internationale de sages. Il a été créé par un seul homme (le fondateur de l'organisation LAION), qui a pris ses propres goûts personnels et les a mélangés avec des données venant de photographes occidentaux et de passionnés d'IA.
  • Le Problème : C'est comme si un seul chef avait décidé que la "vraie" cuisine du monde, c'est juste ce qu'il aime manger lui-même, et il a programmé le robot pour qu'il pense pareil. De plus, les données utilisées pour l'entraîner venaient surtout d'internautes anglophones et occidentaux.

4. Pourquoi est-ce un problème ?

Si on laisse ce robot continuer à apprendre avec ce "sommelier" biaisé :

  • Il va continuer à produire des images qui ignorent la plupart des cultures du monde.
  • Il va renforcer des stéréotypes (par exemple, montrer les femmes uniquement comme des objets de désir).
  • Il va étouffer l'art moderne et abstrait, car le robot pensera que ce n'est pas "beau".

La Conclusion du Papier

Les chercheurs disent : "Arrêtons de chercher un seul 'juge de beauté' universel."
La beauté est subjective (chacun a son goût). Essayer de résumer la beauté en un seul chiffre (une note de 1 à 10) est une erreur.
Au lieu de dire "Ceci est beau, ceci est moche", nous devrions dire : "Ceci est réaliste", "Ceci est abstrait", "Ceci est inspiré de l'art africain".

En résumé : Ce papier nous met en garde contre le fait de laisser une seule personne (ou un seul algorithme) décider de ce qui est "beau" pour tout le monde. Pour que l'IA soit vraiment inclusive, il faut accepter que la beauté soit diverse, et non pas une copie conforme du goût d'un seul groupe de personnes.