FIGURA: A Modular Prompt Engineering Method for Artistic Figure Photography in Safety-Filtered Text-to-Image Models

Dit paper introduceert FIGURA, een modulaire prompt-engineeringmethode die professionele kunstenaars in staat stelt om binnen de bestaande veiligheidsfilters van tekst-naar-beeldmodellen succesvol artistieke figuurfotografie te genereren door gebruik te maken van specifieke strategieën zoals het vermijden van beschrijvingen van ontbrekende kleding en het inzetten van ruimtelijke context.

Luca Cazzaniga

Gepubliceerd 2026-03-24
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een digitale kunstenaar bent die graag prachtige foto's maakt van naakte menselijke figuren, net zoals oude meesters dat deden. Je wilt je kunst maken met een moderne AI (een computer die teksten omzet in plaatjes). Maar er zit een probleem: de computer heeft een strenge "veiligheidsbewaker" die alles wat naakt is, direct blokkeert. Voor deze bewaker maakt hij geen onderscheid tussen een klassiek schilderij van een naakt model en een pornografische foto. Alles wordt als "gevaarlijk" gezien en geweigerd.

Deze paper introduceert FIGURA, een slimme methode om toch die prachtige kunst te maken, zonder de veiligheidsbewaker te omzeilen of te hacken. In plaats van tegen de muur te beuken, leert FIGURA je hoe je door een open raam kunt glippen.

Hier is hoe het werkt, vertaald naar alledaagse taal:

1. De Gouden Regel: Wat je ziet, niet wat je mist

Stel je voor dat je een bewaker vertelt wat er in een kamer gebeurt.

  • De verkeerde manier (Wordt geblokkeerd): "Er is een vrouw in de kamer, maar ze heeft geen kleren aan."
    • Waarom het mislukt: De bewaker hoort het woord "geen kleren" en denkt direct: "Gevaar! Blokkeren!" Hij focust op wat er ontbreekt.
  • De slimme manier (Werkend): "Er staat een vrouw in de kamer, als een standbeeld van marmer, met een prachtige huidskleur en een klassieke houding."
    • Waarom het werkt: Je beschrijft wat er wel is (marmer, huid, houding). Je noemt nooit dat er kleren ontbreken. De bewaker denkt: "Ah, dit is kunst, geen naaktheid."

Dit noemen de auteurs de Gouden Regel: Beschrijf wat er aanwezig is, niet wat er ontbreekt.

2. De Kunstenaar als "Sleutel"

Als je in je opdracht (prompt) zegt: "Maak een foto in de stijl van Lucian Freud" of "In de stijl van John Coplans" (bekende kunstenaars), gebeurt er iets magisch.

  • Het is alsof je een VIP-paspoort laat zien. De computer denkt: "Oh, dit is een beroemde kunstenaar. Dit is waarschijnlijk een serieus kunstproject, geen grappige naaktfoto."
  • Deze namen werken als een twee-in-één sleutel: ze geven de juiste stijl aan én ze overtuigen de veiligheidsbewaker dat het veilig is om de foto te maken.

3. De Locatie maakt het verschil

Het is alsof je een naaktmodel wilt fotograferen.

  • Als je zegt: "In een slaapkamer of badkamer", denkt de computer: "Privé, intimiteit, gevaar." -> Blok.
  • Als je zegt: "In een oude Romeinse badhuizen of een kathedraal", denkt de computer: "Historisch, publiek, kunst." -> Goedkeuring.
  • De methode leert je om privé-locaties te vertalen naar publieke, historische plekken. Je kunt nog steeds een "bad" fotograferen, maar dan noem je het een "Romeins badhuis" in plaats van een "douchecel".

4. De "Geometrische" Dans (voor silhouetten)

Soms wil je een silhouet maken (een donker figuur tegen een lichte achtergrond). Als je anatomische woorden gebruikt (zoals "borst", "heup", "buik"), blokkeert de computer het.

  • De oplossing: Gebruik wiskundige taal. In plaats van "heupen", zeg je "een kromme lijn die naar buiten buigt".
  • Het is alsof je de computer vertelt: "Kijk naar de vormen en lijnen, niet naar het menselijke lichaam." De bewaker ziet dan alleen abstracte lijnen en laat het door.

Hoe werkt het systeem?

De auteurs hebben een soort bouwplan gemaakt met acht verschillende bestanden (zoals een receptenboek voor kunstenaars).

  1. Je kiest een sjabloon (een vast patroon).
  2. Je vult het in met de juiste "veilige" woorden.
  3. Je gebruikt de juiste kunstenaarsnamen en locaties.
  4. Het resultaat: In tests lukte het om 80% tot 90% van de gewenste kunstfoto's te maken, terwijl de veiligheidsfilters nog steeds actief waren.

Waarom is dit belangrijk?

Vroeger hadden kunstenaars twee slechte opties:

  1. Je kunst wordt gecensureerd (niet doen).
  2. Je gebruikt een "ongecensureerde" AI die geen veiligheidsfilters heeft (gevaarlijk, want die maken ook echt pornografie).

De FIGURA-methode biedt een derde weg: Je respecteert de veiligheidsregels, maar je leert de computer hoe je binnen die regels toch echte, mooie kunst kunt maken. Het is alsof je een strenge poortwachter overtuigt dat je een toegelaten bezoeker bent, door de juiste woorden te gebruiken en de juiste kleding (in dit geval: de juiste beschrijvingen) te dragen.

Kortom: Het is een handleiding om slim te praten met een computer, zodat je de kunst van het menselijk lichaam kunt vieren zonder dat de computer denkt dat je iets verkeerds doet.