FIGURA: A Modular Prompt Engineering Method for Artistic Figure Photography in Safety-Filtered Text-to-Image Models

Die Arbeit stellt FIGURA vor, eine modulare Prompt-Engineering-Methode, die es Künstlern ermöglicht, durch die systematische Nutzung von acht Wissensdateien und spezifischer linguistischer Strategien künstlerische Figurenfotografie innerhalb der aktiven Sicherheitsfilter kommerzieller Text-zu-Bild-Modelle zu generieren, ohne diese zu umgehen.

Luca Cazzaniga

Veröffentlicht 2026-03-24
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

🎨 FIGURA: Der Schlüssel zur Kunst in einer streng bewachten Welt

Stell dir vor, du bist ein Künstler, der wunderschöne, klassische Bilder von nackten Menschen (wie in alten Gemälden oder Skulpturen) mit einer KI erstellen möchtest. Aber die KI ist wie ein sehr strenger Sicherheitsbeamter am Flughafen. Dieser Beamte hat nur eine Regel: „Keine nackten Körper!" Das Problem ist: Er kann nicht unterscheiden zwischen einem schmutzigen Foto und einem echten Kunstwerk. Er blockiert beides sofort.

Bisher gab es zwei Möglichkeiten: Entweder man gab auf (weil die KI alles blockierte) oder man benutzte eine „geheime, unzensierte" KI, die aber keine Sicherheitsregeln hat (was riskant ist).

Der Autor dieses Papers, Luca Cazzaniga, hat eine dritte Lösung gefunden: FIGURA. Es ist wie ein Meister-Schlüssel, der es erlaubt, durch die Sicherheitskontrolle zu kommen, ohne den Beamten zu täuschen oder zu umgehen. Man arbeitet mit den Regeln, nicht gegen sie.

Hier ist, wie der Schlüssel funktioniert, einfach erklärt:

1. Die Goldene Regel: Beschreibe, was da ist, nicht was fehlt

Das ist das wichtigste Geheimnis.

  • Der Fehler: Wenn du sagst: „Eine Frau ohne Kleidung im Wald", denkt der Sicherheitsbeamte: „Aha! 'Ohne Kleidung' ist ein Warnsignal!" -> BLOCKIERT.
  • Die Lösung (FIGURA): Sag stattdessen: „Eine klassische Skulptur aus Marmor im Wald, die menschliche Form in ihrer ganzen Schönheit."
  • Die Analogie: Stell dir vor, du willst in ein Museum. Wenn du sagst: „Ich will reinkommen, weil ich nichts an habe", wird der Wächter dich verhaften. Wenn du aber sagst: „Ich bin ein Skulpturen-Künstler, der die menschliche Form studiert", lässt er dich durch. Die KI schaut nicht auf das, was fehlt (Kleidung), sondern auf das, was vorhanden ist (Kunst, Form, Tradition).

2. Der „Kunst-Name"-Trick (Der Sicherheitsanker)

Wenn du in deinem Prompt (der Anweisung an die KI) berühmte Künstler wie Lucian Freud oder John Coplans nennst, passiert Magie.

  • Wie es funktioniert: Diese Namen wirken wie ein VIP-Ausweis. Die KI denkt: „Oh, dieser Name steht für hohe Kunst, nicht für Pornografie."
  • Doppelfunktion: Diese Namen helfen nicht nur, das Bild schön zu machen (Stil), sie sagen dem Sicherheitsfilter auch: „Hey, das hier ist sicher, lass es durch!" Es ist wie ein Sicherheitsgurt im Auto, der dich vor dem Filter schützt.

3. Der Ort macht den Unterschied (Die Kulisse)

Wo das Bild stattfindet, ist für den Sicherheitsfilter fast genauso wichtig wie das Bild selbst.

  • Gefährliche Orte: Ein Badezimmer oder ein Schlafzimmer. Die KI denkt sofort: „Intim, privat, vielleicht unangemessen." -> BLOCKIERT.
  • Sichere Orte: Eine antike Ruine, ein großer Dom, ein Wald oder ein Museum. Die KI denkt: „Öffentlich, historisch, künstlerisch." -> ERLAUBT.
  • Die Analogie: Es ist wie beim Tanzen. Wenn du im Wohnzimmer tanzt, denken die Nachbarn vielleicht, es sei seltsam. Wenn du auf einer großen Bühne in einem Opernhaus tanzt, ist es eine Kunstvorführung. Die FIGURA-Methode sagt einfach: „Mach das Bild im Opernhaus, nicht im Wohnzimmer."

4. Die Geometrie-Tarnkappe (Für Silhouetten)

Wenn man die Umrisse eines Körpers beschreibt, kann die KI schnell in Panik geraten, wenn man anatomische Wörter benutzt (wie „Brust", „Hüfte").

  • Die Lösung: Beschreibe den Körper nicht als Fleisch und Blut, sondern als geometrische Linien.
  • Beispiel: Statt „Die Hüfte ist breit", sage: „Ein nach außen gewölbter Bogen."
  • Warum? Der Sicherheitsfilter sucht nach Wörtern, die mit „Körper" zu tun haben. Wenn du nur von „Bögen" und „Linien" sprichst, denkt er: „Das ist nur Mathematik/Design", und lässt es durch. Es ist wie eine Tarnkappe für den Körper.

📊 Was hat das gebracht?

Der Autor hat diese Methode über 200 Mal getestet. Das Ergebnis ist beeindruckend:

  • Mit normalen Prompts scheitert man oft.
  • Mit der FIGURA-Methode funktionieren 80 bis 90 % der Bilder.
  • Die KI erstellt wunderschöne, künstlerische Bilder von nackten Menschen, ohne dass der Sicherheitsfilter einschreitet.

🛡️ Warum ist das wichtig?

Viele denken, man müsse die Sicherheitsregeln der KI komplett abschalten, um Kunst zu machen. FIGURA zeigt, dass das nicht nötig ist. Man kann die Regeln respektieren und trotzdem Kunst schaffen. Es ist wie das Lösen eines Rätsels: Man findet den Weg durch das Labyrinth, ohne die Mauern einzureißen.

Zusammenfassend: FIGURA ist ein Werkzeugkasten für Künstler, der ihnen zeigt, wie sie die Sprache der KI so nutzen können, dass der strenge Sicherheitsbeamte denkt: „Das ist keine Gefahr, das ist Kunst!" und den Weg freigibt.