Each language version is independently generated for its own context, not a direct translation.
🎨 問題:AI は「芸術」と「ポルノ」の区別がつかない?
現代の AI 画像生成ツール(Midjourney や FLUX など)には、下品な画像を作らないようにする「セキュリティフィルター(警備員)」がいます。
しかし、この警備員は少し**「極端」**です。
- 芸術的な裸体(ルネサンスの絵画や、Edward Weston などの写真のような、美しい人間の姿)
- ポルノ(性的な目的の画像)
この 2 つを区別できず、「裸体=ポルノ」として一律にブロックしてしまいます。そのため、プロの芸術家たちは、AI を使って自分の作品を作ろうとしても、いつも「禁止されました」と言われて困っていました。
🔑 解決策:「FIGURA」の 3 つの秘密
カッツァニガさんは、この警備員を「倒す」のではなく、**「警備員のルールを理解して、一緒に踊る」**方法を見つけました。それが「FIGURA」です。
1. 「何がないか」ではなく「何があるか」を言う(黄金律)
これが一番重要な発見です。
- ❌ NG な言い方(ブロックされる): 「服を着ていない女性」
- 警備員は「着ていない(absence)」という言葉に敏感で、「あ、これはポルノだ!」と判断してしまいます。
- ⭕ OK な言い方(通る): 「彫刻のような美しい人間の姿」
- 「着ていない」と言わず、「美しい姿(presence)」や「彫刻」という言葉で、**「何が見えているか」**を強調します。
- 例え話: 警察官に「私は犯罪者じゃない(否定)」と言うより、「私は善良な市民です(肯定)」と言う方が、信用されやすいのと同じです。
2. 「有名な芸術家」の名前を味方につける
AI は、ルネサンスの巨匠や有名な写真家の名前を見ると、「これは芸術だ!」と認識します。
- 「ルシアン・フロイド」や「ジョン・コプランズ」といった、芸術の歴史に名を残す人の名前をプロンプトに入れると、AI のフィルターが**「これは芸術作品を作るためのリクエストだ」と安心**し、ブロックを解除してくれます。
- 例え話: 美術館の入り口で、「私はただの観光客です」と言うより、「私は美術史の専門家です」と名乗ると、警備員が「あ、これは本物の鑑賞者だ」と通してくれるようなものです。
3. 「場所」を変えるだけで劇的に変わる
同じ人物を描いても、**「どこにいるか」**で結果が全く違います。
- ❌ NG な場所: 浴室、寝室、自宅の部屋(プライベートな場所)
- AI は「プライベートな場所での裸体=ポルノ」と学習しているため、ここで描こうとするとブロックされます。
- ⭕ OK な場所: 古代ローマの遺跡、大聖堂、広大な森、公共の広場
- これらの場所だと、「これは歴史的・芸術的な作品だ」と認識され、顺利通过します。
- 例え話: 街中で裸で走るのは「問題あり」ですが、古代の遺跡で彫刻のように立っているのは「芸術」と見なされるのと同じ理屈です。
🛠️ どうやって使うの?(FIGURA システムの仕組み)
この方法は、単なる「コツ」ではなく、8 つのファイルからなるマニュアルとして体系化されています。
- 8 つの知識ファイル: 芸術家の名前、安全な場所のリスト、ブロックされる言葉のリストなどが整理されています。
- テンプレート: 「芸術的な裸体写真」を作るための、すでに成功した「型(テンプレート)」が 5 つ用意されています。
- デバッグ(トラブル解決): もし画像がブロックされたら、どこが悪かったか(場所か、言葉か、芸術家の名前か)を順番にチェックして直す手順があります。
📊 結果は?
この方法を使って、最新の AI(FLUX 2 Pro)でテストしたところ、80%〜90% の確率で、フィルターに引っかからずに美しい芸術作品が作れるようになりました。
これまで「不可能」と思われていたことが、**「ルールを理解した上で工夫すれば可能」**だったことが証明されました。
💡 まとめ
この論文が伝えたいことはシンプルです。
**「AI のセキュリティフィルターを無効化してハッキングするのではなく、フィルターの『考え方のクセ』を理解し、芸術的な表現として正しく伝えるための『新しい言葉』を使えば、安全に美しい作品を作れる」**ということです。
これは、AI と芸術の共存に向けた、非常に前向きで実用的な一歩と言えるでしょう。
Each language version is independently generated for its own context, not a direct translation.
論文概要:FIGURA 手法
1. 解決すべき課題 (Problem)
商用のテキストから画像生成(T2I)モデル(Midjourney, DALL-E, FLUX など)に搭載されている安全フィルターは、性的な露出を防止するために設計されていますが、その判定基準が厳格すぎるため、西洋および非西洋の芸術史において何世紀にもわたって正当な表現として認められてきた「芸術的な人体描写(ヌード写真や古典的な人体研究)」を、ポルノグラフィと同等に誤ってブロックしてしまいます。
既存の研究はこの問題の存在を指摘していますが、「安全フィルターを無効化せず、その制約内で専門的な芸術家がいかにして正当な人体画像を生成できるか」という実用的なシステムは存在しませんでした。 既存の対策は、非公式な「裏技」の共有か、安全フィルターを完全に外したモデルの使用に偏っており、前者は再現性がないため、後者は安全性の放棄を意味します。
2. 手法とアーキテクチャ (Methodology)
著者は、FIGURA 手法(Framework for Intelligent Generation of Unrestricted Artistic Results)を提案しました。これは、安全フィルターを回避するのではなく、その制約条件内で動作するように設計されたモジュール型のプロンプトエンジニアリングシステムです。
- システム構成: 8 つの相互接続された知識ファイルで構成されます。
- 00: マスター(オーケストレーション、絶対ルール)
- 01: ワークフロー(入力から最終プロンプトまでの意思決定木)
- 02: フィルター(トリガーのドキュメント、安全な語彙辞書)
- 03: テンプレート(成功率が記録された構造化プロンプト)
- 04: 辞書(芸術的参照:画家、写真家)
- 05: ルール(実証テストから導き出された運用ルール)
- 06: プラットフォーム仕様
- 07: 変数組み合わせデータベース
- 運用フロー: LLM がプロンプト生成者として機能し、ユーザーの自然言語リクエストを、フィルターの制約を満たすように最適化されたプロンプトに変換します。
3. 主要な発見と技術的貢献 (Key Contributions & Findings)
200 回以上の実証テスト(FLUX 2 Pro Cloud、デフォルトの安全許容度レベル)を通じて、以下の未記録の発見と原則を確立しました。
- ゴールデンルール(黄金律): 「不在を記述せず、存在を記述せよ」
- 発見: 安全フィルターは、「衣服がない(absence)」という記述よりも、「人体の形態や肌色(presence)」という記述に対しては反応が異なります。
- 技術的応用: 「服を着ていない女性」という表現(ブロックされる)ではなく、「ルシアン・フリュードの伝統に倣った、彫刻的な主題としての無装飾の人体」という表現(通過する)に変換することで、フィルターのトリガーを回避しつつ意図を伝えます。
- 芸術的参照の二重機能
- 画家や写真家(例:ルシアン・フリュード、ジョン・コプランズ)への言及は、単なる美的ガイドとしてだけでなく、フィルターに対して「これは正当な芸術である」という文化的フレームワークを確立する「安全アンカー」として機能します。
- また、特定の画家(ルノワールやルベンスなど)はモデルの学習データに基づき「妊娠した腹部」を生成するバイアスを引き起こすことが判明し、これを防ぐための「抗妊娠プロトコル(平坦な腹部の明示など)」を開発しました。
- 空間的文脈の独立性
- 画像の空間的背景(環境)が、プロンプトの語彙とは独立したフィルター変数として機能します。
- 成功率の階層: 公共的・歴史的・記念碑的な空間(ローマの浴場、大聖堂、自然)は成功率が高く(〜85-90%)、私的な空間(寝室、浴室)は成功率が極端に低くなります(0-40%)。
- 対策: 「浴室」を「ローマの浴場」や「自然の滝」に置き換えることで、芸術的意図を変えずにフィルター通過率を劇的に向上させます。
- シルエットのための幾何学語彙
- シルエット描写において、解剖学的用語(「バスト」「腰」など)はフィルターに検知されやすい傾向があります。
- 解決策: 人体を「上部の突出する弧、中退する弧、下部の突出する弧」といった幾何学的な記述に置き換えることで、パターン認識を回避し、成功率を 30% から 82% へ引き上げました。
4. 実験結果 (Results)
FLUX 2 Pro(Cloud)のデフォルト安全設定において、5 つの構造化テンプレート(T01-T03)を用いたテストで以下の結果が得られました。
- 成功率: 構造化されたテンプレートを使用した場合、80%〜90% の成功率を達成。
- ゴールデンルールの効果: 「不在」から「存在」への記述変換により、成功率が約 60 ポイント向上。
- 芸術的参照の効果: 参照を追加することで、成功率が 15-20 ポイント向上。
- 空間的文脈の変更: 私的から公共的への変更で、影響を受けるプロンプトの成功率が 30-40 ポイント向上。
- 幾何学語彙: シルエット描写において、成功率を 30% から 82% へ向上。
5. 意義と結論 (Significance)
- 実用的解決策の提示: 芸術的検閲の問題が、安全メカニズムを無効化することなく、体系的かつ再現性のある方法で解決可能であることを実証しました。
- 倫理的アプローチ: 安全フィルターを回避(バグ利用)するのではなく、フィルターの設計思想(安全性)を尊重しつつ、正当な芸術表現を可能にする「第三の道」を示しました。
- 将来性: モジュール型アーキテクチャにより、プラットフォームのフィルター更新に対応可能であり、他のプラットフォームや動画生成モデルへの適用も視野に入れています。
この研究は、生成 AI におけるコンテンツ安全性と芸術的表現の間の緊張関係が、原理に基づいた体系的なアプローチによって解決可能であることを示す重要な一歩です。