DOne: Decoupling Structure and Rendering for High-Fidelity Design-to-Code Generation

Each language version is independently generated for its own context, not a direct translation.

この論文「DOne」は、**「デザイン画像をそのままコードに変える技術」**の新しい画期的な方法を紹介しています。

これまでの技術では、画像を見てコードを作る際に「全体像はわかるけど、細かい部分はボヤけてしまう」あるいは「細かい部分は合うけど、全体の配置が崩れてしまう」というジレンマがありました。これを**「全体と細部の両立」**という課題と呼んでいます。

DOne は、この問題を**「料理のレシピ作り」**に例えると非常にわかりやすくなります。

🍳 従来の方法：「一発で料理を作る」

これまでの AI は、料理の完成写真（デザイン画像）を見て、いきなり「さあ、全部作れ！」と指示を出していました。

問題点： 料理人（AI）が一度に全ての工程（野菜切り、火入れ、盛り付け）を頭の中で同時に行おうとするため、**「肉の切り方が雑」になったり、「皿の配置が歪」**になったりして、完成品が写真と全然違うものになってしまうことがありました。

🍳 DOne の方法：「工程を分けて、プロに任せる」

DOne は、この作業を**「3 つのステップ」**に分け、それぞれの専門家に任せることで、完璧な料理（コード）を作ります。

1. 下ごしらえ（レイアウト分割）

まず、完成写真を見て**「どこに何が入っているか」**を大まかに区切ります。

アナロジー： 料理の「献立表」や「配置図」を作る作業です。「ここはスープのエリア、ここはメインディッシュのエリア」と、大きな枠組みだけを決めます。
DOne の特徴： 従来の「適当に切り取る」方法ではなく、AI が学習して「ここはヘッダー、ここはサイドバー」と意味を理解して区切ります。これにより、全体の構造が崩れるのを防ぎます。

2. 材料の選定（要素の検索）

次に、写真の中の**「小さな部品」**（アイコン、ロゴ、ボタンなど）を正確に探して取り出します。

アナロジー： 冷蔵庫から「ネギ」「トマト」「チーズ」を正確に見つけて、包丁で切っておく作業です。
DOne の特徴： 従来の AI は「小さなネギ」を見逃して「適当な緑の紙」を貼ったりしましたが、DOne は**「極端に細長いもの」や「密集した小さなもの」**も逃さず見つけ出し、正しい素材を用意します。

3. 調理と盛り付け（コード生成）

最後に、先ほど作った「配置図」と「用意した材料」を渡して、**「指示通りに組み立てる」**作業を行います。

アナロジー： 「まずスープをここに置き、次にメインをここに配置し、最後にネギを散らして」という**具体的なレシピ（スキーマ）**に従って、料理を完成させる作業です。
DOne の特徴： AI が「なんとなく」作らず、**「配置図と材料リスト」**という確かな指針を持ってコードを書くため、写真と見比べても「あれ？ここ違う？」というズレがほとんどなくなります。

🌟 なぜこれがすごいのか？

この方法を採用した結果、以下のような素晴らしい効果が得られました。

見た目が本物そっくり： 人間が評価しても、元のデザインとほぼ同じレベルの美しさを再現できました。
作業が 3 倍速く： 開発者が手作業で直す時間が大幅に減り、生産性が劇的に向上しました。
新しい基準の登場： 研究のために、より複雑で本格的な「テスト用デザイン画像（HiFi2Code）」という新しい教材も作られました。

まとめ

DOne は、**「全体を把握する頭脳」と「細部を拾う目」と「指示通りに作る手」**を分業させることで、AI がデザイン画像からコードを作る際の「ボヤけ」や「崩れ」を完全に解決した画期的な技術です。

これにより、デザイナーが描いた美しいデザインを、エンジニアが手作業で一つ一つ直す必要がなくなり、「デザインから Web サイトまで」が瞬時につながる未来が近づいたと言えます。

DOne: Decoupling Structure and Rendering for High-Fidelity Design-to-Code Generation

🍳 従来の方法：「一発で料理を作る」

🍳 DOne の方法：「工程を分けて、プロに任せる」

1. 下ごしらえ（レイアウト分割）

2. 材料の選定（要素の検索）

3. 調理と盛り付け（コード生成）

🌟 なぜこれがすごいのか？

まとめ

DOne: 高忠実度デザイン・ツー・コード生成のための構造とレンダリングの分離に関する技術的サマリー

1. 問題定義：全体性のボトルネック

2. 手法：DOne フレームワーク

(1) 学習済みレイアウトセグメンテーション (Layout Segmentation)

(2) 特殊なハイブリッド要素検索 (Hybrid Element Retrieval)

(3) スキーマ誘導型生成 (Schema-Guided Generation)

3. 主要な貢献

4. 実験結果

5. 意義と結論

DOne: Decoupling Structure and Rendering for High-Fidelity Design-to-Code Generation

🍳 従来の方法：「一発で料理を作る」

🍳 DOne の方法：「工程を分けて、プロに任せる」

1. 下ごしらえ（レイアウト分割）

2. 材料の選定（要素の検索）

3. 調理と盛り付け（コード生成）

🌟 なぜこれがすごいのか？

まとめ

DOne: 高忠実度デザイン・ツー・コード生成のための構造とレンダリングの分離に関する技術的サマリー

1. 問題定義：全体性のボトルネック

2. 手法：DOne フレームワーク

(1) 学習済みレイアウトセグメンテーション (Layout Segmentation)

(2) 特殊なハイブリッド要素検索 (Hybrid Element Retrieval)

(3) スキーマ誘導型生成 (Schema-Guided Generation)

3. 主要な貢献

4. 実験結果

5. 意義と結論

関連論文

Logic-Gated Time-Shared Feedforward Networks for Alternating Finite Automata: Exact Simulation and Learnability

CLPIPS: A Personalized Metric for AI-Generated Image Similarity

Runtime Burden Allocation for Structured LLM Routing in Agentic Expert Systems: A Full-Factorial Cross-Backend Methodology

DarwinNet: An Evolutionary Network Architecture for Agent-Driven Protocol Synthesis

Trustworthy AI-Driven Dynamic Hybrid RIS: Joint Optimization and Reward Poisoning-Resilient Control in Cognitive MISO Networks