One2Scene: Geometric Consistent Explorable 3D Scene Generation from a Single Image

One2Scene は、単一画像から没入型の探索可能な 3D 空間を生成するために、パノラマ生成、3D 幾何学的足場へのアップリフト、および新規視点生成という 3 つの段階的なタスクに問題を分解し、大規模なマルチビューデータセットで学習された幾何学的事前知識を活用して、既存の手法が抱える幾何学的歪みやノイズを克服する革新的なフレームワークです。

Pengfei Wang, Liyi Chen, Zhiyuan Ma, Yanjun Guo, Guowen Zhang, Lei Zhang

公開日 2026-03-02
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

1 枚の写真から「中に入れる」3D 世界を作る「One2Scene」の仕組み

この論文は、**「たった 1 枚の写真から、人が自由に歩き回れるような 3D 空間を作れるか?」**という難しい問題を解決する新しい技術「One2Scene(ワンツーシーン)」を紹介しています。

これまでの技術では、1 枚の写真から 3D 空間を作ろうとすると、カメラを少し動かすだけで壁が歪んだり、部屋がぐにゃぐにゃになったりして、まるで夢の中で迷子になったような不自然な映像になってしまっていました。

One2Scene は、この問題を**「3 つのステップ」**に分けて、まるで職人が家を建てるように丁寧に解決します。


ステップ 1:全景パノラマで「地図」を作る

(アナロジー:暗闇で 1 枚の写真しか持っていない状態)

まず、入力された 1 枚の写真(例えば、リビングの一角)だけを見て、その部屋全体がどうなっているか推測します。
AI はまず、その写真から**「360 度パノラマ写真」**(ぐるっと見渡せる全景写真)を生成します。

  • イメージ: 暗い部屋で、壁の一部分しか見えていない状態から、AI が頭の中で「あ、ここは窓があるんだな、向こうはソファがあるんだな」と想像して、部屋全体の全景図(パノラマ)を描き出します。
  • 効果: これで「どこに何があるか」という大まかな**「地図」**が手に入ります。

ステップ 2:2D の地図を「3D の足場」に組み立てる

(アナロジー:平らな地図を、立体的な模型にする)

パノラマ写真はまだ「平らな紙」です。これでは、実際に中を歩き回ったときに壁が透けて見えたり、床が浮いたりしてしまいます。
そこで、One2Scene はこの平らなパノラマを**「6 つの立方体の面(キューブマップ)」**に切り分けます。

  • 工夫: これを「ステレオマッチング(立体視)」の技術を使って処理します。6 つの面が少しだけ重なり合うように設定し、AI が「ここは手前、ここは奥」という**「3D の足場(スキャフォールド)」**を瞬時に組み立てます。
  • 効果: これにより、部屋には「壁の厚さ」や「床の高さ」といった**「物理的なルール(幾何学的な骨格)」**が生まれます。これがないと、後で自由にカメラを動かしたときに世界が崩壊してしまうのです。

ステップ 3:足場を頼りに「新しい景色」を描く

(アナロジー:骨組みがあるから、どんな角度からでもリアルな壁紙を貼れる)

最後に、先ほど作った「3D の足場」を頼りに、AI が新しい角度からの景色を描き出します。

  • 工夫: 従来の AI は「想像力」だけで描こうとして失敗していましたが、One2Scene は**「足場(3D の骨格)」**という確実なガイドラインを持っています。
    • 「足場」は「ここは壁だから、カメラを動かしても壁は消えないよ」と教えてくれます。
    • 「足場」は「ここは奥だから、遠近感はこうなるよ」と教えてくれます。
  • 結果: どれほど大きくカメラを動かしても、壁が歪んだり、部屋が二つに割れたりすることなく、**「本当にそこに人がいるかのような、自然で美しい景色」**が生成されます。

なぜこれがすごいのか?

これまでの技術(WonderJourney や DreamScene360 など)は、1 枚の写真から 3D を作ろうとして、**「魔法のように想像する」**ことに頼りすぎていました。そのため、少しだけ視点を変えると、魔法が解けて「壁が曲がって見える」などのバグが起きやすかったのです。

One2Scene は、**「まず骨格(3D 足場)を固めてから、肉付け(画像生成)をする」**という、まるで建築家のようなアプローチをとっています。

  • 従来の方法: 粘土で像を捏ねる。形を変えようとすると崩れやすい。
  • One2Scene: まず鉄骨(3D 足場)を組み立てて、その上に壁紙や装飾(画像)を貼る。形を変えても鉄骨が支えてくれるので、崩れない。

まとめ

One2Scene は、**「1 枚の写真」を「歩き回れる 3D 世界」に変えるための、新しい「建築ルール」**を見つけ出しました。
これにより、ゲームの背景作りや、バーチャル旅行、不動産の Web 見学など、1 枚の写真から没入感のある 3D 体験を、誰でも手軽に、かつ歪みなく作れる未来が近づきました。