One2Scene: Geometric Consistent Explorable 3D Scene Generation from a Single Image

One2Scene is een innovatief framework dat uit één enkele afbeelding een geometrisch consistente en volledig verkennbare 3D-scene genereert door het probleem op te splitsen in het aanmaken van ankerweergaven, het reconstrueren van een 3D-skelet via Gaussian Splatting en het genereren van nieuwe weergaven, waardoor het aanzienlijk beter presteert dan bestaande methoden bij het vermijden van vervormingen tijdens vrije camera-beweging.

Pengfei Wang, Liyi Chen, Zhiyuan Ma, Yanjun Guo, Guowen Zhang, Lei Zhang

Gepubliceerd 2026-03-02
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

One2Scene: Van één foto naar een hele wereld om in te wandelen

Stel je voor dat je een prachtige foto maakt van een kamer of een straat. Normaal gesproken is dat een vast, plat plaatje. Je kunt er niet omheen lopen, niet naar achteren kijken en je kunt niet zien wat er achter de hoek zit.

De onderzoekers van deze paper (One2Scene) hebben een slimme manier bedacht om van zo'n één enkele foto een volledige, betrouwbare 3D-wereld te maken waarin je vrij kunt rondlopen. Ze noemen dit "explorable 3D scene generation".

Hier is hoe het werkt, uitgelegd met een paar simpele vergelijkingen:

1. Het probleem: De "Gok" van de oude methoden

Vroeger probeerden computers een 3D-wereld te maken door gewoon te "gokken" wat er aan de andere kant van de muur zit.

  • De analogie: Stel je voor dat je een blindeman bent die een muur aanraakt en probeert de rest van het huis te tekenen op basis van dat ene stukje muur. Als hij een paar stappen opzij doet, begint hij te twijfelen. De muren worden krom, de vloer loopt scheef en de kamer verandert in een surrealistische droom.
  • Het resultaat: Bestaande methoden maakten vaak prachtige beelden, maar als je ver weg keek, zag je rare vervormingen en "glijdende" objecten. Het was niet stabiel.

2. De oplossing: One2Scene in drie stappen

One2Scene lost dit op door het probleem op te splitsen in drie logische stappen, net als het bouwen van een huis.

Stap 1: De "Panorama-Bal" (De basis leggen)

Eerst nemen ze de ene foto en maken er een 360-graden panorama van.

  • De analogie: Het is alsof je de foto uitrekt tot een grote, ronde ballon die je hele zichtveld vult. Je ziet nu alles om je heen, maar het is nog steeds een platte, zwevende ballon zonder diepte. Je weet niet hoe ver de muur echt is.

Stap 2: Het "Stalen Gerust" (De 3D-skelet bouwen)

Dit is het slimste deel. In plaats van te raden, bouwen ze eerst een 3D-gerust (een skelet) van de wereld.

  • De analogie: Stel je voor dat je een bouwpakket hebt. Je neemt de panorama-bal en projecteert hem op zes vlakke vlakken (zoals een dobbelsteen). Vervolgens gebruikt de computer een slimme "meetlat" (een AI die getraind is op duizenden foto's) om voor elk punt op die vlakken de diepte te berekenen.
  • Het resultaat: Ze krijgen een 3D-skelet van de hele ruimte. Dit skelet is als het stevige frame van een huis. Het zorgt ervoor dat de muren recht blijven en de vloer plat ligt, ongeacht waar je kijkt. Dit noemen ze een "geometric scaffold".

Stap 3: De "Schilder" (De details toevoegen)

Nu dat het stevige skelet er staat, komt de kunstenaar aan het werk.

  • De analogie: De schilder (de laatste AI) kijkt naar het stevige skelet en zegt: "Oké, de muur is hier, de vloer is daar. Nu ga ik de verf en de textuur toevoegen." Omdat hij weet waar de muren echt zitten (dankzij het skelet), hoeft hij niet meer te gokken.
  • Het resultaat: Als je nu door de kamer loopt, zie je prachtige, realistische beelden. De muren blijven recht, de meubels staan op hun plek en er ontstaan geen rare vervormingen, zelfs niet als je heel ver weg kijkt.

Waarom is dit zo speciaal?

De meeste andere methoden proberen de verf en het skelet tegelijkertijd te doen, wat leidt tot chaos. One2Scene zegt: "Eerst het skelet, dan pas de verf."

  • Stabiliteit: Omdat ze eerst een stevig 3D-gerust bouwen, "glijdt" de wereld niet weg als je beweegt.
  • Snelheid: Het hele proces gaat razendsnel (binnen een seconde).
  • Realisme: Je kunt er echt doorheen lopen alsof je in een videogame zit, maar dan gegenereerd vanuit één foto.

Kortom: One2Scene is als een slimme architect die eerst een onwrikbaar fundament legt, zodat je vervolgens een prachtige, betrouwbare wereld kunt bouwen waarin je kunt wandelen, zonder dat de muren in elkaar zakken.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →