Imagine a City: CityGenAgent for Procedural 3D City Generation

CityGenAgent is een natuurlijk taalgestuurd framework dat door middel van een hiërarchische procedurale aanpak en een twee-traps leerstrategie (supervised fine-tuning en versterkingsleer) realistische, bewerkbare 3D-steden genereert die overleggen met semantische en visuele consistentie.

Zishan Liu, Zecong Tang, RuoCheng Wu, Xinzhe Zheng, Jingyu Hu, Ka-Hei Hui, Haoran Xie, Bo Dai, Zhengzhe Liu

Gepubliceerd 2026-03-02
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een stad wilt bouwen, maar in plaats van jarenlang met bakstenen, beton en blauwdrukken te werken, je gewoon tegen een computer zegt: "Maak een gezellige wijk met rode bakstenen huizen, een groot park en een moderne bibliotheek." En poef, binnen een minuut staat die stad er.

Dat is precies wat CityGenAgent doet. Het is een slimme digitale architect die steden bouwt op basis van wat je tegen hem zegt. Hier is hoe het werkt, vertaald in simpele taal en met een paar leuke vergelijkingen.

1. Het Probleem: De "Bakstenen" zijn te zwaar

Vroeger moesten mensen steden in computers zelf ontwerpen, regel voor regel. Dat was als het bouwen van een legpuzzel waarbij je elke puzzelstukje met de hand moet snijden.
Nieuwere methodes gebruiken kunstmatige intelligentie om plaatjes te maken, maar die lijken vaak op een droom: ze zien er mooi uit, maar als je erin loopt, is het er niets van (geen echte muren, geen deuren, en de gebouwen lopen door elkaar heen). Het is alsof je een foto van een huis ziet, maar als je erin probeert te lopen, val je erdoorheen.

2. De Oplossing: Twee Slimme Bouwers

CityGenAgent lost dit op door de stad te bouwen in twee stappen, met twee speciale "bouwmeesters" (agents) die samenwerken. Ze gebruiken geen losse bakstenen, maar bouwplannen (programma's).

Stel je voor dat je een stad bouwt:

  • Bouwmeester 1 (BlockGen): De Stedenplanner.
    Deze kijkt naar je zin en zegt: "Oké, hier komt een park, daar een school, en hier een rij huizen." Hij tekent de plattegrond. Hij zorgt dat de gebouwen niet in elkaar lopen (geen overlappende muren) en dat er genoeg ruimte is voor wegen.

    • Vergelijking: Hij is als de stedenbouwer die de straten trekt op een kaart en bepaalt waar de blokken komen.
  • Bouwmeester 2 (BuildingGen): De Architect.
    Zodra de plattegrond klaar is, kijkt deze bouwmeester naar elk gebouw apart. Hij zegt: "Dit huis moet van rode baksteen zijn, met grote ramen en een plat dak." Hij maakt de details voor elk gebouw.

    • Vergelijking: Hij is als de architect die de gevels, deuren en ramen ontwerpt voor elk huis op de kaart.

3. Hoe leren ze? (De School voor Robots)

Deze robots zijn niet van nature slim genoeg om perfecte steden te maken. Ze moeten leren, net als een leerling. Ze doen dit in twee fases:

  1. De Theorieles (Supervised Fine-Tuning):
    De robots krijgen duizenden voorbeelden van goede steden en de bijbehorende bouwplannen. Ze leren de regels: "Een muur mag niet door een ander huis lopen" en "Een school moet eruitzien als een school." Ze leren de taal van de bouwplannen.
  2. De Praktijk met Punten (Reinforcement Learning):
    Nu krijgen ze een opdracht en mogen ze zelf proberen. Als ze een fout maken (bijvoorbeeld: een huis staat half in de rivier), krijgen ze een straf (een lage score). Als het er goed uitziet en klopt met wat je vroeg, krijgen ze een beloning (een hoge score).
    • De slimme truc: De computer kijkt niet alleen of het er mooi uitziet, maar ook of het logisch is. Zou een mens dit zo bouwen? Als de robot een stad bouwt die eruitziet als een surrealistisch schilderij, krijgt hij een straf. Hij leert dus om een echte, bruikbare stad te maken.

4. Het Magische: Je kunt de stad aanpassen!

Dit is het coolste deel. Omdat de stad niet gemaakt is van vaste pixels (zoals een foto), maar uit bouwplannen, kun je de stad later nog steeds veranderen.

Stel je bouwt een stad en je zegt: "Verander de stijl naar Chinees."

  • Bij een oude methode zou je de hele foto opnieuw moeten maken.
  • Bij CityGenAgent begrijpt de robot wat "Chinees" betekent: "Ah, dat betekent lage verdiepingen, gebogen daken en houten balken." Hij past het bouwplan aan en de stad verandert direct. Je kunt zelfs zeggen: "Maak de huizen hoger" of "Verplaats het park naar links", en de robot doet het direct.

Waarom is dit belangrijk?

  • Voor Games: Gameontwikkelaars kunnen enorme werelden maken zonder jarenlang te hoeven modelleren.
  • Voor Autonomie: Zelfrijdende auto's kunnen oefenen in miljoenen verschillende steden die de computer in een seconde bedenkt.
  • Voor Jou: Misschien kun je in de toekomst zelf je droomstad ontwerpen met een simpele zin, en die direct in 3D bekijken en bewandelen.

Kortom: CityGenAgent is als een magische bouwmeester die niet alleen luistert naar wat je zegt, maar ook begrijpt hoe een stad moet werken, zodat je een echte, betrouwbare stad krijgt die je kunt aanpassen met één zin.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →