Imagine a City: CityGenAgent for Procedural 3D City Generation

Ce papier présente CityGenAgent, un cadre piloté par le langage naturel qui génère des villes 3D interactives de haute qualité grâce à une approche procédurale hiérarchique et une stratégie d'apprentissage combinant affinage supervisé et apprentissage par renforcement pour garantir la cohérence structurelle et visuelle.

Zishan Liu, Zecong Tang, RuoCheng Wu, Xinzhe Zheng, Jingyu Hu, Ka-Hei Hui, Haoran Xie, Bo Dai, Zhengzhe Liu

Publié 2026-03-02
📖 5 min de lecture🧠 Analyse approfondie

Each language version is independently generated for its own context, not a direct translation.

Imaginez que vous voulez construire une ville entière, avec ses immeubles, ses parcs et ses rues, mais que vous n'avez pas de temps pour poser chaque brique à la main. C'est là qu'intervient CityGenAgent, un nouvel outil magique décrit dans ce papier de recherche.

Voici une explication simple, comme si on racontait une histoire :

🏙️ Le Problème : Construire une ville, c'est dur !

Jusqu'à présent, créer des villes en 3D pour les jeux vidéo, les voitures autonomes ou la réalité virtuelle était un casse-tête.

  • Les anciennes méthodes étaient comme des architectes rigides : il fallait écrire des règles complexes et passer des heures à tout dessiner manuellement.
  • Les nouvelles méthodes basées sur l'IA (comme les "peintres numériques") pouvaient créer de belles images, mais elles produisaient souvent des châteaux en carton : c'est joli à voir, mais si vous essayez de marcher dedans, les murs sont flous, les portes n'ont pas de profondeur, et on ne peut pas modifier les bâtiments facilement.

🤖 La Solution : CityGenAgent, le "Chef de Chantier" Intelligent

Les chercheurs ont créé CityGenAgent. Imaginez-le non pas comme un simple peintre, mais comme un chef de chantier ultra-intelligent qui parle votre langue.

Au lieu de lui demander de "peindre une ville", vous lui donnez une instruction simple en langage naturel, comme : "Fais-moi un quartier résidentiel moderne avec des immeubles bleus et un grand parc au centre."

Mais comment fait-il pour que ce soit solide et modifiable ? Il utilise une astuce géniale : il ne dessine pas directement la ville, il écrit le "plan de construction".

📝 L'Analogie des Deux Plans (Le Secret de la Méthode)

Pour construire une ville, CityGenAgent décompose le travail en deux étapes, comme un architecte qui prépare deux plans distincts :

  1. Le Plan du Quartier (Block Program) :
    Imaginez un plan de ville vu du ciel. Ce plan dit : "Ici, on met un immeuble de 10 étages. Là, un parc. Et là, une rue."

    • L'astuce : Le modèle apprend à s'assurer que les immeubles ne se chevauchent pas (pas de murs qui traversent d'autres murs) et que tout est logique. C'est comme s'il vérifiait que les pièces d'un puzzle s'emboîtent parfaitement avant même de les assembler.
  2. Le Plan de la Maison (Building Program) :
    Une fois le quartier dessiné, il se concentre sur chaque maison individuellement. "Cette maison a des fenêtres en verre, une porte en bois et un toit plat."

    • L'astuce : Il s'assure que le style de la maison correspond exactement à ce que vous avez demandé. Si vous dites "style chinois", il ne mettra pas de fenêtres modernes !

🎓 Comment l'a-t-on appris à faire ça ? (L'École de la Ville)

Pour que ce chef de chantier soit aussi bon, les chercheurs l'ont formé en deux temps, un peu comme un apprenti :

  • Étape 1 : L'École (Apprentissage Supervisé)
    On lui a montré des milliers d'exemples de plans et de villes pour qu'il apprenne le vocabulaire et les règles de base. Il sait maintenant écrire un plan correct.
  • Étape 2 : Le Stage de Perfectionnement (Apprentissage par Renforcement)
    C'est ici que la magie opère. On lui a donné des "récompenses" virtuelles.
    • Si son plan crée un immeuble qui flotte dans le ciel ou qui traverse un autre immeuble, il perd des points (c'est le Récompense d'Alignement Spatial).
    • Si le rendu final ressemble à ce qu'il a écrit, il gagne des points (c'est la Récompense de Cohérence Visuelle).
    • À force d'essais et d'erreurs, il devient un expert capable de deviner ce qui est physiquement possible et ce qui est joli.

✨ Pourquoi c'est génial ? (La Magie de la Modification)

C'est là que CityGenAgent change la donne. Comme il a construit la ville à partir de plans écrits (et non pas juste d'une image figée), vous pouvez revenir en arrière et modifier la ville en parlant simplement.

  • Avant : Si vous vouliez changer le style d'un bâtiment dans une image générée, c'était impossible sans tout effacer et recommencer.
  • Avec CityGenAgent : Vous dites : "Change tous les immeubles en style chinois." Le modèle lit son plan, modifie les instructions pour les fenêtres et les toits, et boum, la ville se transforme instantanément, tout en restant solide et logique.

🚀 En résumé

CityGenAgent, c'est comme avoir un architecte et un constructeur en un seul.

  • Il écoute vos idées en langage courant.
  • Il écrit des plans mathématiques précis (pour éviter les erreurs).
  • Il construit une ville 3D solide et belle.
  • Et surtout, il est flexible : vous pouvez lui demander de changer la couleur des toits ou d'ajouter un parc à tout moment, sans tout casser.

C'est un pas de géant pour créer des mondes virtuels réalistes, que ce soit pour s'entraîner à conduire une voiture autonome, pour jouer à un jeu vidéo infini, ou pour imaginer le futur de nos villes.

Recevez des articles comme celui-ci dans votre boîte mail

Digests quotidiens ou hebdomadaires personnalisés selon vos intérêts. Résumés Gist ou techniques, dans votre langue.

Essayer Digest →