Imagine a City: CityGenAgent for Procedural 3D City Generation

El artículo presenta CityGenAgent, un marco impulsado por lenguaje natural que utiliza una estrategia de aprendizaje en dos etapas (ajuste fino supervisado y aprendizaje por refuerzo) para generar y editar ciudades 3D procedurales de alta calidad mediante programas jerárquicos interpretables, superando a los métodos existentes en alineación semántica, calidad visual y controlabilidad.

Zishan Liu, Zecong Tang, RuoCheng Wu, Xinzhe Zheng, Jingyu Hu, Ka-Hei Hui, Haoran Xie, Bo Dai, Zhengzhe Liu

Publicado 2026-03-02
📖 4 min de lectura☕ Lectura para el café

Each language version is independently generated for its own context, not a direct translation.

¡Imagina que eres un arquitecto mágico! Pero en lugar de usar lápiz y papel, usas solo tus palabras para construir ciudades enteras en tres dimensiones. Eso es exactamente lo que hace CityGenAgent, una nueva herramienta presentada en este artículo.

Aquí te explico cómo funciona, usando analogías sencillas:

1. El Problema: Construir una ciudad es como armar un rompecabezas gigante

Antes, si querías crear una ciudad virtual para un videojuego o para probar coches autónomos, tenías dos opciones difíciles:

  • Opción A (Manual): Contratabas a cientos de artistas que pasaban meses dibujando cada edificio y calle. Era lento y costoso.
  • Opción B (Inteligencia Artificial antigua): Pedías a una IA que "imaginara" la ciudad. El problema es que estas IAs a menudo creaban cosas bonitas pero desordenadas: edificios que se atravesaban entre sí, calles que no tenían sentido o formas extrañas que no podías usar en la vida real.

2. La Solución: CityGenAgent, el "Arquitecto Inteligente"

Los autores crearon un sistema llamado CityGenAgent. Imagina que este sistema no es una sola persona, sino un equipo de dos expertos muy organizados que trabajan juntos siguiendo un plan escrito (un "programa").

Paso 1: El Plan Maestro (BlockGen)

Primero, tú le dices: "Quiero un barrio con edificios altos de cristal, un parque grande en el centro y calles anchas".

  • BlockGen es como el urbanista. No dibuja los edificios todavía. Lo que hace es escribir un plan de construcción (llamado Block Program).
  • Este plan es una lista de instrucciones matemáticas: "Aquí va un edificio de 10 pisos, aquí un parque, y asegúrate de que no se toquen".
  • La magia: El sistema aprende a escribir estos planes para que sean perfectos. Si el plan dice que hay un parque, el parque no se superpondrá con un edificio.

Paso 2: El Decorador (BuildingGen)

Una vez que el urbanista ha decidido dónde va cada cosa, llega el segundo experto.

  • BuildingGen es como el diseñador de interiores y fachadas. Toma las instrucciones del urbanista y dice: "Ah, para este edificio de cristal, usaré ventanas azules y puertas de metal".
  • Escribe otro plan detallado (llamado Building Program) que describe exactamente cómo debe verse cada pieza.

3. El Entrenamiento: De "Copiar" a "Entender"

¿Cómo aprenden estos dos expertos a ser tan buenos? Usaron una técnica de entrenamiento de dos pasos, como enseñar a un niño:

  1. La Clase de Copiado (SFT): Al principio, les mostraron miles de ejemplos de ciudades y sus planes. Les enseñaron a copiar el formato correcto. "Si pides un parque, escribe la palabra 'parque' en el lugar correcto".
  2. La Práctica con Premios (RL): Aquí es donde se pone interesante. Les dijeron: "Intenta hacer una ciudad".
    • Si hacían un edificio que se atravesaba con otro, el sistema les daba una "puntuación baja" (como un castigo).
    • Si hacían una ciudad que se veía real y seguía tus instrucciones, les daban una "puntuación alta" (premio).
    • Con el tiempo, aprendieron a razonar. No solo copiaban, sino que entendían: "Si pongo un rascacielos aquí, no puedo poner otro justo encima porque chocarían".

4. El Superpoder: Cambiar las cosas con una frase

Lo más increíble de CityGenAgent es que, como todo está basado en esos "planes escritos", puedes cambiar la ciudad al instante sin borrar nada.

  • Si ves la ciudad generada y dices: "Haz que todos los edificios sean de estilo chino antiguo", el sistema no tiene que empezar de cero.
  • Solo lee tu nueva frase, ajusta el "Plan del Decorador" y ¡listo! Los edificios cambian de cristal moderno a techos curvos tradicionales, pero el parque y las calles siguen en su lugar.

En resumen

CityGenAgent es como tener un arquitecto y un diseñador que hablan tu idioma, entienden las reglas de la física (para que los edificios no floten ni se atraviesen) y pueden cambiar el estilo de toda una ciudad con una sola frase.

Es una herramienta que promete hacer que crear mundos virtuales sea tan fácil como contar una historia, pero con resultados tan precisos que sirven para entrenar coches autónomos, crear videojuegos realistas o planificar ciudades del futuro.