Imagine a City: CityGenAgent for Procedural 3D City Generation

Este trabalho apresenta o CityGenAgent, um framework impulsionado por linguagem natural que utiliza uma estratégia de aprendizado em duas etapas (SFT e RL) para gerar e editar cidades 3D procedurais de alta qualidade, garantindo precisão estrutural e alinhamento semântico através da decomposição hierárquica em programas de blocos e edifícios.

Zishan Liu, Zecong Tang, RuoCheng Wu, Xinzhe Zheng, Jingyu Hu, Ka-Hei Hui, Haoran Xie, Bo Dai, Zhengzhe Liu

Publicado 2026-03-02
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você quer construir uma cidade inteira, mas em vez de usar tijolos e cimento, você usa apenas palavras. E o mais incrível: essa cidade precisa ser perfeita, com prédios que não se atravessam, ruas que fazem sentido e edifícios que realmente parecem o que você pediu.

O artigo "Imagine a City: CityGenAgent" apresenta uma nova ferramenta que faz exatamente isso. Pense nela como um arquiteto superinteligente e um mestre da construção que trabalha juntos para transformar suas ideias em cidades 3D reais e interativas.

Aqui está como funciona, explicado de forma simples:

1. O Problema: Construir Cidades é Difícil

Antes, criar cidades virtuais era como tentar montar um quebra-cabeça gigante de olhos fechados.

  • Métodos antigos: Eram como seguir um manual de instruções rígido. Se você quisesse mudar algo, tinha que começar tudo de novo ou contratar uma equipe inteira para mexer manualmente.
  • Métodos novos (IA generativa): Eram como pintar um quadro bonito, mas se você tentasse andar por dentro da cidade, as paredes eram "fantasmas" ou os prédios se atravessavam. Não havia estrutura real.

2. A Solução: O "Duplo Chefe" (CityGenAgent)

Os pesquisadores criaram um sistema chamado CityGenAgent. Em vez de tentar fazer tudo de uma vez, eles dividiram o trabalho em dois especialistas que conversam entre si:

  • O Mestre do Terreno (BlockGen):
    Imagine que você está desenhando um mapa num papel quadriculado. O BlockGen é o responsável por desenhar os "quarteirões". Ele decide: "Aqui vai um parque, ali vai um prédio de apartamentos, e aqui uma escola".

    • O Truque: Ele não desenha o prédio em si, ele escreve um mapa de instruções (um código simples) dizendo: "Coloque um prédio retangular de 10 andares aqui, sem encostar no vizinho".
  • O Mestre da Fachada (BuildingGen):
    Depois que o terreno está pronto, o BuildingGen entra em ação. Ele pega as instruções do primeiro chefe e diz: "Ok, o prédio na rua A precisa ser moderno, de vidro azul, com janelas grandes".

    • O Truque: Ele escreve um manual de decoração detalhado para cada parte do prédio (portas, telhados, janelas), garantindo que o visual combine com a descrição.

3. Como eles aprendem a fazer isso? (O Treinamento)

Para que esses "robôs" não fizessem besteira (como colocar um prédio dentro de outro), eles passaram por duas fases de treinamento, como um aluno de arquitetura:

  1. Aulas de Teoria (SFT): Eles leram milhares de exemplos de cidades e aprenderam as regras básicas: "Prédios não podem se atravessar", "Parques precisam de espaço", "Portas devem estar no chão".
  2. O Estágio de Prática com Feedback (RL): Aqui está a mágica. Eles começaram a criar cidades e um "professor" (uma IA avaliadora) olhava o resultado.
    • Se o prédio ficava torto ou não parecia o que você pediu, o professor dava uma "nota baixa" e dizia: "Tente de novo, mas pense melhor no espaço".
    • Com o tempo, eles aprenderam a pensar no espaço 3D e a entender o que os humanos realmente querem ver, não apenas seguir regras cegas.

4. O Poder da Magia: "Edição por Conversa"

A parte mais legal é que, como a cidade é construída baseada em instruções escritas (e não apenas em pixels), você pode mudar tudo conversando com o sistema.

  • Você diz: "Quero que todos os prédios desse quarteirão fiquem no estilo chinês antigo."
  • O sistema: Não apenas pinta os prédios de vermelho. Ele entende que "estilo chinês" significa telhados curvos, menos andares e materiais específicos. Ele reescreve o "mapa" e o "manual", e a cidade se transforma instantaneamente. É como ter um assistente que entende não só a cor, mas a estrutura da sua ideia.

Resumo da Ópera

O CityGenAgent é como ter um engenheiro de software e um arquiteto trabalhando juntos para você.

  • Você fala o que quer (ex: "Uma cidade futurista com parques").
  • Eles criam um plano lógico (para que nada bata em nada).
  • Eles constroem os detalhes (para que fique bonito).
  • E se você mudar de ideia? Basta pedir, e eles reorganizam a cidade inteira em segundos.

Isso é muito útil para criar cenários para jogos, treinar carros autônomos (que precisam ver cidades reais) ou para planejamento urbano virtual, onde podemos testar ideias sem gastar um centavo em concreto.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →