GRIHA: Synthesizing 2-Dimensional Building Layouts from Images Captured using a Smart Phone

O artigo apresenta o GRIHA, um framework que utiliza câmeras de smartphones comuns e tecnologia SLAM (via ARCore) para gerar rapidamente plantas baixas 2D de ambientes internos a partir de imagens RGB, superando as limitações de métodos existentes que dependem de câmeras de profundidade ou imagens panorâmicas sem oclusão.

Shreya Goyal, Naimul Khan, Chiranjoy Chattopadhyay, Gaurav Bhatnagar

Publicado 2026-02-20
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você quer desenhar o mapa do tesouro (a planta baixa) da sua casa ou do seu escritório, mas não tem um arquiteto, uma fita métrica e nem tempo para medir cada parede. O jeito tradicional seria você andar pela casa, medindo tudo e desenhando no computador, o que é cansativo e chato.

Existem aplicativos que tentam fazer isso usando câmeras especiais que "enxergam" a profundidade (como o Kinect) ou pedem que você tire uma foto de 360 graus (panorâmica). O problema? A maioria das pessoas não tem essas câmeras especiais, e tirar uma foto panorâmica perfeita em um escritório cheio de móveis é quase impossível, pois os móveis escondem (ocluem) as paredes.

É aqui que entra o GRIHA, o "herói" deste artigo.

O Que é o GRIHA?

Pense no GRIHA como um detetive de arquitetura que usa apenas o celular comum que você já tem no bolso. Ele consegue transformar algumas fotos normais que você tira em um mapa 2D completo da sua casa.

A sigla significa "Gerando o Interior de uma Casa usando ARCore". O segredo dele é usar uma tecnologia chamada ARCore (da Google), que já vem instalada na maioria dos celulares Android.

Como Funciona a Mágica? (A Analogia do Quebra-Cabeça)

Vamos imaginar que a sua casa é um grande quebra-cabeça, mas as peças estão espalhadas e você só pode ver pedaços delas.

  1. A Coleta de Pistas (As Fotos):
    Em vez de girar o celular em 360 graus (o que é difícil em lugares cheios), o GRIHA pede que você tire 4 fotos simples de cada cômodo (uma de cada canto) e uma da porta. É como se você estivesse tirando "polaroids" dos cantos da sala.

  2. O Cérebro que Imagina a Profundidade (Estimativa de Profundidade):
    Como a foto é plana (2D), o celular precisa "adivinhar" o quanto cada objeto está longe. O GRIHA usa uma inteligência artificial treinada para olhar uma foto e criar um "mapa de profundidade" imaginário. É como se o celular tivesse olhos de raio-X que conseguem ver a distância entre você e a parede, mesmo sem uma câmera especial.

  3. A Reconstrução 3D (Montando o Modelo):
    Com as fotos e o "mapa de profundidade" imaginado, o sistema cria uma nuvem de pontos 3D. Imagine que cada foto vira uma nuvem de poeira mágica que forma a forma da sala no espaço.

  4. O GPS do Celular (SLAM):
    Enquanto você tira as fotos, o celular está usando seu giroscópio e acelerômetro (o sistema SLAM) para saber exatamente onde você está e para onde está olhando. É como se o celular tivesse um GPS interno que diz: "Ok, você tirou essa foto no canto noroeste e virou 90 graus para a próxima". Isso ajuda a juntar as nuvens de poeira (as fotos) no lugar certo.

  5. O Alinhamento Perfeito (Regularização):
    Aqui está a parte genial. O sistema sabe que, na maioria das casas, as paredes são retas e formam ângulos de 90 graus (o mundo "Manhattan"). Se a inteligência artificial errar um pouco e fazer a parede parecer torta, o GRIHA "estica" e "endireita" tudo automaticamente para que fique perfeito, como se estivesse arrumando um tapete torto.

  6. O Toque Final (Portas):
    O sistema também usa outra inteligência artificial para "enxergar" as portas nas fotos e colocá-las no lugar certo no mapa final.

Por Que Isso é Melhor que os Outros?

  • Sem Hardware Caro: Você não precisa comprar câmeras de profundidade. Seu celular atual já serve.
  • Resistente a Bagunça: Se você tem uma sala cheia de móveis, sofás e caixas, os outros métodos falham porque não conseguem ver as paredes atrás dos móveis. O GRIHA, ao tirar fotos de vários ângulos, consegue "ver" as partes que os outros não veem.
  • Rápido e Sem Dor de Cabeça: Você só tira 4 fotos. Não precisa caminhar pela sala inteira escaneando tudo, nem precisar desenhar cantos manualmente no aplicativo (o que é chato e propenso a erros).
  • Funciona na Escuridão: Alguns aplicativos precisam de muita luz e contraste para funcionar. O GRIHA funciona mesmo em lugares com iluminação ruim.

O Resultado

No final, você tem um desenho 2D (a planta baixa) da sua casa, com medidas precisas, gerado em poucos minutos, apenas usando o celular que você já tem no bolso.

Resumo da Ópera: O GRIHA pega a tecnologia de realidade aumentada que já existe no seu celular, combina com inteligência artificial para "adivinhar" a profundidade e usa matemática para endireitar tudo, transformando fotos simples em um mapa profissional, sem precisar de equipamentos caros ou de um arquiteto. É como ter um mágico de arquitetura no seu bolso!

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →