Speedy-Splat: Fast 3D Gaussian Splatting with Sparse Pixels and Sparse Primitives

O artigo apresenta o Speedy-Splat, uma abordagem que otimiza o pipeline de renderização e introduz uma técnica de poda para reduzir o tamanho do modelo e o tempo de treinamento, acelerando a renderização média em 6,71 vezes sem comprometer a fidelidade visual.

Alex Hanson, Allen Tu, Geng Lin, Vasu Singla, Matthias Zwicker, Tom Goldstein

Publicado 2026-02-24
📖 5 min de leitura🧠 Leitura aprofundada

Each language version is independently generated for its own context, not a direct translation.

Imagine que você quer criar um filme em 3D super realista para um jogo de realidade virtual. Para fazer isso, os computadores de hoje usam uma técnica chamada 3D Gaussian Splatting (ou "3D-GS").

Pense no 3D-GS como se fosse uma tempestade de milhões de partículas de glitter flutuando no espaço. Cada partícula é uma "Gaussiana" (uma bolinha difusa). Para desenhar a imagem na sua tela, o computador tem que olhar para cada pixel e calcular como todas essas bolinhas se sobrepõem.

O problema? Para ter uma imagem perfeita, o sistema precisa de milhões dessas bolinhas. É como tentar pintar um quadro usando 2,6 milhões de pinceladas minúsculas. O resultado é lindo, mas o computador fica cansado: demora muito para renderizar (desenhar) e o arquivo fica gigantesco, impossível de rodar em celulares ou óculos de realidade virtual.

Os autores deste artigo, a equipe do Speedy-Splat, disseram: "E se pudéssemos fazer a mesma imagem com menos bolinhas e sem gastar tanto tempo?"

Eles criaram um método que torna o processo 6,7 vezes mais rápido e reduz o tamanho do arquivo em 10 vezes, mantendo a qualidade quase perfeita. Veja como eles fizeram isso, usando analogias simples:

1. O Problema da "Caixa de Presente" (SnugBox e AccuTile)

No método antigo (3D-GS), quando o computador precisava saber quais bolinhas afetavam uma parte da tela, ele era muito conservador.

  • A Analogia: Imagine que você tem uma bolinha de glitter. Para saber se ela toca um quadrado na tela, o método antigo desenhava um quadrado enorme ao redor da bolinha, como se estivesse colocando a bolinha dentro de uma caixa de presente muito grande e fofa. Mesmo que a bolinha fosse pequena, ele tratava a caixa inteira como se estivesse cheia de glitter. Isso fazia o computador processar muitos quadrados vazios, desperdiçando tempo.

  • A Solução (SnugBox): Eles criaram um algoritmo chamado SnugBox (Caixa Ajustada). Em vez de uma caixa fofa e grande, eles calculam a caixa perfeita e apertada que envolve exatamente a forma da bolinha. É como trocar a caixa de presente por um envelope que se ajusta perfeitamente ao conteúdo.

  • O Resultado: O computador agora sabe exatamente onde olhar e ignora o que não importa. Isso já deixa o processo quase 2 vezes mais rápido.

  • A Solução (AccuTile): Eles foram um passo além com o AccuTile. Em vez de apenas olhar para a caixa, eles olham para a forma exata da bolinha (que é oval, não quadrada) e cortam os cantos que não tocam na tela. É como usar um cortador de biscoito na forma exata da bolinha em vez de um cortador quadrado. Isso acelera ainda mais o processo.

2. O Problema do "Exército de Soldados Desnecessários" (Poda Suave e Dura)

O segundo problema era que o sistema criava muitas bolinhas que não eram necessárias.

  • A Analogia: Imagine que você está montando um exército para defender uma fortaleza. O método antigo recrutava 2,6 milhões de soldados. Mas, ao analisar o campo de batalha, percebe-se que 90% deles estão parados em lugares onde ninguém vai atacar. Eles são redundantes. Manter 2,6 milhões de soldados custa muito dinheiro (memória) e tempo de treinamento.

  • A Solução (Poda Suave - Soft Pruning): Durante o "treinamento" (quando o computador aprende a cena), eles introduziram uma regra: "Se um soldado não está sendo útil agora, vamos dispensá-lo gentilmente". Eles removem 80% das bolinhas que não contribuem muito para a imagem, mas fazem isso de forma suave, permitindo que o sistema se ajuste.

  • A Solução (Poda Dura - Hard Pruning): Depois que o treinamento principal acaba, eles fazem uma "faxina final" (Poda Dura). Eles olham para o exército restante e cortam mais 30% dos soldados que ainda são desnecessários.

O Resultado Final: A Mágica do Speedy-Splat

Ao combinar essas duas ideias (olhar com mais precisão e ter menos bolinhas), o Speedy-Splat consegue:

  1. Velocidade: Em vez de 185 quadros por segundo (FPS), ele roda a 1.148 FPS (no exemplo do caminhão). É como mudar de um carro popular para um foguete.
  2. Tamanho: O modelo que antes pesava com 2,6 milhões de bolinhas agora usa apenas 260 mil. É como comprimir um arquivo de vídeo gigante em um arquivo pequeno sem perder a qualidade da imagem.
  3. Qualidade: A imagem final é quase idêntica à original. Se você não fosse um especialista, nem notaria a diferença.

Em resumo:
O Speedy-Splat é como pegar um artista que pintava um quadro com milhões de pinceladas desnecessárias e ensinar a ele a usar pincéis mais inteligentes e a pintar apenas onde é realmente necessário. O quadro fica igual, mas o artista termina a obra em uma fração do tempo e usa muito menos tinta. Isso permite que você veja cenas 3D incríveis em celulares e óculos de realidade virtual, algo que antes era impossível.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →