ProGS: Towards Progressive Coding for 3D Gaussian Splatting

Dit paper introduceert ProGS, een nieuwe codec die 3D Gaussian Splatting-data via een octree-structuur en wederzijdse informatieversterking comprimeert, waardoor een 45-voudige verkleining van opslagruimte wordt bereikt met een verbeterde visuele kwaliteit en ondersteuning voor progressieve codering.

Zhiye Tang, Lingzhuo Liu, Shengjie Jiao, Qiudan Zhang, Junhui Hou, You Yang, Xu Wang

Gepubliceerd Wed, 11 Ma
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een hele stad in 3D wilt vastleggen, niet met foto's, maar met miljoenen kleine, zwevende, gekleurde balletjes (de "Gaussians"). Dit is wat de technologie 3D Gaussian Splatting (3DGS) doet. Het ziet er prachtig uit en werkt razendsnel, maar er is een groot probleem: die stad van balletjes is enorm zwaar. Het is alsof je een hele bibliotheek probeert te versturen via een sms-bericht; het duurt eeuwen en kost veel data.

Bestaande methoden om dit te comprimeren (kleiner maken) zijn vaak als een fysieke boekband: je moet het hele boek eerst downloaden voordat je ook maar één pagina kunt lezen. Als je internettraag is, zit je vast.

De auteurs van dit paper hebben ProGS bedacht. Laten we uitleggen wat dit is met een paar simpele analogieën.

1. De Boomstructuur (De Octree)

Stel je voor dat je een grote, rommelige berg speelgoed hebt. De oude manier was om elk stukje speelgoed los te verpakken. ProGS doet het slimmer: het bouwt een gigantische boom (een octree).

  • De stam en grote takken: Dit zijn de grove details van de stad. Je ziet de gebouwen en de straten, maar de ramen zijn nog wazig.
  • De kleine takjes en blaadjes: Dit zijn de fijne details, zoals de ruitjes in de ramen of de textuur van de bakstenen.

Het mooie van deze boom is dat je hem laag voor laag kunt afleveren.

  • Als je internettraag is, krijg je eerst alleen de stam en grote takken. Je ziet dan al direct de stad, alleen wat wazig.
  • Zodra je internet sneller wordt, stromen er automatisch meer takjes en blaadjes bij. De stad wordt scherper en mooier, zonder dat je de hele file opnieuw hoeft te downloaden. Dit noemen ze progressieve coding.

2. De "Geheime Leermeester" (Mutual Information)

Er is een klein probleem met deze boom: de grote takken (de lage detailniveaus) zijn vaak zo wazig dat ze er lelijk uitzien. Ze missen de details van de kleine takjes.

ProGS lost dit op met een slimme truc, een beetje zoals een geheime leermeester.

  • Stel je voor dat de grote takken (de ouder) en de kleine takjes (de kinderen) samenwerken.
  • Normaal gesproken leren ze apart van elkaar. ProGS zorgt ervoor dat de grote takken leren van de kleine takjes.
  • Ze delen informatie (de auteurs noemen dit Mutual Information). Hierdoor worden de grote takken alvast veel slimmer en scherper, zelfs voordat de kleine takjes er zijn.
  • Resultaat: Zelfs als je alleen de "wazige" versie van de stad ziet, ziet het er al veel beter uit dan bij andere methoden. Het is alsof je een schets van een schilderij ziet die al verrassend realistisch is, voordat de verf er helemaal op zit.

3. De Slimme Verpakking (Context-based Coding)

Hoe verpakken ze deze boom dan zo klein mogelijk?
In plaats van voor elk balletje te zeggen: "Dit balletje is hier, en dit is de kleur", kijken ze naar de omgeving.

  • Het is alsof je een pakketje verstuurt. In plaats van te schrijven "Er zit een rode bal in", zeg je: "In dit vakje zit iets dat op de vorige bal lijkt, maar dan een beetje roder."
  • Omdat de computer weet hoe de buren eruitzien, hoeft hij niet alles opnieuw te beschrijven. Dit maakt het pakketje (het bestand) enorm klein.

Waarom is dit belangrijk?

Vroeger moest je wachten tot je hele 3D-wereld was gedownload om te kunnen kijken. Met ProGS kun je direct beginnen:

  1. Je opent de link.
  2. Je ziet direct een wazige versie van de wereld (zoals een lage resolutie op Netflix).
  3. Terwijl je kijkt, wordt het beeld steeds scherper en mooier, afhankelijk van je internetverbinding.

Samengevat:
ProGS is als een magische 3D-telefoon. Hij pakt een gigantische, zware 3D-wereld, knipt hem in laagjes, en zorgt ervoor dat de eerste laagjes al zo goed mogelijk zijn door slimme samenwerking tussen de lagen. Het resultaat? Je kunt enorme 3D-scènes streamen, zelfs met een slechte internetverbinding, en het ziet er nog steeds prachtig uit. Ze hebben de opslagruimte met wel 45 keer kunnen verkleinen, terwijl het beeld zelfs scherper is dan bij de beste methoden van nu.