SAMa: Material-aware 3D Selection and Segmentation

Dit paper introduceert SAMa, een efficiënte, optimalisatievrije methode die video-priors van SAM2 gebruikt om materialen in willekeurige 3D-voorstellingen automatisch en multiview-consistent te selecteren en te segmenteren.

Michael Fischer, Iliyan Georgiev, Thibault Groueix, Vladimir G. Kim, Tobias Ritschel, Valentin Deschaintre

Gepubliceerd 2026-02-23
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een digitale wereld bouwt, zoals een 3D-robot, een huis of een auto. Vaak wil je als ontwerper één specifiek onderdeel aanpassen. Bijvoorbeeld: "Ik wil dat de stoel rood is, maar de tafel moet blauw blijven," of "Ik wil alleen de houten onderdelen van dit gebouw vervangen door metaal."

In de digitale wereld is dit echter vaak een nachtmerrie. Omdat 3D-modellen bestaan uit duizenden kleine stukjes (pixels of punten), is het voor computers heel moeilijk om te begrijpen wat "hout" is en wat "metaal", vooral als ze eruitzien alsof ze van hetzelfde materiaal zijn gemaakt.

Hier komt SAMa (Select Any Material) om de hoek kijken. Het is een slimme tool die dit probleem oplost. Hier is hoe het werkt, vertaald naar alledaagse taal:

1. Het probleem: De "Blinde" Computer

Vroeger moest je als kunstenaar handmatig elk stukje van een 3D-objekt selecteren. Dat is als proberen een spijker uit een stapel hooi te halen met een theelepel. Bestaande software kon vaak wel zien wat een object was (een stoel), maar niet waarvan het gemaakt was (het leer van de stoel versus het hout van de poten).

2. De oplossing: Een slimme "Kijk-om-de-hoek"

SAMa doet iets heel slimme. Het leert van video's.
Stel je voor dat je een video bekijkt van een draaiende stoel. Als je op het leer van de zitting klikt, ziet de computer in het volgende frame (een fractie van een seconde later) dat het leer nog steeds daar is, ook al is de hoek veranderd.

SAMa is getraind op duizenden van deze video's. Het heeft geleerd: "Ah, als dit eruitziet als leer in dit frame, en eruitziet als leer in het volgende frame, dan is het leer, ongeacht hoe de camera beweegt."

3. De Magische "3D-Puntwolk"

Hoe zet je dit 2D-idee (van een scherm) om naar een 3D-wereld?
Stel je voor dat je een 3D-objekt fotografeert vanuit honderd verschillende hoeken. SAMa neemt al die foto's en projecteert de informatie terug naar het midden. Het bouwt een onzichtbaar, digitaal spook van het object, bestaande uit miljarden kleine punten.

  • De Analogie: Stel je voor dat je een poppenhuis hebt. Je klikt op de muur van de slaapkamer. SAMa neemt die klik, en projecteert die "muur-informatie" terug naar alle andere hoeken van het huis. Het creëert een 3D-kaartje waarop elke punt van het object een label heeft: "Dit is muur", "Dit is vloer".

4. Waarom is dit zo snel?

Andere methodes proberen dit te berekenen door het hele 3D-model opnieuw te "trainen" of te optimaliseren. Dat is alsof je een hele bibliotheek opnieuw moet ordenen elke keer dat je één boek wilt verplaatsen. Dat duurt uren.

SAMa doet het anders. Omdat het al zo slim is getraind op video's, hoeft het niet te "nadenken" over de 3D-structuur. Het doet gewoon een snelle zoekopdracht in zijn digitale spook (de puntwolk).

  • Het resultaat: Je klikt ergens, en binnen twee seconden is het hele object geselecteerd. Je kunt vervolgens direct de kleur veranderen, het materiaal vervangen of het object in stukken snijden.

5. Wat kun je ermee doen?

  • Kleuren: Maak een NeRF (een soort hologram) van een kamer en verander direct de kleur van alle houten meubels, terwijl het glas en het metaal onaangetast blijven.
  • Scheiden: Haal de "bakstenen" uit een 3D-model van een huis, zodat je ze apart kunt bewerken.
  • Verbeteren: Neem een ruw 3D-model dat door AI is gegenereerd (vaak met saaie, egaal gekleurde oppervlakken) en vervang de "plastic" delen door realistische PBR-materialen (zoals echt hout of metaal) met één klik.

Samenvattend

SAMa is als een slimme, onzichtbare verfkwast die precies weet wat "huid", "stof" of "metaal" is, zelfs als het object draait of als de belichting verandert. Het maakt het voor kunstenaars en ontwerpers mogelijk om complexe 3D-werelden in seconden te bewerken, in plaats van urenlang handmatig te sleutelen. Het is de overstap van "handmatig snippen" naar "intelligent selecteren".

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →