CORAL: Correspondence Alignment for Improved Virtual Try-On

Dit paper introduceert CORAL, een DiT-gebaseerd framework dat de prestaties van virtuele pasproeven verbetert door expliciete uitlijning van de correspondentie tussen persoon en kledingstuk via een distillatieverlies en entropieminimalisatie, wat leidt tot een betere behoud van fijne details en globale vormoverdracht.

Jiyoung Kim, Youngjin Shin, Siyoon Jin, Dahyun Chung, Jisu Nam, Tongmin Kim, Jongjae Park, Hyeonwoo Kang, Seungryong Kim

Gepubliceerd 2026-02-20
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

CORAL: De "Perfecte Passvorm" voor Virtuele Proefruimtes

Stel je voor dat je een virtuele kledingwinkel bezoekt. Je wilt een nieuwe trui of jurk proberen, maar in plaats van naar de kledingcabine te lopen, klik je gewoon op een foto van jezelf en een foto van het kledingstuk. Helaas werkt dit in de echte wereld vaak nog niet goed: de kleding ziet eruit alsof hij op een stok is gehangen, de mouwen vallen op de verkeerde plek, of het logo van het shirt staat scheef.

Deze paper introduceert CORAL, een slimme nieuwe technologie die dit probleem oplost. Hier is hoe het werkt, vertaald naar alledaagse taal:

1. Het Probleem: De "Verkeerde Handdruk"

Bij eerdere methoden probeerde de computer te raden welk deel van de kleding bij welk deel van je lichaam hoort. Het was alsof je iemand een hand geeft, maar je mist de hand van de ander en grijpt in de lucht. De computer wist niet precies waar de kraag van het shirt op je nek moest komen of waar de zoom van de broek op je enkels moest eindigen. Hierdoor ontstonden rare artefacten, zoals dubbele zoomlijnen of logo's die in de lucht zweven.

2. De Oplossing: CORAL (De "Matchmaker")

De auteurs hebben een systeem bedacht dat ze CORAL noemen. Het staat voor Correspondence Alignment (Correspondentie Uitlijning).

Je kunt CORAL zien als een super-gevoelige matchmaker die twee dingen doet:

  • De "DINO-vriend" (De Expert): CORAL gebruikt een slimme AI (genaamd DINOv3) die al miljoenen foto's heeft gezien. Deze AI weet precies hoe een mouw eruitziet en waar die op een arm hoort te zitten. CORAL vraagt deze expert: "Waar hoort dit stukje stof precies te zitten?"
  • De "Laser-Focus" (De Scherpte): Soms twijfelt de computer een beetje: "Zit deze mouw hier of daar?" CORAL pakt deze twijfel en maakt de focus scherp. Het is alsof je van een wazige foto naar een 4K-beeld gaat. De computer wordt gedwongen om precies op het juiste punt te kijken en niet ergens in de buurt.

3. Hoe werkt het technisch? (Maar dan simpel)

De computer gebruikt een heel krachtig brein genaamd een Diffusion Transformer. Dit brein kijkt naar alle onderdelen van de foto tegelijk (je gezicht, je armen, de kleding).

  • De oude manier: Het brein keek naar de kleding en dacht: "Oh, dit is een mouw, ik plak hem ergens op de arm."
  • De CORAL-methode: Het brein krijgt een opdracht: "Kijk naar de vraag (waar is de arm?) en het antwoord (waar is de mouw?). Zorg dat deze twee elkaar perfect vinden, net zoals de DINO-expert dat zou doen."

Ze gebruiken twee trucjes om dit te forceren:

  1. Leer van de expert: Ze straffen de computer als hij niet kijkt naar waar de DINO-expert zegt dat de kleding moet zitten.
  2. Maak het scherp: Ze straffen de computer als hij twijfelt. De aandacht moet als een laserstraal zijn, niet als een wazige lantaarn.

4. Het Resultaat: Kleding die echt "draagt"

Door deze trucjes gebeurt er magie:

  • Geen zwevende logo's: Als je een shirt met een groot logo kiest, staat het logo precies op de borst, niet op je schouder of in je nek.
  • Perfecte pasvorm: De mouwen eindigen precies bij de pols, en de zoom van de broek zit net boven de schoenen.
  • Natuurlijk gedrag: Als je je armen zwaait in de foto, beweegt de kleding mee alsof het echt stof is, en niet alsof het een sticker is.

5. Waarom is dit belangrijk?

Vroeger was virtuele passen vooral een "gokje" dat vaak mislukte. Met CORAL wordt het betrouwbaar. Of je nu een t-shirt probeert of een complexe jurk, de computer begrijpt nu de ruimtelijke relatie tussen jou en de kleding. Het is alsof je van een poppetje in een doosje overstapt naar een echte, levende proefruimte waar de kleding perfect past.

Kortom: CORAL zorgt ervoor dat de computer niet meer "gokt" waar de kleding moet zitten, maar het weet precies waar het hoort, waardoor het resultaat eruitziet alsof je het echt hebt aangetrokken.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →