ProFashion: Prototype-guided Fashion Video Generation with Multiple Reference Images

ProFashion is een nieuw kader voor het genereren van modevideo's dat meerdere referentieafbeeldingen en pose-gevoelige aggregatie gebruikt om betere weergaveconsistentie en tijdscoherentie te bereiken dan bestaande methoden.

Xianghao Kong, Qiaosong Qi, Yuanbin Wang, Biaolong Chen, Aixi Zhang, Anyi Rao

Gepubliceerd 2026-04-01
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een modeontwerp wilt laten zien aan je klanten. Je hebt een foto van een jurk van voren, een van achteren en een van opzij. Je wilt nu een video maken waarin een model die jurk draait en beweegt, zodat de klant alles kan zien.

Het probleem met de oude technologie (zoals "Animate Anyone") is dat ze vaak maar één foto konden gebruiken. Het was alsof je probeerde een 360-graden video te maken van een auto, maar je had alleen een foto van de voorbumper. Het resultaat? De computer probeerde de rest van de auto te "gokken" (in het Engels: hallucineren). De achterkant van de jurk zag er misschien uit als de voorkant, of de patronen verdwenen gewoon.

ProFashion is de nieuwe oplossing die dit probleem oplost. Hier is hoe het werkt, vertaald in simpele termen:

1. Het Grote Idee: Een Team van Experts in plaats van Eén

In plaats van te vertrouwen op één foto, laat ProFashion de computer kijken naar meerdere foto's tegelijk (bijvoorbeeld voren, achteren en zijkant).

  • De Metafoor: Stel je voor dat je een schilder bent die een portret moet maken. De oude methode gaf je één foto en zei: "Maak een video." ProFashion geeft je een map met drie foto's en zegt: "Gebruik deze om te weten hoe de jurk eruitziet van elke kant."

2. De "Slimme Samenvoeger" (Pose-aware Prototype Aggregator)

De computer moet nu beslissen: "Welke foto moet ik gebruiken op dit moment?" Als het model zich naar links draait, wil je de foto van de linkerkant gebruiken, niet de voorkant.

  • Hoe het werkt: ProFashion heeft een slimme "regisseur" (de Pose-aware Prototype Aggregator). Deze regisseur kijkt naar de houding van het model in de video.
  • De Analogie: Het is alsof je een DJ bent die platen draait. Als de danser (het model) een beweging maakt die lijkt op de foto van de achterkant, "mixt" de DJ die specifieke foto erbij. Hij pakt de beste details van elke foto en plakt ze samen tot één perfecte "sjabloon" (prototype) voor dat exacte moment. Zo krijg je geen wazige mix, maar een helder beeld.

3. De "Stroom-Versterker" (Flow-enhanced Prototype Instantiator)

Het is niet genoeg om alleen de juiste foto te kiezen; de beweging moet ook soepel zijn. Oude methoden maakten vaak haperende video's waarbij de jurk leek te "glijden" of te vervormen.

  • Hoe het werkt: ProFashion gebruikt een extra hulpmiddel dat kijkt naar hoe de gewrichten van het menselijk lichaam bewegen (zoals knieën en ellebogen).
  • De Analogie: Stel je voor dat je een poppetje op een touwtje beweegt. De oude methode sleepte het poppetje soms raar door de lucht. ProFashion gebruikt een onzichtbaar spoor (de Flow) dat precies aangeeft waar elk lichaamsdeel naartoe gaat. Hierdoor glijdt de jurk perfect mee met de beweging, alsof het echt stof is en geen digitale pixels.

4. Waarom is dit belangrijk?

  • Voor winkels: Je kunt nu realistische video's maken van kleding zonder dat je een heel filmteam, een studio en tientallen modellen nodig hebt. Je hebt alleen een paar foto's nodig.
  • Voor de klant: Je ziet precies hoe de kleding eruitziet als je je omdraait. Geen verrassingen meer bij het uitpakken van een pakketje.

Samenvatting

ProFashion is als een slimme mode-assistent die:

  1. Kijkt naar meerdere foto's om alle details van een kledingstuk te kennen.
  2. Slim de juiste foto kiest op basis van hoe het model beweegt.
  3. Zorgt dat de beweging soepel en natuurlijk blijft.

Het resultaat is een video die eruitziet alsof het echt is, zonder dat de computer hoeft te "gokken" over hoe de kleding eruitziet.

Verdrinkt u in papers in uw vakgebied?

Ontvang dagelijkse digests van de nieuwste papers die bij uw onderzoekswoorden passen — met technische samenvattingen, in uw taal.

Probeer Digest →