AnimeAgent: Is the Multi-Agent via Image-to-Video models a Good Disney Storytelling Artist?

Dit paper introduceert AnimeAgent, het eerste Image-to-Video multi-agent framework voor het genereren van consistente en expressieve animatiestoryboards, dat inspiratie put uit Disney's workflow om de beperkingen van statische modellen te overwinnen en state-of-the-art resultaten te behalen.

Hailong Yan, Shice Liu, Tao Wang, Xiangtao Zhang, Yijie Zhong, Jinwei Chen, Le Zhang, Bo Li

Gepubliceerd 2026-02-25
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een Disney-film wilt maken, maar in plaats van een team van honderden tekenaars, heb je maar één slimme robot. Die robot moet een verhaal vertellen met beelden, waarbij personages er steeds hetzelfde uitzien, de actie logisch verloopt en de sfeer perfect is.

Dat is precies wat AnimeAgent doet. Het is een nieuw systeem dat probeert deze moeilijke taak op te lossen door te kijken naar hoe echte animatoren werken.

Hier is hoe het werkt, vertaald in simpele taal:

1. Het Probleem: De "Plak-en-Kopie" Robot

Vroeger waren robots die plaatjes maakten (op basis van tekst) als een fotograaf die alleen statische foto's maakt.

  • Ze konden een mooie foto van Sneeuwwitje maken.
  • Maar als je vroeg om een volgende foto waar ze rent, zette de robot vaak Sneeuwwitje neer, maar dan met een andere jurk, of ze stond ineens op de verkeerde plek.
  • Het was alsof de robot een foto plakte, de tekst veranderde, en weer een nieuwe foto plakte. Er was geen echte "beweging" of logica tussen de beelden. Het leek meer op een collage dan op een film.

2. De Oplossing: De Disney-Strategie

De makers van AnimeAgent keken naar hoe Disney-animatoren in de oude tijd werkten. Ze gebruikten twee technieken:

  • Straight Ahead: Tekenen van begin tot eind, één frame na het ander. Dit geeft een natuurlijk gevoel van beweging.
  • Pose to Pose: Eerst de belangrijkste momenten (de "pieken" van de actie) tekenen, en dan de rest invullen.

AnimeAgent combineert deze twee. Het denkt niet in losse plaatjes, maar in een bewegende film.

3. Hoe werkt AnimeAgent? (Het Team van Robots)

In plaats van één robot die alles doet, heeft AnimeAgent een team van drie gespecialiseerde robots die samenwerken, net als een filmset:

🎬 De Regisseur (Director Agent)

Stel je voor dat je een regisseur hebt die het script leest.

  • De regisseur neemt jouw simpele zin ("Sneeuwwitje loopt door het bos") en maakt er een gedetailleerd plan van.
  • Hij schrijft precies op: "Sneeuwwitje heeft blauwe ogen, rode jurk, en loopt naar een huisje."
  • Hij zorgt dat in de volgende scène Sneeuwwitje er nog steeds hetzelfde uitziet. Hij is de "hoofd van de zaak" die ervoor zorgt dat niemand de regels breekt.

🎨 De Artiest (Artist Agent)

Dit is de robot die daadwerkelijk de beelden maakt.

  • In plaats van losse plaatjes te maken, gebruikt deze robot een Image-to-Video model.
  • De Analogie: Stel je voor dat je een poppetje hebt. De Artiest maakt eerst één foto van het poppetje (het startpunt). Vervolgens "laat hij het poppetje bewegen" in zijn hoofd. Hij genereert een video van de actie.
  • Omdat het een video is, weet de robot automatisch hoe een arm beweegt of hoe haar in de wind waait. Hij "plakt" niet meer; hij animeert. Dit zorgt voor veel soepelere bewegingen.

👁️ De Criticus (Reviewer Agent)

Dit is de kwaliteitscontroleur die alles checkt.

  • De Consistentie-Criticus: Kijkt of Sneeuwwitje in scène 1 en scène 5 nog steeds dezelfde jurk draagt. Als dat niet zo is, zegt hij tegen de Regisseur: "Hé, pas het plan aan, ze heeft nu ineens een groene jurk!"
  • De Gemengde Criticus: Kijkt of het plaatje er mooi uitziet én of het verhaal klopt. Hij kiest uit de video de beste momenten (de "Extremes"). Net als in een stripboek kies je niet elke seconde, maar alleen de momenten waar de actie het spannendst is.

4. Waarom is dit zo goed?

Het systeem heeft een nieuwe testbank gemaakt met echte, door mensen getekende voorbeelden om zichzelf te testen.

  • Resultaat: AnimeAgent maakt verhalen waarbij personages er consistent uitzien, de beweging logisch is, en de sfeer perfect past bij het verhaal.
  • Het is alsof je van een robot die alleen foto's plakt, bent overgestapt op een robot die een echte filmstudio runt.

Samenvattend

AnimeAgent is als een slimme regisseur die een team aanstuurt:

  1. Een Regisseur die het script vertaalt naar een strak plan.
  2. Een Artiest die een video maakt in plaats van losse foto's (dus echte beweging).
  3. Een Criticus die alles controleert en de beste beelden kiest.

Hierdoor krijg je eindelijk digitale verhalen die voelen als echte Disney-films, zonder dat je duizenden tekenaars nodig hebt.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →