COMIC: Agentic Sketch Comedy Generation

Les auteurs proposent un système d'IA entièrement automatisé qui génère des vidéos comiques de type « sketch » en mobilisant une population d'agents inspirés des rôles d'un studio de production et en s'appuyant sur des critiques LLM entraînés sur des données YouTube pour évaluer et optimiser l'humour, produisant ainsi des résultats de qualité professionnelle.

Susung Hong, Brian Curless, Ira Kemelmacher-Shlizerman, Steve Seitz

Publié Thu, 12 Ma
📖 4 min de lecture☕ Lecture pause café

Each language version is independently generated for its own context, not a direct translation.

Imaginez que vous voulez créer un spectacle de sketchs comiques (comme Saturday Night Live ou Les Inrocks), mais que vous n'avez pas d'équipe d'humoristes, de réalisateurs ou de caméramans. Vous avez juste un ordinateur.

Le papier que nous allons explorer s'appelle COMIC. C'est un système d'intelligence artificielle conçu pour être le seul à pouvoir écrire, jouer et filmer ses propres sketches drôles, de bout en bout.

Voici comment cela fonctionne, expliqué avec des images simples :

1. Le problème : Pourquoi les IA ne sont pas drôles (pour l'instant)

Si vous demandez à une IA classique de faire une blague, elle risque de vous sortir un "blague de papa" très ringard. L'humour est subjectif : ce qui fait rire l'un peut faire grogner l'autre. De plus, créer une vidéo longue et cohérente est très difficile pour une IA.

2. La solution : Une "Usine à Rires" avec une équipe virtuelle

Au lieu de demander à une seule IA de tout faire d'un coup, les auteurs de COMIC ont créé une équipe d'agents virtuels qui travaillent comme dans une vraie chaîne de production télévisée, mais avec une petite touche en plus : la compétition.

Imaginez un grand atelier avec plusieurs équipes de créatifs qui travaillent dans des pièces séparées (qu'ils appellent des "îles").

Étape A : L'écriture (Le concours de blagues)

  • Les Écrivains : Plusieurs agents écrivent des scénarios basés sur vos personnages (par exemple, un policier, un robot et un professeur).
  • Les Critiques (Les juges) : Au lieu d'avoir un seul juge, le système a créé une armée de "critiques" virtuels. Ces critiques ont été entraînés en regardant des milliers de vidéos drôles sur YouTube. Ils savent ce qui plaît au public.
  • Le Tournoi : Les scénarios s'affrontent. Le critique dit : "Ce scénario est nul, celui-ci est moyen, mais celui-là est génial !"
  • L'Évolution : Les scénarios perdants ne sont pas jetés. Ils sont réécrits en se basant sur les conseils des gagnants. C'est comme un jeu de "survie" : seuls les scénarios les plus drôles survivent et s'améliorent à chaque tour.

Étape B : Le tournage (Le réalisateur exigeant)

Une fois le meilleur scénario trouvé, il faut le tourner.

  • Le Réalisateur : Il découpe le scénario en plans (images).
  • Les Critiques Vidéo : Ici, des agents spécialisés regardent chaque image générée. Ils disent : "Attends, le robot a l'air bizarre", "Le fond de l'image ne correspond pas à la scène précédente", ou "L'expression du visage n'est pas assez drôle".
  • La Boucle de perfectionnement : L'IA régénère l'image, écoute les critiques, et recommence jusqu'à ce que la vidéo soit parfaite.

3. L'analogie de la "Chasse au Trésor"

Les auteurs comparent leur méthode à la chasse à l'or.

  • Si vous creusez un seul trou (une seule tentative), vous risquez de ne rien trouver.
  • Avec COMIC, vous faites creuser des centaines de trous (des centaines de scénarios et de vidéos) par différentes équipes.
  • Ensuite, vous tamisez tout pour ne garder que les pépites d'or (les moments les plus drôles).
  • Enfin, vous polissez ces pépites jusqu'à ce qu'elles brillent.

4. Pourquoi c'est révolutionnaire ?

  • Pas de "réponse unique" : Contrairement aux maths où il y a une bonne réponse, l'humour n'en a pas. COMIC accepte que l'humour soit multiple (drôle, absurde, sarcastique) et laisse différentes équipes explorer ces styles.
  • Apprentissage par la compétition : Le système ne s'améliore pas en suivant un manuel, mais en se battant contre lui-même. Plus les scénarios concurrents sont bons, plus les perdants doivent s'améliorer pour gagner. C'est comme un sport où la difficulté augmente à chaque match.
  • Résultats étonnants : Selon les tests, les vidéos créées par COMIC sont drôles, cohérentes et parfois aussi bonnes que celles faites par des humains, alors que les autres IA actuelles produisent souvent des vidéos courtes et sans histoire.

En résumé

COMIC, c'est comme avoir un studio de télévision entier dans une seule boîte. Il lance des centaines d'idées, les fait s'affronter dans des tournois de rires, élimine les moins bonnes, et ne garde que les meilleures pour créer une vidéo finale qui vous fera vraiment rire. C'est la première fois qu'une machine arrive à faire tout ce processus de création comique de manière totalement autonome.