COMIC: Agentic Sketch Comedy Generation

O artigo propõe um sistema de IA totalmente automatizado que utiliza uma população de agentes inspirados em papéis de estúdio e críticos de LLM alinhados a preferências reais para gerar vídeos de comédia esboçada de alta qualidade, alcançando desempenho próximo ao de produções profissionais.

Susung Hong, Brian Curless, Ira Kemelmacher-Shlizerman, Steve Seitz

Publicado Thu, 12 Ma
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você quer criar um episódio de um programa de comédia como o Saturday Night Live, mas em vez de contratar 50 roteiristas, diretores e editores, você usa apenas um computador.

Esse é o objetivo do COMIC (Content Optimization via Multi-agent Iterative Competition), um novo sistema de Inteligência Artificial criado por pesquisadores da Universidade de Washington.

Aqui está uma explicação simples de como ele funciona, usando analogias do dia a dia:

1. O Problema: A IA não é engraçada (ainda)

Se você pedir para uma IA comum contar uma piada, ela geralmente dá uma "piada de tio" (aquelas que fazem todo mundo revirar os olhos). Fazer algo que realmente faça as pessoas rirem é difícil porque o humor é subjetivo: o que é engraçado para você pode ser chato para mim. Além disso, fazer um vídeo longo e coerente é um desafio técnico enorme.

2. A Solução: Um "Estúdio de TV" Virtual

Em vez de ter um único robô tentando adivinhar o que é engraçado, o COMIC cria um estúdio de TV inteiro dentro do computador. Ele simula diferentes pessoas com diferentes empregos, como se fosse uma equipe real:

  • Os Roteiristas (Writers): Eles criam ideias de histórias.
  • Os Diretores de Cena (Directors): Eles decidem como a cena deve ser filmada (onde a câmera está, quem fala o quê).
  • Os Críticos (Critics): Esta é a parte mais importante. São "julgadores" que avaliam se a piada é boa.

3. O Segredo: A "Competição de Ilhas"

Aqui está a mágica. Em vez de todos trabalharem juntos em uma única ideia, o sistema divide os roteiristas em ilhas separadas.

  • Imagine um reality show de comédia: Cada ilha tem seu próprio estilo de humor. Na Ilha A, os críticos gostam de humor seco e inteligente. Na Ilha B, eles amam piadas físicas e absurdas.
  • O Torneio: Dentro de cada ilha, os roteiristas competem. Eles mostram suas ideias para os críticos. O roteiro que ganha fica, e o que perde é obrigado a se reescrever, tentando incorporar o que o vencedor fez de bom.
  • Evolução: Com o tempo, os roteiros ficam cada vez melhores porque estão sendo constantemente testados e melhorados, como se estivessem em um "treino de alta performance".

4. O Treinamento dos Críticos: Aprendendo com o YouTube

Como a IA sabe o que é engraçado? Ela não chuta. Os pesquisadores "ensinaram" os críticos analisando milhares de vídeos de comédia reais do YouTube.

Eles olharam para o que as pessoas realmente assistiram até o final e curtiram. Os críticos do COMIC foram calibrados para ter os mesmos gostos que o público real. É como se eles tivessem assistido a anos de SNL e Key & Peele para aprender exatamente o que faz uma plateia rir.

5. Do Roteiro ao Vídeo: O Diretor de Cena

Depois que o roteiro perfeito é escolhido, o sistema vai para a fase de produção:

  1. Storyboard: O "Diretor" desenha mentalmente cada cena.
  2. Geração: A IA cria os vídeos, os rostos dos personagens e as vozes.
  3. Refinamento: Aqui, os críticos voltam a trabalhar. Eles olham o vídeo gerado e dizem: "O personagem piscou de forma estranha" ou "A piada visual não funcionou". O sistema recria a cena até ficar perfeito.

6. O Resultado

O sistema produz vídeos de comédia de 1 a 2 minutos, com personagens consistentes, histórias que fazem sentido e, o mais importante, piadas que funcionam.

Nos testes, o COMIC conseguiu criar vídeos que, na opinião de humanos, são quase tão bons quanto os feitos por equipes profissionais de TV, superando outros sistemas de IA que apenas geram vídeos sem uma estrutura de comédia.

Resumo em uma frase

O COMIC é como um estúdio de TV autônomo onde robôs roteiristas, diretores e críticos competem ferozmente entre si, aprendendo com o gosto do público do YouTube, para criar esquetes de comédia engraçadas e bem produzidas, tudo sem intervenção humana direta.

É a prova de que, para criar arte engraçada, às vezes você não precisa de um gênio solitário, mas sim de uma equipe inteira de robôs brigando por ideias.