COMIC: Agentic Sketch Comedy Generation

Deze paper introduceert een volledig geautomatiseerd AI-systeem dat korte komediesoaps genereert door middel van een agentenpopulatie die de rollen van een productiestudio nabootst en gebruikmaakt van door LLM-aangedreven critici die zijn getraind op YouTube-data om humor te evalueren en de output te optimaliseren.

Susung Hong, Brian Curless, Ira Kemelmacher-Shlizerman, Steve Seitz

Gepubliceerd Thu, 12 Ma
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een regisseur bent voor een komisch televisieprogramma, zoals Saturday Night Live. Je wilt grappige sketches maken, maar je hebt geen team van honderden mensen nodig. In plaats daarvan heb je een robot-team dat dit voor je doet, van het eerste idee tot de laatste seconde van de video.

Dat is wat de onderzoekers van de Universiteit van Washington hebben gebouwd met hun systeem, COMIC. Hier is hoe het werkt, vertaald naar een simpel verhaal:

1. Het Probleem: Robots zijn saai

Normaal gesproken zijn AI's (kunstmatige intelligenties) goed in wiskunde of het schrijven van code, maar ze zijn vaak belachelijk slecht in grappen maken. Als je ze vraagt om een grapje te vertellen, krijg je vaak een ouderwetse "vadergrap" die niemand leuk vindt. Humor is namelijk subjectief; wat voor de één grappig is, is voor de ander saai.

2. De Oplossing: Een Robot-Productiestudio

In plaats van één slimme robot die alles probeert te doen, hebben de onderzoekers een heel robot-team opgezet dat net werkt als een echt filmstudio. Ze hebben verschillende rollen bedacht:

  • De Schrijvers: Die bedenken grappige ideeën.
  • De Critici: Die zeggen wat wel en niet grappig is.
  • De Regisseurs: Die zorgen dat de video er goed uitziet.

3. De Grote Idee: "De Gouden Kooi" (Islands)

Stel je voor dat je een groep schrijvers in één grote kamer zet. Ze zouden waarschijnlijk allemaal hetzelfde type grappen bedenken omdat ze elkaar beïnvloeden.

COMIC doet het anders. Ze splitsen de schrijvers op in verschillende kleine eilanden.

  • Op Eiland A denken de robots dat "droge humor" het allerleukst is.
  • Op Eiland B vinden ze "slapstick" (fysieke grappen) het grappigst.
  • Op Eiland C houden ze van "absurdisme" (raar en onlogisch).

Elk eiland heeft zijn eigen jury (critici) die specifiek is ingesteld op die stijl. De robots op elk eiland concurreren met elkaar. Als een grapje niet goed is, krijgt de schrijver feedback van de jury en moet het herschrijven. Dit gebeurt keer op keer. De slechte grappen vallen af, en de goede worden steeds grappiger.

4. De Jury: Robots die kijken naar YouTube

Hoe weten de robots of iets echt grappig is? Ze hebben geen menselijke gevoelens.
De onderzoekers hebben een slimme truc bedacht: ze hebben de AI's getraind door te kijken naar duizenden echte YouTube-video's van komische shows.

  • Ze kijken naar hoeveel mensen een video hebben bekeken en hoe lang ze er naar hebben gekeken.
  • Als een video veel views heeft, is hij waarschijnlijk grappig.
  • De AI's leren van deze data om te zeggen: "Hey, die grap werkt niet, kijk eens naar die andere video die wel veel views had; die had een betere opbouw."

Dit zorgt ervoor dat de robots niet willekeurig gissen, maar leren wat echte mensen leuk vinden.

5. Van Script naar Video: De Regisseur

Zodra het script (het verhaal) grappig genoeg is, gaat het naar de Regisseur-AI.

  • Deze robot bedenkt hoe het eruit moet zien: "Deze persoon moet hier staan, met die hoed, en dan moet de camera zoomen."
  • Vervolgens maakt de AI de video, het geluid en de animaties.
  • Maar ook hier geldt: niet zomaar accepteren. De video wordt meerdere keren gegenereerd. Een nieuwe jury kijkt naar de beelden en zegt: "Die achtergrond klopt niet," of "Die acteur lijkt niet op de vorige scène."
  • De AI maakt het opnieuw, tot het perfect is.

6. Het Resultaat: Een Grappige Show

Uiteindelijk krijg je een video van 1 tot 2 minuten. Het kan gaan over een agent die onderzoek doet naar gestolen apparatuur, of een professor die een toastmachine in zijn hoofd heeft.

  • De video's zijn consistent: de personages zien er in elke shot hetzelfde uit.
  • Ze zijn grappig: omdat ze door een competitie zijn gegaan, zijn alleen de beste grappen overgebleven.
  • Ze zijn volledig automatisch: de mens hoeft alleen maar te zeggen wie de personages zijn en wat de setting is.

Samenvattend

COMIC is als een oneindige competitie tussen robot-schrijvers en robot-critici. Ze duwen elkaar steeds verder, net als sporters die harder gaan rennen omdat hun tegenstanders sneller worden. Door deze "evolutie" te combineren met het leren van echte YouTube-kijkers, kunnen ze grappige video's maken die bijna net zo goed zijn als die van een professioneel menselijk team, maar dan zonder dat er een mens aan de knoppen zit.

Het is een bewijs dat AI niet alleen goed is in rekenen, maar ook kan leren creëren als je het de juiste structuur en concurrentie geeft.