Each language version is independently generated for its own context, not a direct translation.
Stel je voor dat het maken van een film net zo makkelijk is als het schrijven van een verhaal in een dagboek. Dat is precies wat Doki doet.
In dit onderzoek van Adobe Research introduceren de auteurs een nieuw programma genaamd Doki. Het doel? Om video's maken toegankelijk te maken voor iedereen, zonder dat je jarenlange ervaring met dure videobewerkingssoftware nodig hebt.
Hier is hoe het werkt, vertaald naar alledaagse taal:
1. Het oude probleem: De "Bento-box" chaos
Vroeger (en nu nog vaak) was het maken van een video als het bouwen van een complex legpuzzel in verschillende kamers.
- Je schreef het script in Word.
- Je maakte de personages in een tekenprogramma.
- Je zocht muziek op in een andere app.
- En toen moest je alles samenvoegen in een tijdslijn-editor (zoals Premiere Pro), waar je met tientallen knoppen en balken worstelde.
Het was als proberen een huis te bouwen terwijl je de bakstenen, het cement en het ontwerp in drie verschillende landen moet ophalen.
2. De Doki-oplossing: Alles in één document
Doki verandert dit. Het behandelt video maken niet als een technische klus, maar als schrijven.
Stel je Doki voor als een magisch dagboek:
- Je schrijft een verhaal: Je typt gewoon zinnen en alinea's.
- Het wordt een film: Zodra je een zin schrijft over "een hond die door het bos loopt", maakt de computer direct een filmpje van die scène.
- Geen aparte balken: Er is geen ingewikkelde tijdlijn met duizend kleurtjes. Alles staat in één document, net als een roman.
3. De "Recepten" (Parametrisatie)
Een groot probleem bij AI-video's is dat de personages steeds anders lijken. De hond in scène 1 heeft blauwe ogen, maar in scène 2 heeft hij groene ogen.
Doki lost dit op met recepten (in de paper "definitions" genoemd):
- Je typt een keer:
@Hond = een schattige corgi met een rode das. - Daarna gebruik je die naam (
@Hond) in je verhaal. - Het systeem onthoudt precies hoe die hond eruit moet zien. Het is alsof je een receptboek hebt: als je "corgi" schrijft, weet de kok (de AI) precies welke ingrediënten erin moeten, en blijft de smaak (de look) altijd hetzelfde.
4. De "Regisseur" en de "Assistent"
In Doki werk je samen met een AI-assistent, maar jij bent de regisseur.
- Jij schrijft: Jij bepaalt het verhaal. "De hond loopt naar het vliegveld."
- De AI regelt de rest: De AI zorgt voor de beelden, de geluiden en de muziek.
- Jij houdt de controle: Als de hond er niet leuk uitziet, verander je gewoon de zin in je tekst. De AI past de video direct aan. Het voelt alsof je een gesprek voert met je eigen creatieve team.
5. Wat hebben mensen hiermee gedaan?
De onderzoekers gaven Doki aan 10 mensen (van videoprofessionals tot beginners) voor een week.
- Snelheid: Mensen konden in 15 minuten een video maken die normaal dagen zou kosten.
- Creativiteit: Mensen die nooit eerder een video hadden gemaakt, maakten prachtige verhalen.
- Gevoel: Zelfs als de AI het zware werk deed, voelden de mensen zich nog steeds als de maker. Ze noemden het "regisseren" in plaats van "knutselen".
De grote les
Doki laat zien dat we niet hoeven te leren hoe we met complexe machines moeten praten. We hoeven alleen maar te schrijven.
Het is alsof we eindelijk een toverstaf hebben gevonden. In plaats van te leren hoe je de toverstaf vasthoudt, de juiste knopen draait en de juiste formules opschrijft, hoef je alleen maar te zeggen wat je wilt zien, en de magie gebeurt vanzelf.
Kortom: Doki maakt video maken zo natuurlijk als het schrijven van een e-mail. Je schrijft je droom, en de computer bouwt je film.