Each language version is independently generated for its own context, not a direct translation.
Stel je voor dat je een kunstenaar bent die een schilderij wil maken, maar in plaats van te tekenen, geef je de kunstenaar alleen een mondelinge beschrijving. Je zegt: "Teken een rode auto links en een blauwe hond rechts."
Het probleem? De kunstenaar is creatief, maar niet altijd precies. De "rode" auto kan oranje zijn, en de "links" kan eigenlijk wel in het midden staan. Voor een gewone foto is dat prima, maar voor professioneel werk (zoals reclames of ontwerpen) wil je vaak: "De auto moet exact op coördinaat X staan en de kleur moet exact #FF0000 zijn."
Dit is precies het probleem dat het nieuwe model BBQ oplost. Hier is hoe het werkt, vertaald naar simpele taal:
1. Het Probleem: Woorden zijn vaag, cijfers zijn zeker
Tot nu toe moesten we AI-modellen vertellen wat ze moesten doen met woorden. Woorden zoals "groot", "links" of "donkerblauw" zijn subjectief. Iedereen interpreteert dat anders.
Professionals hebben echter cijfers nodig. Ze willen weten: "Het object moet precies op 30% van de breedte staan" en "De kleur moet exact deze specifieke tint rood zijn."
2. De Oplossing: BBQ (Bounding Boxes & Qolors)
De onderzoekers van BRIA AI hebben een nieuw model gebouwd dat niet alleen naar woorden luistert, maar ook naar nummers. Ze noemen het BBQ (een knipoog naar Bounding Boxes en Qolors – met een 'Q' voor de 'Q' in BBQ, maar het gaat om de kleur).
De creatieve analogie: De "Super-Vertaler"
Stel je BBQ voor als een super-geavanceerde chef-kok in een restaurant.
- De oude manier: Je zegt tegen de chef: "Maak een salade met wat tomaatjes links en komkommers rechts." De chef maakt het, maar de tomaatjes liggen misschien wel in het midden en de komkommers zijn misschien niet zo groen als jij bedoelde.
- De BBQ-methode: Je geeft de chef een exacte receptkaart met coördinaten. "Leg de tomaatjes precies op punt (30, 50) en de komkommers op (70, 20). Gebruik exact deze specifieke groene kleurcode."
- Het resultaat: De chef (het AI-model) maakt precies wat je vraagt, zonder gissen.
3. Hoe werkt het? (Zonder ingewikkelde techniek)
Het mooie aan dit onderzoek is dat ze de "motor" van de AI niet hebben vervangen. Ze hebben de trainingsdata aangepast.
- Ze hebben de AI niet geleerd om te "rekenen" in de code.
- Ze hebben de AI gewoon duizenden voorbeelden getoond waarbij de beschrijvingen niet alleen woorden bevatten, maar ook de exacte nummers (coördinaten en kleuren).
- De AI heeft geleerd: "Ah, als ik dit nummer zie, moet ik het object daar neerzetten."
4. De "Magische" Vertaler (De VLM)
Natuurlijk wil jij als gebruiker niet zelf een ingewikkeld formulier invullen met honderden nummers. Je wilt gewoon zeggen: "Zet een hond in de hoek."
Daarom gebruiken ze een tweede AI (een "Vertaler"):
- Jij zegt: "Een hond in de hoek."
- De Vertaler (een slimme taalmodel) denkt: "Oké, ik ga dit omzetten naar de taal van BBQ." Hij schrijft: "Hond, coördinaten (80, 80, 95, 95), kleur (bruin, code #8B4513)."
- BBQ kijkt naar die nummers en maakt het plaatje.
5. Waarom is dit zo cool? (De "Kleurenpipet" en "Sleepfunctie")
Omdat de AI werkt met nummers, kun je het plaatje heel makkelijk aanpassen zonder alles opnieuw te maken.
- Sleepfunctie: Als je de hond wilt verplaatsen, hoef je niet te zeggen "verplaats de hond naar links". Je sleept de hond gewoon in de interface. De AI ziet dat de nummers veranderen en past alleen de hond aan. De achtergrond blijft precies hetzelfde.
- Kleurenpipet: Wil je de hond rood maken? Je klikt op rood in je kleurenpalet. De AI ziet het nieuwe kleurnummer en maakt de hond rood, terwijl de rest van het beeld onveranderd blijft.
Samenvatting
Vroeger was het genereren van afbeeldingen met AI een beetje als gokken: je hoopte dat de AI je bedoeling zou begrijpen.
Met BBQ is het meer als programmeren: je geeft exacte instructies (nummers) en de AI voert ze perfect uit. Het maakt het mogelijk om afbeeldingen te maken die niet alleen mooi zijn, maar ook precies zoals een ontwerper of professional ze nodig heeft, zonder dat je een computerexpert hoeft te zijn.
Ontvang papers zoals deze in je inbox
Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.