Composer: A Search Framework for Hybrid Neural Architecture Design

Dit paper introduceert Composer, een modulaire zoekframework voor hybride neurale architecturen dat door middel van schaalstrategieën nieuwe LLM-ontdekkingen mogelijk maakt die Llama 3.2 overtreffen in prestaties en efficiëntie.

Bilge Acun, Prasoon Sinha, Newsha Ardalani, Sangmin Bae, Alicia Golden, Chien-Yu Lin, Meghana Madhyastha, Fei Sun, Neeraja J. Yadwadkar, Carole-Jean Wu

Gepubliceerd 2026-03-12
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Composer: De "Masterchef" die de perfecte receptuur voor AI ontdekt

Stel je voor dat het bouwen van een groot taalmodel (zoals de slimme AI's die we vandaag gebruiken) net zo is als het bakken van een gigantische taart. Tot nu toe hebben alle bekende taarten (zoals de beroemde "Llama" taarten) precies hetzelfde recept gevolgd: afwisselend een laagje beslag (MLP) en een laagje vulling (Attention). Dit werkt goed, maar misschien is het niet de beste taart die we kunnen bakken.

De onderzoekers van Meta en de Universiteit van Texas hebben een nieuwe tool bedacht, genaamd Composer. Composer is geen taartbakker zelf, maar een slimme zoekmachine die duizenden nieuwe recepten uitprobeert om te zien welke taart het lekkerst is, zonder dat ze elke taart eerst in een enorme oven hoeven te bakken.

Hier is hoe het werkt, vertaald naar alledaagse taal:

1. Het Probleem: Te veel keuzes, te weinig tijd

Het ontwerp van een AI-model is als een enorm legbord. Je kunt de blokken (de verschillende onderdelen van de AI) op miljarden manieren stapelen. Als je elk mogelijk recept zou uitproberen door het echt te bakken (trainen), zou het je jaren kosten en een fortuin aan stroom kosten. Vroeger lieten experts hun eigen "buikgevoel" beslissen welk recept ze probeerden. Maar dat is als gokken in het casino.

2. De Oplossing: Composer, de "Proefbakker"

Composer is een slimme framework die het proces automatiseert. Het doet dit in vier stappen, alsof je een proefkeuken runt:

  • De Zoekmachine (Search Engine): In plaats van een hele grote taart te bakken, bakt Composer eerst een mini-taartje (een heel klein model). Het probeert honderden variaties: "Wat als we 2 lagen beslag en 4 lagen vulling doen?" of "Wat als we eerst vulling doen en dan beslag?".

    • De slimme truc: Het gebruikt een techniek die lijkt op Bayesian Optimization. Stel je voor dat je een blind proefje doet. Als de eerste proef taartje te droog is, zegt de computer: "Oké, de volgende keer doen we meer boter." Het leert snel van elke fout en zoekt steeds gericht naar het perfecte recept.
  • De Proefkeuken (Evaluator): Hoe weet je of een mini-taartje goed is, als je hem nog niet in de grote oven hebt gedaan? Composer gebruikt speciale proefkaarten (zoals het MAD-dataset). Dit zijn simpele, synthetische puzzels die de AI moet oplossen. Als de mini-taart deze puzzels goed oplost, is de kans groot dat de grote taart ook goed is. Het is alsof je een kok test met een simpele soep voordat je hem de hele bankettaart laat maken.

  • De Samenvoeger (Aggregator): Na het testen van honderden mini-taarten heeft Composer een lijst met de beste kandidaten. Soms is de ene taart goed, maar de andere iets beter. In plaats van één te kiezen, mixt Composer de beste onderdelen van allemaal. Het kijkt: "Welke laag komt het vaakst voor in de beste taarten?" en bouwt daar een nieuw, super-recept van.

  • De Vergroter (Extrapolator): Nu hebben we het perfecte recept voor een mini-taart. Hoe maken we er een gigantische taart van? Composer gebruikt twee methoden:

    • Stapelen: Je neemt het kleine blokje en stapelt het 1000 keer op elkaar.
    • Uitrekken: Je neemt het patroon en maakt elke laag gewoon groter, alsof je een elastiek uitrekt.
    • Het wonder: Het recept dat perfect werkte voor het mini-taartje, werkt ook perfect voor de gigantische taart van 8 miljard parameters!

3. Het Resultaat: De Nieuwe "Super-Taart"

Met Composer hebben de onderzoekers een nieuw type AI-model ontdekt, dat ze "Composite" noemen.

  • Het recept: In plaats van de standaard 1-op-1 verhouding (1 laag beslag, 1 laag vulling), bleek dat een verhouding van 1 op 2 (1 laag beslag, 2 lagen vulling) veel beter werkt.
  • De voordelen:
    • Smaakt beter: De AI maakt minder fouten en leert sneller dan de huidige beste modellen (zoals Llama 3.2).
    • Sneller gebakken: Omdat er minder zware lagen (Attention) zijn, is het sneller om te trainen en sneller om te gebruiken.
    • Minder energie: Het kost minder stroom en geheugen om te draaien.

Conclusie

Voorheen was het vinden van een beter AI-recept een kwestie van geluk en hard werken. Met Composer hebben de onderzoekers een automatische "Masterchef" gecreëerd die systematisch duizenden recepten test in een mini-keuken, en dan het beste recept schaalbaar maakt naar een gigantische keuken.

Het bewijst dat we niet vastzitten aan de oude, standaard manier van bouwen. Door slim te zoeken en te experimenteren, kunnen we AI-modellen maken die slimmer, sneller en zuiniger zijn. Het is alsof we eindelijk hebben ontdekt dat je taart niet altijd in dezelfde volgorde moet worden gebakken om perfect te zijn.