CoMind: Towards Community-Driven Agents for Machine Learning Engineering

In dit paper stellen de auteurs CoMind voor, een multi-agent systeem dat door interactie met een gesimuleerde onderzoeksgemeenschap en het gebruik van een iteratief parallelle exploratiemechanisme, een nieuwe state-of-the-art bereikt met een medaillekans van 36% en in live wedstrijden 92,6% van de menselijke concurrenten verslaat.

Sijie Li, Weiwei Sun, Shanda Li, Ameet Talwalkar, Yiming Yang

Gepubliceerd 2026-03-02
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Het Grote Probleem: De Eenzame Uitvinder

Stel je voor dat je een zeer slimme robot hebt die machine learning (het bouwen van slimme computerprogramma's) kan doen. Tot nu toe werkten deze robots als eenzame uitvinders in een kelder. Ze kregen een probleem, probeerden van alles uit, maar ze luisterden nooit naar de buitenwereld. Ze wisten niet wat anderen al hadden geprobeerd, welke fouten anderen maakten of welke slimme ideeën er al op het internet stonden.

In de echte wereld werken wetenschappers en programmeurs echter niet zo. Ze werken in grote, levende gemeenschappen (zoals op de website Kaggle). Daar delen ze hun code, bespreken ze hun fouten in forums en bouwen ze op elkaars ideeën voort. De paper stelt dat de oude robots te geïsoleerd waren en daardoor vastliepen.

De Oplossing: CoMind (De Slimme Teamspeler)

De auteurs van dit paper hebben een nieuw systeem bedacht genaamd CoMind. Je kunt CoMind zien als een super-georganiseerd onderzoeksteam dat niet alleen werkt, maar actief deelneemt aan een levendige marktplein van ideeën.

Hier is hoe het werkt, stap voor stap:

1. De Simulatie: Een Digitale Wereld (MLE-Live)

Eerst hebben de auteurs een digitale tijdmachine gebouwd (genaamd MLE-Live).

  • De Vergelijking: Stel je een museum voor dat niet alleen oude schilderijen toont, maar ook de gesprekken van de kunstenaars, hun schetsboeken en de reacties van het publiek uit die tijd.
  • Wat het doet: Dit systeem simuleert een echte wedstrijd (zoals op Kaggle) inclusief alle discussies en code die voor de deadline zijn geplaatst. Hierdoor kan CoMind oefenen alsof het echt deelneemt aan een wedstrijd, zonder dat het de antwoorden "vooraf" mag zien.

2. Het Team: CoMind's Vijf Specialisten

CoMind is geen enkele robot, maar een orkest van vijf specialisten die samenwerken. Iedereen heeft een eigen rol, net als in een goed lopend bedrijf:

  • De Coördinator (De Manager): Hij houdt het overzicht. Hij kijkt naar de markt, kiest de beste ideeën uit en verdeelt het werk. Hij zorgt dat iedereen op de hoogte is van wat er in de gemeenschap gebeurt.
  • De Analist (De Onderzoeker): Deze leest alle discussies en code van anderen. Hij zegt: "Kijk, deze oplossing werkt goed, maar die andere heeft een foutje. Laten we die fout oplossen." Hij vat de kennis van duizenden mensen samen in een kort verslag.
  • De Idee-ontwikkelaar (De Dromer): Deze luistert naar de Analist en bedenkt dan nieuwe, creatieve oplossingen. Hij zegt: "Wat als we die ene techniek combineren met die andere? Laten we iets nieuws proberen!"
  • De Programmeurs (De Bouwers): Er zijn meerdere programmeurs die tegelijkertijd werken. Ze nemen de ideeën van de Dromer en bouwen er daadwerkelijk werkende software van. Ze testen het, repareren fouten en verbeteren het.
  • De Beoordelaar (De Scheidsrechter): Deze kijkt eerlijk naar de resultaten. Hij zegt: "Dit werkt beter dan dat, maar niet goed genoeg. Ga nog een keer proberen."

3. De Werkwijze: Een Levendige Cyclus

In plaats van één keer iets te proberen en klaar te zijn, doet CoMind dit in cycli:

  1. Ze kijken wat anderen hebben gedaan.
  2. Ze bedenken een verbetering.
  3. Ze bouwen het.
  4. Ze testen het.
  5. Ze delen het resultaat (in de simulatie) en kijken weer wat anderen nu doen.

Het is alsof je een levendige discussie voert met duizenden experts, terwijl je tegelijkertijd je eigen huis bouwt. Je leert van hun fouten en bouwt op hun successen.

De Resultaten: Waarom is dit geweldig?

De auteurs hebben CoMind getest op 75 oude wedstrijden en ook op 8 echte, lopende wedstrijden op dit moment.

  • De Vergelijking: Stel je voor dat CoMind een marathonloper is die samen met duizenden andere lopers rent. De oude robots liepen alleen, maar CoMind luistert naar de lopers naast hem, past zijn pas aan en leert van hun strategieën.
  • Het Resultaat: CoMind deed het beter dan 92,6% van alle menselijke deelnemers. Op sommige wedstrijden eindigde het zelfs in de top 1% (de allerbeste).

Conclusie

Kortom: CoMind is een AI-systeem dat heeft ontdekt dat "samenwerken" de sleutel is tot succes. In plaats van in een kelder te zitten en alles zelf opnieuw uit te vinden, leert het van de hele wereld. Het bewijst dat als je een AI-agent leert om te communiceren, te luisteren en samen te werken met een gemeenschap, hij veel slimmer en effectiever wordt dan wanneer hij alleen werkt.

Het is de overgang van "Ik weet het wel" naar "Laten we het samen uitvinden".

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →