MOSAIC: A Unified Platform for Cross-Paradigm Comparison and Evaluation of Homogeneous and Heterogeneous Multi-Agent RL, LLM, VLM, and Human Decision-Makers

Dit paper introduceert MOSAIC, een open-source platform dat het mogelijk maakt om homogene en heterogene multi-agent systemen, variërend van versterkingsleer en grote taalmodellen tot menselijke spelers, op een reproduceerbare manier te vergelijken en te evalueren binnen een uniek, visueel gericht framework.

Abdulhamid M. Mousa, Yu Fu, Rakhmonberdi Khajiev, Jalaledin M. Azzabi, Abdulkarim M. Mousa, Peng Yang, Yunusa Haruna, Ming Liu

Gepubliceerd 2026-03-03
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een enorm, futuristisch sporttoernooi organiseert. Maar hier is het rare: je wilt dat een robot (die alleen maar cijfers en snelheid begrijpt), een superintelligente chatbot (die alleen maar tekst leest en schrijft), een mens (die met een muis en toetsenbord speelt) en een camera-geleide drone (die beelden ziet) allemaal tegen elkaar spelen in exact hetzelfde spel.

Vroeger was dit onmogelijk. Het was alsof je een voetbalwedstrijd probeerde te spelen waarbij de ene speler een basketbal draait, de andere een schaakbord gebruikt en de derde alleen maar roept wat hij denkt dat hij moet doen. De systemen spraken elkaar niet.

MOSAIC is de oplossing voor dit probleem. Het is een nieuwe, open-source softwareplatform dat fungeert als de ultieme "vertaler" en "scheidsrechter" voor deze verschillende soorten intelligenties.

Hier is hoe het werkt, vertaald naar alledaagse termen:

1. De "Vertaalbus" (De Werkers)

Stel je voor dat elke speler (de robot, de chatbot, de mens) in zijn eigen kleine, afgesloten busje zit. Ze kunnen niet direct met elkaar praten.

  • MOSAIC heeft een slim systeem gebouwd waarbij elke bus via een speciale "vertaalbus" (een protocol) met het centrale stadion communiceert.
  • De robotbus stuurt zijn cijfers, de chatbotbus stuurt zijn tekst, en de menselijke bus stuurt zijn toetsaanslagen.
  • MOSAIC pakt al deze verschillende berichten op, zet ze om in een taal die het spel begrijpt, en stuurt ze naar het veld. Het belangrijkste: niemand hoeft zijn eigen bus te verbouwen. De robot blijft een robot, de chatbot blijft een chatbot. MOSAIC doet het zware vertaalwerk.

2. De "Universele Scheidsrechter" (De Operator)

In het verleden hadden we verschillende scheidsrechters voor verschillende sporten. MOSAIC introduceert één universele scheidsrechter.

  • Of het nu een robot is die een actie kiest op basis van wiskunde, of een mens die op 'Enter' drukt, voor MOSAIC is het allemaal gewoon een "speler die een zet doet".
  • Dit maakt het mogelijk om eerlijk te vergelijken: "Wie is sneller? De robot of de mens?" zonder dat de regels voor de ene speler anders zijn dan voor de andere.

3. De "Twee Manieren om te Kijken" (Evaluatie)

MOSAIC biedt twee manieren om deze wedstrijden te bekijken, net zoals je een wedstrijd live kunt kijken of later als samenvatting kunt bekijken:

  • De Live-Show (Handmatige modus): Je kunt alles in slow-motion zien. Je ziet naast elkaar wat de robot ziet, wat de chatbot denkt, en wat de mens doet. Je kunt pauseren en precies zien waar de robot een fout maakt terwijl de chatbot het perfect begrijpt. Het is alsof je een film kijkt met commentaar van alle spelers tegelijk.
  • De Automatische Rapportage (Script modus): Je kunt het systeem een opdracht geven om duizenden wedstrijden te spelen terwijl jij slaapt. De volgende morgen krijg je een gedetailleerd rapport: "De robot won 60% van de tijd, de chatbot 30%, en de mens 10%." Dit is perfect voor wetenschappers die harde feiten nodig hebben.

Waarom is dit zo belangrijk?

Vroeger konden onderzoekers alleen kijken naar robots tegen robots, of chatbots tegen chatbots. Ze konden niet echt zeggen: "Is een mens beter dan een AI in dit specifieke spel?" omdat ze niet in hetzelfde spel konden spelen.

Met MOSAIC kunnen we nu eindelijk:

  • Kijken of een mens en een AI samen een team kunnen vormen (bijvoorbeeld in een noodscenario).
  • Testen of een chatbot beter is dan een robot in strategische spellen.
  • Zien hoe een mens reageert als hij samenwerkt met een camera-drone.

Samenvatting

MOSAIC is als een gigantisch vertaal- en sportcomplex dat eindelijk alle verschillende soorten intelligentie (robots, AI, mensen) op één veld brengt. Het zorgt ervoor dat ze allemaal dezelfde regels spelen, dezelfde ballen zien en eerlijk tegen elkaar kunnen worden vergeleken. Het opent de deur voor een nieuwe wereld van onderzoek waar we kunnen leren hoe deze verschillende vormen van intelligentie samen kunnen werken in plaats van alleen maar apart te bestaan.

De broncode is gratis beschikbaar, zodat iedereen dit toernooi kan organiseren en verder kan bouwen.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →