MOSAIC: A Unified Platform for Cross-Paradigm Comparison and Evaluation of Homogeneous and Heterogeneous Multi-Agent RL, LLM, VLM, and Human Decision-Makers

O artigo apresenta o MOSAIC, uma plataforma de código aberto que permite a comparação e avaliação unificada de agentes heterogêneos (incluindo RL, LLMs, VLMs e humanos) em ambientes compartilhados, facilitando pesquisas reprodutíveis entre diferentes paradigmas de decisão.

Abdulhamid M. Mousa, Yu Fu, Rakhmonberdi Khajiev, Jalaledin M. Azzabi, Abdulkarim M. Mousa, Peng Yang, Yunusa Haruna, Ming Liu

Publicado 2026-03-03
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você é um organizador de um grande torneio de jogos. Até hoje, você tinha três torneos separados: um só para robôs que aprendem sozinhos (RL), um só para "cérebros" de texto gigantes (LLMs) e um só para pessoas reais jogando. O problema? Ninguém conseguia colocar um robô, um cérebro de texto e uma pessoa na mesma mesa, jogando o mesmo jogo ao mesmo tempo, para ver quem era o melhor parceiro ou o melhor adversário.

É aí que entra o MOSAIC.

O MOSAIC é como uma plataforma de tradução universal e um estádio de jogos unificado criado por pesquisadores da China e do Egito. O objetivo deles é simples: permitir que diferentes tipos de "jogadores" (sejam eles robôs, inteligências artificiais de texto, modelos que veem imagens ou humanos) joguem juntos, lado a lado, de forma justa e controlada.

Aqui está como funciona, usando analogias do dia a dia:

1. O Problema: A "Torre de Babel" dos Jogadores

Antes do MOSAIC, os robôs falavam uma língua (números e dados), os cérebros de texto falavam outra (frases escritas) e os humanos precisavam de um teclado e uma tela. Tentar juntá-los era como tentar fazer um pianista, um cantor de ópera e um dançarino de breakdance se apresentarem juntos, mas sem ninguém saber a partitura do outro. Eles não conseguiam se entender.

2. A Solução: O MOSAIC como um "Maestro" e um "Tradutor"

O MOSAIC resolve isso com três truques mágicos:

  • O Protocolo de Mensageiro (IPC): Imagine que cada jogador (robô, IA ou humano) está em um quarto isolado. O MOSAIC não entra no quarto para mudar como eles pensam. Em vez disso, ele coloca um mensageiro na porta de cada um. Esse mensageiro pega o que o robô diz (números), traduz para o que o humano precisa ver (uma imagem na tela), e vice-versa. É como um tradutor simultâneo que permite que todos conversem sem que ninguém precise mudar sua própria língua nativa.
  • O "Cartão de Identidade" Único (Operador): O sistema trata todos da mesma forma. Para o MOSAIC, não importa se o jogador é um robô super-rápido ou um humano devagar; todos recebem um "cartão de identidade" padrão. Isso permite que o sistema peça a qualquer um: "Faça sua jogada agora", e receba a resposta de volta, não importa de quem venha.
  • O Estádio de Comparação Justa: O MOSAIC permite rodar o jogo duas vezes, exatamente igual. Na primeira, o time é composto por robôs. Na segunda, por IAs de texto. Na terceira, por humanos. Como o "tempo" e o "tabuleiro" são idênticos (mesmas sementes aleatórias), você pode dizer com certeza: "O robô foi melhor que a IA de texto neste cenário".

3. Os Dois Modos de Jogar

O sistema oferece duas formas de testar esses times:

  • Modo Manual (O "Replay" em Câmera Lenta): Você pode pausar o jogo a cada jogada e ver, lado a lado, o que o robô pensou, o que a IA de texto escreveu e o que o humano fez. É como assistir a um filme com legendas de todos os jogadores, permitindo ver exatamente onde um errou e o outro acertou.
  • Modo Script (O "Maratona" Automático): Você escreve um roteiro e deixa o sistema rodar milhares de jogos sozinho, coletando dados para ver quem vence mais vezes no longo prazo, sem precisar de ninguém olhando a tela.

Por que isso é importante?

Imagine que você quer criar um time de resgate onde um robô voa, um drone com câmera ajuda e um humano toma as decisões finais. Antes, era impossível testar se essa combinação funcionava bem. Com o MOSAIC, os pesquisadores podem simular isso agora.

Eles podem responder perguntas como:

  • "Um robô treinado sozinho consegue trabalhar bem com um humano que nunca viu esse robô antes?"
  • "Uma IA que lê texto consegue cooperar com uma IA que vê imagens?"
  • "Quem toma decisões melhores em um jogo de estratégia: um humano, um robô ou um modelo de linguagem?"

Resumo

O MOSAIC é a primeira "ponte" que conecta o mundo dos robôs, o mundo das IAs de texto e o mundo dos humanos. Ele não tenta consertar os jogadores; ele apenas cria um ambiente onde todos podem jogar juntos, falar a mesma língua e ser comparados de forma justa. É como se, pela primeira vez, o futebol, o xadrez e o pôquer pudessem ser jogados na mesma mesa, com as mesmas regras, para ver quem é o verdadeiro campeão da cooperação.

O código desse projeto é gratuito e aberto, permitindo que qualquer pesquisador no mundo comece a testar essas misturas de inteligência hoje mesmo.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →