MOSAIC: A Unified Platform for Cross-Paradigm Comparison and Evaluation of Homogeneous and Heterogeneous Multi-Agent RL, LLM, VLM, and Human Decision-Makers

이 논문은 강화학습, 대규모 언어 모델, 시각 - 언어 모델, 인간 의사결정자 등 다양한 패러다임의 에이전트를 동일한 환경에서 공정하게 비교하고 평가할 수 있는 오픈소스 플랫폼 'MOSAIC'을 제안합니다.

Abdulhamid M. Mousa, Yu Fu, Rakhmonberdi Khajiev, Jalaledin M. Azzabi, Abdulkarim M. Mousa, Peng Yang, Yunusa Haruna, Ming Liu

게시일 2026-03-03
📖 4 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🧩 모자이크 (MOSAIC): 서로 다른 언어를 쓰는 팀원들을 위한 '통역사'이자 '경기장'

이 논문은 2026 년 3 월에 발표된 것으로, 인공지능 (AI) 연구자들이 서로 완전히 다른 방식으로 생각하는 다양한 AI 들과 인간을 한 팀으로 묶어 비교하고 평가할 수 있는 새로운 플랫폼을 소개합니다.

이 복잡한 기술을 일상적인 비유로 쉽게 설명해 드리겠습니다.


1. 문제: "서로 다른 언어를 쓰는 팀원들"

지금까지 AI 연구는 크게 세 가지 부서가 따로 놀고 있었습니다.

  • RL (강화학습) 팀: 바둑이나 비디오 게임을 아주 빠르게 치는 '천재 프로게이머'입니다. 숫자와 행동을 즉각적으로 계산하지만, 말을 못 합니다.
  • LLM/VLM (대형 언어/시각 모델) 팀: 책을 읽고 그림을 해석하는 '지식인'입니다. 말과 글은 잘하지만, 실시간으로 빠르게 반응하는 게임 실력은 아직 부족합니다.
  • 인간 팀: 우리 같은 '일반인'입니다.

기존의 문제점:
이들 세 그룹은 서로 다른 '경기장'과 '규칙'에서 뛰고 있었습니다. RL 팀은 숫자만 주고받고, LLM 팀은 텍스트만 주고받았죠. 그래서 "이 세 팀이 같은 경기에서 함께 뛰면 누가 더 잘할까?" 혹은 "인간과 AI 가 팀을 이루면 어떻게 될까?" 같은 질문을 던지기 어려웠습니다. 마치 축구 선수, 체스 선수, 그리고 피아니스트를 한 팀에 넣어 "누가 더 좋은 팀을 만드는가?"를 묻는 것과 비슷합니다.

2. 해결책: '모자이크 (MOSAIC)' 플랫폼

저자들은 이 문제를 해결하기 위해 모자이크라는 플랫폼을 만들었습니다. 모자이크는 서로 다른 조각 (다양한 AI) 을 하나의 아름다운 그림 (통합된 시스템) 으로 만드는 도구입니다.

🏗️ 핵심 기능 3 가지 (일상 비유)

1. "보이지 않는 통역사" (IPC 프로토콜)

  • 비유: 각 팀원은 서로 다른 언어를 쓰지만, 모자이크는 그들 사이에 보이지 않는 통역사를 배치합니다.
  • 설명: RL 팀은 숫자만 말하고, LLM 팀은 글만 쓰더라도 모자이크는 이들을 자동으로 번역해서 게임에 적용합니다. 원래 코드를 하나도 고치지 않고도 서로 다른 AI 를 바로 연결할 수 있습니다.

2. "모든 팀원을 위한 통일된 유니폼" (오퍼레이터 추상화)

  • 비유: 축구, 농구, 배구 선수가 모두 같은 유니폼을 입고 같은 경기장에 들어가는 것과 같습니다.
  • 설명: 어떤 AI 가 들어오든 (RL 이든, LLM 이든, 인간이든) 모자이크는 그들에게 **"이게 너의 역할이야"**라고 통일된 규칙을 줍니다. 그래서 연구자들은 복잡한 기술적 차이를 무시하고, 오직 "성능"에만 집중할 수 있습니다.

3. "동일한 조건에서의 공정한 경기" (크로스-패러다임 평가)

  • 비유: 모든 선수가 같은 날씨, 같은 경기장, 같은 시작 시간에 뛰는 것입니다.
  • 설명: 모자이크는 랜덤 시드 (랜덤 번호) 를 공유합니다. 즉, "오늘 비가 오니까 LLM 이 유리할까?" 같은 변명을 없애고, 오직 어떤 AI 가 더 똑똑한지를 순수하게 비교할 수 있습니다.

3. 이 플랫폼으로 무엇을 할 수 있나요?

🎮 시나리오 1: "혼합 팀" 만들기

  • 상황: 2 대 2 축구 경기를 시킵니다.
  • 팀 구성:
    • 초록 팀: 1 명은 '프로게이머 AI(RL)', 1 명은 '지식인 AI(LLM, GPT-4o)'
    • 파란 팀: 1 명은 '프로게이머 AI', 1 명은 '무작위 AI(랜덤)'
  • 결과: 지식인 AI 가 프로게이머 AI 와 얼마나 잘 협력할 수 있는지, 혹은 서로 다른 사고방식이 팀워크를 망치는지 바로 확인할 수 있습니다.

👀 시나리오 2: "동시 관찰"

  • 화면을 나누어 RL 팀이 보는 숫자 데이터, LLM 팀이 읽는 텍스트, 인간이 보는 화면을 동시에 보여줍니다.
  • "왜 LLM 이 여기서 실수를 했을까?"라고 연구자가 직접 눈으로 확인하며 분석할 수 있습니다.

4. 왜 이것이 중요한가요?

과거에는 "AI 가 게임을 잘하나요?"라고 물었을 때, 어떤 AI인지에 따라 답이 달랐습니다. 하지만 모자이크는 이제 다음과 같은 질문을 가능하게 합니다.

  • "게임에서 인간LLM이 팀을 이룰 때, RL AI보다 더 잘할까?"
  • "시각을 가진 AI(VLM) 가 텍스트만 보는 AI(LLM) 보다 전략을 더 잘 세울까?"
  • "서로 다른 사고방식을 가진 AI 들이 섞여 있을 때, 팀워크가 깨질까?"

이것은 마치 다양한 재능을 가진 예술가들이 한 무대에서 함께 공연하는 것을 연구하는 것과 같습니다. 모자이크는 그 무대를 제공하고, 조명과 마이크를 맞춰주어, 누구의 공연이 더 빛나는지 공정하게 평가할 수 있게 해줍니다.

📝 요약

**모자이크 (MOSAIC)**는 서로 다른 언어 (데이터 형식) 를 쓰는 강화학습 AI, 언어 AI, 시각 AI, 그리고 인간을 하나의 경기장에 모아, 동일한 규칙으로 함께 뛰게 하고 그 결과를 공정하게 비교할 수 있게 해주는 초대형 통합 플랫폼입니다.

이제 연구자들은 더 이상 "어떤 AI 가 더 좋은가?"가 아니라, **"서로 다른 AI 들이 함께 일할 때 어떤 일이 일어나는가?"**라는 더 깊고 흥미로운 질문을 던질 수 있게 되었습니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →