Improvisational Games as a Benchmark for Social Intelligence of AI Agents: The Case of Connections

이 논문은 AI 에이전트의 사회적 지능을 평가하기 위해 새로운 즉흥적 언어 게임 'Connections'를 제안하고, 이 게임이 단순한 추론을 넘어 다른 에이전트의 인지 상태를 파악하고 협업하는 능력을 측정하는 효과적인 벤치마크임을 입증합니다.

Gaurav Rajesh Parikh, Angikar Ghosal

게시일 2026-04-02
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"AI 가 서로 얼마나 잘 통하는지, 그리고 상대방의 마음을 얼마나 잘 읽을 수 있는지"**를 테스트하기 위해 고안된 재미있는 단어 게임 **'커넥션스 (Connections)'**에 대한 연구입니다.

이 내용을 일상적인 언어와 비유로 쉽게 설명해 드릴게요.

1. 게임의 규칙: "너는 내가 뭘 생각 중인지 알아맞혀!"

이 게임은 '힌트 맞추기' 게임입니다.

  • 진행자 (Setter): 마음속으로 하나의 단어를 정합니다. (예: 'Catamaran'이라는 배)
  • 추측꾼 (Guessers): 진행자가 알려준 첫 글자 (예: 'C') 를 바탕으로 힌트를 주고, 서로의 힌트를 맞춰가며 단어를 찾아냅니다.
  • 핵심 규칙:
    • 추측꾼 A 가 "고양이처럼?"이라고 힌트를 주면, 진행자는 "아니, 고양이는 아니야"라고 막을 수 있습니다.
    • 하지만 추측꾼 B 가 "문장 중간에 쉼표"라고 힌트를 주고, 다른 추측꾼이 "쉼표 (Comma)"라고 맞히면, 진행자는 그 단어를 막을 수 없습니다.
    • 이 과정에서 알파벳이 하나씩 드러나고, 결국 진행자가 생각한 단어를 맞춰내면 게임이 끝납니다.

2. 연구의 목적: "AI 는 '공감'할 수 있을까?"

기존의 AI 테스트는 주로 "지식 퀴즈를 얼마나 잘 풀까?"나 "글을 얼마나 잘 요약할까?"를 보았습니다. 하지만 이 연구는 **사회적 지능 (Social Intelligence)**을 봅니다.

  • 비유: 만약 AI 가 "고양이"라는 단어를 생각한다면, 인간은 "고양이"를 떠올릴 때 '귀여운 동물', '야옹', '털' 같은 연상을 합니다. 하지만 AI 는 단순히 '고양이'라는 단어의 정의만 알고 있을 수 있습니다.
  • 문제: 게임에서 힌트를 줄 때, 너무 쉬운 말 (예: "프랑스 수도") 을 하면 진행자가 바로 막아버립니다. 너무 어려운 말 (예: "내가 어릴 때 키웠던 애완견") 을 하면 다른 추측꾼이 못 맞힙니다.
  • 목표: AI 가 **"내가 이 힌트를 주면, 상대방은 이해할까? 진행자는 막을 수 있을까?"**를 예측하고, 상대방의 지식 수준을 파악해서 최적의 힌트를 줄 수 있는지를 테스트하는 것입니다.

3. 실험 결과: AI 는 아직 '감'이 부족해요

연구진은 GPT-4o 모델을 이용해 이 게임을 시뮬레이션했습니다. 결과는 흥미로웠습니다.

  • 성공적인 점: AI 는 단어의 뜻을 알고 있고, 문맥을 이해하는 능력은 뛰어났습니다.
  • 아쉬운 점:
    • 상대방의 마음을 읽지 못함: 모든 AI 가 똑같은 '머리' (모델) 를 쓰기 때문에, 서로의 생각 패턴이 너무 비슷했습니다. 마치 똑같은 쌍둥이끼리 게임을 하는 것처럼, 한쪽이 힌트를 주면 다른 쪽이 바로 알아차리고, 진행자도 그 힌트를 금방 막아버렸습니다.
    • 비논리적인 행동: 가끔은 인간이라면 절대 하지 않을 이상한 추측을 하거나, 마지막 단계를 앞두고 엉뚱한 단어를 고르기도 했습니다.
    • 맥락 파악 실패: 인간은 "저 사람은 TV 드라마에 잘 알고 있겠지", "저 사람은 의학 용어에 익숙할 거야"라고 상대방의 배경을 파악해서 힌트를 줍니다. 하지만 AI 는 상대방이 어떤 배경을 가졌는지 직접 파악하지 못하고, 단순히 통계적 확률에만 의존했습니다.

4. 결론 및 미래: "AI 에게 '감성'을 심어주자"

이 연구는 AI 가 단순히 지식을 저장하는 '두뇌'를 넘어, **상대방의 마음을 읽고 상황에 맞춰 행동하는 '사회적 두뇌'**를 갖는 것이 중요하다고 말합니다.

  • 미래의 가능성: 만약 AI 에게 "너는 의대생이야", "너는 10 대야"처럼 서로 다른 배경 (프로필) 을 부여하고, 상대방의 반응을 관찰하며 학습하게 한다면, 더 똑똑하고 인간적인 협력이 가능해질 것입니다.
  • 핵심 메시지: 진정한 지능은 혼자 문제를 푸는 것이 아니라, 함께 놀면서 상대방이 무엇을 알고, 무엇을 모르는지 감지하고 소통하는 능력입니다.

한 줄 요약:

이 논문은 AI 가 "너는 내가 뭘 생각 중인지 알아맞혀" 게임을 통해, **상대방의 마음을 읽고 상황에 맞춰 소통하는 능력 (사회적 지능)**이 얼마나 부족한지, 그리고 어떻게 발전시켜야 하는지를 보여줍니다.