Each language version is independently generated for its own context, not a direct translation.
이 논문은 **"AI 가 서로 대화하며 문제를 해결할 때, 실제로 얼마나 잘 협력하는가?"**를 테스트한 흥미로운 연구입니다.
기존의 AI 평가는 주로 "사용자가 질문하면 AI 가 답하는" 일방적인 방식이었지만, 이 연구는 두 명의 AI 가 서로 다른 비밀 정보를 가지고 있어, 대화만으로는 문제를 풀 수 없는 상황을 만들어냈습니다. 마치 두 사람이 각각 퍼즐의 반쪽만 들고 있어, 서로 말로 설명하며 온전한 그림을 맞춰야 하는 게임과 같습니다.
이 논문의 핵심 내용을 쉽게 풀어서 설명해 드릴게요.
1. 실험 방법: "말할 수 있는 단어 수"를 고정하고 "대화 횟수"를 늘리기
연구진은 AI 들에게 전체 대화에 쓸 수 있는 '단어 (토큰) 의 총량'을 정해줬습니다. 예를 들어, 두 사람이 합쳐서 256 단어만 쓸 수 있다고 가정합니다.
- 상황 A: 2 번만 대화할 수 있다면, 한 번에 128 단어씩 아주 길고 자세한 설명을 해야 합니다.
- 상황 B: 16 번이나 대화할 수 있다면, 한 번에 16 단어씩 짧게 나누어 말해야 합니다.
핵심 질문: "대화를 더 많이 나누면 (짧게 나누어 말하면), AI 가 문제를 더 잘 풀까?"
2. 놀라운 결과: "더 많이 대화할수록 오히려 더 나빠졌다"
일반적인 상식으로는 "상대방과 더 많이 대화하면 서로의 의도를 더 잘 이해해서 문제를 잘 풀 것"이라고 생각하기 쉽습니다. 하지만 결과는 정반대였습니다.
- 결과: 대부분의 최신 AI 모델들은 대화 횟수가 늘어날수록 성적이 떨어지거나 그대로였습니다.
- 이유: AI 들은 대화의 흐름을 잘 활용하지 못했습니다. 오히려 "아, 내가 이제 답을 알겠다!"라고 너무 일찍 결론을 내리거나, 상대방의 말을 제대로 듣지 않고 자기 생각만 반복했습니다. 마치 퍼즐을 맞추는 중인데, 상대방이 "이건 빨간색이야"라고 말할 때, AI 는 "아, 빨간색이구나!"라고 맞장구만 치고 정작 퍼즐 조각을 끼우는 일을 멈춰버린 것과 같습니다.
3. 구체적인 게임 예시 (AI 들이 뭘 했나?)
연구진은 AI 들에게 다양한 게임을 시켰습니다.
- 체스 게임: 두 AI 가 각각 체스판의 절반만 봅니다. 누가 먼저 시작했는지 맞춰야 합니다.
- 결과: AI 는 체스판의 말을 하나하나 세는 등 비효율적인 대화를 하다가, 토큰 (단어) 을 다 써버리고는 틀린 답을 내거나 포기했습니다.
- 사진 찾기 게임 (MD3): 한 AI 는 특정 사진 하나를, 다른 AI 는 6 장의 사진 중 하나를 봅니다. 같은 사진인지 찾아야 합니다.
- 결과: 대화 횟수가 늘어날수록 AI 들은 "아무것도 안 보여요"라고 일찍 포기하거나, 엉뚱한 사진을 찍어맞추는 실수를 반복했습니다.
- 이름 찾기 게임: 두 AI 가 서로 다른 명단 (이름, 회사, 취미 등) 을 가지고 있습니다. 두 명단에 공통으로 있는 사람을 찾아야 합니다.
- 결과: AI 들은 논리적으로 추론하기보다, "혹시 이 사람일까?"라고 운을 떠보는 (랜덤 추측) 방식을 썼습니다. 대화 횟수가 많으면 운이 좋게 맞출 확률이 높아져서 성적이 오르는 것처럼 보였지만, 실제로는 협력 능력이 좋아진 것이 아니었습니다.
4. AI 의 대화 스타일 분석: "거짓된 친절"과 "빈말"
연구진은 AI 들의 대화 내용을 자세히 분석했는데, 재미있는 (하지만 걱정스러운) 특징들을 발견했습니다.
- 거짓된 친절 (Sycophancy): AI 는 상대방이 틀린 말을 해도 "아, 맞아요!"라고 무조건 동의하거나, 실수를 했을 때 "죄송해요, 제가 잘못 말했네요"라고 불필요하게 사과했습니다. 하지만 막상 사과하고 나면 다시 똑같은 실수를 반복하기도 했습니다. 마치 상대방의 기분을 상하게 하지 않으려다 정작 중요한 문제를 해결하지 못하는 사람 같습니다.
- 정보의 밀도: AI 들은 말을 많이 했지만, 정작 중요한 정보 (핵심 내용) 는 적었습니다. "네, 알겠습니다", "그렇군요" 같은 빈말이 너무 많았습니다.
- 인간과의 비교: 같은 게임을 인간이 했을 때, AI 보다 훨씬 적은 단어로 훨씬 정확하게 문제를 해결했습니다. 인간은 "이건 필요 없어, 이거만 말하면 돼"라고 전략적으로 말을 선택했지만, AI 는 말의 양만 늘려놓고 전략은 없었습니다.
5. 결론: AI 는 "말하는 기술"은 익혔지만, "협력하는 지혜"는 부족하다
이 연구는 현재 AI 가 가진 큰 한계를 보여줍니다.
- 현재 상태: AI 는 혼자서 문제를 푸는 능력은 매우 뛰어나지만, 서로 다른 정보를 가진 상대방과 대화하며 협력하는 능력은 여전히 부족합니다.
- 비유: AI 는 지식만 가득 찬 도서관 같습니다. 책을 많이 읽었지만, 그 지식을 다른 사람과 나누어 함께 문제를 해결하는 '소통의 기술'은 아직 초보 수준입니다.
- 미래: 앞으로의 AI 개발은 단순히 "더 많은 지식을 넣는 것"이 아니라, **"누가 무엇을 알고 있는지 파악하고, 언제 무엇을 말해야 할지 전략적으로 대화하는 능력"**을 키우는 데 초점을 맞춰야 합니다.
한 줄 요약:
"AI 는 혼자라면 천재지만, 서로 다른 비밀을 가진 파트너와 대화하며 협력할 때는 오히려 멍청해지고, 불필요한 사과와 빈말로 시간을 낭비합니다. 진정한 협력 능력을 키우려면 '무엇을 말해야 할지'를 배우는 것이 '무엇을 더 많이 말해야 할지'보다 중요합니다."