Modeling the dynamics of social exchange in groups with reinforcement learning and Theory of Mind

이 연구는 강화학습과 심리이론 (ToM) 을 결합한 계산 모델링을 통해, 자원 공유가 단순한 상호성뿐만 아니라 파트너 유지와 대안 탐색 간의 전략적 균형을 위한 심리이론 기반의 교차 행동을 통해 이루어짐을 규명했습니다.

Zhang, S., Wang, H., Mendoza, R. B.

게시일 2026-03-27
📖 3 분 읽기☕ 가벼운 읽기
⚕️

이것은 동료 심사를 거치지 않은 프리프린트의 AI 생성 설명입니다. 의학적 조언이 아닙니다. 이 내용을 바탕으로 건강 관련 결정을 내리지 마세요. 전체 면책 조항 읽기

Each language version is independently generated for its own context, not a direct translation.

🎁 핵심 비유: "선물 나누기 게임"과 "심리 전술"

이 연구는 세 명의 사람이 한 방에 모여서 **"선물 (토큰) 을 주고받는 게임"**을 반복하는 실험을 했습니다.

  • 상황: 매번 한 명씩 '선물 주는 사람 (Actor)'이 되어 나머지 두 명 중 한 명에게 선물을 줍니다.
  • 목표: 이 게임에서 사람들은 어떻게 선물을 나누었을까? 그리고 그 뒤에는 어떤 생각이 숨어 있을까?

연구진은 이 행동을 설명하는 네 가지 가설 (모델) 을 세우고, 어떤 것이 가장 현실적인지 비교했습니다.

1. 발견된 놀라운 행동 패턴: "균형 잡기"와 " reciprocation (호혜)"

실험 결과, 사람들은 두 가지 행동을 동시에 했습니다.

  • 균형 잡기 (Alternating): "어제 A 에게 줬으니, 오늘은 B 에게 줘야지." (누군가에게만 계속 주는 게 아니라 두 사람을 오가며 공평하게 나눠줌)
  • 호혜 (Reciprocity): "어제 A 가 내게 선물을 줬으니, 오늘 나도 A 에게 줘야지." (받은 만큼 돌려줌)

이건 마치 친구들과 밥을 먹을 때, "오늘은 내가 사줄게, 다음엔 네가 사줘"라고 돌아가며 계산하는 것과 비슷합니다.

2. 핵심 질문: "우리는 정말 '공정함' 때문에 그렇게 할까?"

많은 사람은 "사람들이 선물을 골고루 나누는 건 **공정함 (Fairness)**을 중요하게 생각해서일 거야"라고 생각합니다. 하지만 연구진은 의심을 품었습니다.

  • 실험 2 (공정한지 확인하기): 게임 도중 무작위로 누군가의 선물을 빼앗는 상황을 만들었습니다. 만약 사람들이 '공정함'을 위해 행동했다면, 선물을 잃은 사람에게 더 많이 줘야 했을 것입니다.
  • 결과: 아니요! 사람들은 오히려 선물을 잃지 않은 사람에게 더 많이 줬습니다.
  • 해석: 사람들은 "공정함"을 위해 행동한 게 아니라, "누가 내 선물을 잘 받아줄지, 그리고 나중에 내게 돌려줄지"를 계산하는 전략적 사고를 하고 있었습니다.

3. 결정적인 발견: "마음 읽기 (Theory of Mind)"의 승리

연구진은 컴퓨터 모델을 통해 사람의 뇌가 어떤 방식으로 작동하는지 시뮬레이션했습니다.

  • 모델 A (단순 학습): "A 가 어제 선물을 줬으니, 오늘도 줄까?" (단순히 과거 기록만 봄)
  • 모델 B (마음 읽기): "A 는 내게 선물을 줬는데, A 는 내게 선물을 줬을 때 내가 어떻게 반응할지 알고 있을까? A 는 내가 '선물을 받으면 고마워해서 다시 줄 것'이라고 생각할까?"

결과: 단순한 기록만 남기는 모델보다, 상대방의 마음을 상상하며 ("내가 이렇게 행동하면 상대방은 어떻게 생각할까?") 전략을 짜는 '마음 읽기 (Theory of Mind)' 모델이 사람의 행동을 가장 정확하게 예측했습니다.

4. 실험 3 (심리 테스트): "상대방이 나를 어떻게 볼까?"

세 번째 실험에서는 상대방이 "내가 누구에게 선물을 줄지"를 맞춰보게 했습니다.

  • 사람들은 단순히 과거 기록만 보고 맞추는 게 아니라, **"상대방도 나와 똑같이 생각할 거야 (내가 공평하게 나누면 상대방도 그렇게 생각할 거야)"**라고 상상하며 맞추는 능력이 뛰어났습니다.
  • 이는 마치 연극에서 배우가 "내가 이 대사를 하면 관객은 어떻게 반응할까?"를 상상하며 연기하는 것과 같습니다.

💡 결론: 우리는 단순한 계산기가 아니라, 심리전술가입니다

이 연구가 우리에게 알려주는 메시지는 다음과 같습니다.

  1. 우리는 '공정함'보다 '전략'을 더 중요하게 생각합니다: 선물을 골고루 나누는 것은 단순히 착해서가 아니라, 관계를 유지하면서도 새로운 기회를 탐색하기 위한 지혜로운 전략입니다.
  2. 우리는 상대방의 머릿속을 읽습니다: 좋은 관계를 맺기 위해서는 단순히 "내가 무엇을 줬나"를 기억하는 게 아니라, **"내가 무엇을 주면 상대방이 어떻게 생각할까?"**를 미리 상상하는 **마음 읽기 능력 (Theory of Mind)**이 필수적입니다.
  3. 사회적 관계는 '심리 게임'입니다: 우리가 친구나 동료와 관계를 맺을 때, 무의식적으로 상대방의 마음을 시뮬레이션하며 "이 사람은 내 다음 행동을 어떻게 예측할까?"를 계산하고 있습니다.

한 줄 요약:

"우리가 선물을 나누고 관계를 맺는 것은 단순한 착함 때문이 아니라, 상대방의 마음을 미리 읽으며 '누구와 어떻게 관계를 이어갈지'를 계산하는 고도의 심리 전략을 쓰기 때문입니다."

이 연구는 인공지능이나 로봇이 인간과 자연스럽게 어울리려면, 단순한 규칙을 따르는 것을 넘어 상대방의 마음을 상상할 수 있는 능력을 갖춰야 함을 시사합니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →