Humans use a dual policy to improve inferences during epistemic information seeking

이 연구는 인간이 보상을 추구하는 탐색이 아닌 지식 습득 상황에서 추론 정확도를 높이기 위해 새로운 옵션을 반복적으로 시료하는 '스트리킹'과 불확실성 기반 탐색이라는 이중 정책을 사용한다는 것을 세 가지 연구를 통해 규명했습니다.

원저자: Cao, Y., Almeras, C., Lee, J. K., Maye, I., Wyart, V.

게시일 2026-02-16
📖 3 분 읽기☕ 가벼운 읽기

원저자: Cao, Y., Almeras, C., Lee, J. K., Maye, I., Wyart, V.

원본 논문은 CC BY 4.0 (https://creativecommons.org/licenses/by/4.0/) 라이선스로 제공됩니다. ⚕️ 이것은 동료 심사를 거치지 않은 프리프린트의 AI 생성 설명입니다. 의학적 조언이 아닙니다. 이 내용을 바탕으로 건강 관련 결정을 내리지 마세요. 전체 면책 조항 읽기

🎒 핵심 주제: "알고 싶은 마음" vs "이익을 얻고 싶은 마음"

우리는 매일 수많은 선택을 합니다.

  • 이익을 추구할 때 (MATCH 조건): "오늘 점심은 익숙한 김치찌개일까, 아니면 새로운 파스타일까?" (익숙한 걸 선택해 배를 채우는 것).
  • 지식을 추구할 때 (GUESS 조건): "이 두 개의 가방 중 어떤 가방에 파란색 보석이 더 많을까?" (단순히 호기심을 해결하려는 것).

연구진은 사람들이 돈이나 보상이 없는 상황 (호기심만 있는 상황) 에서 정보를 어떻게 수집하는지 실험했습니다.

🌟 놀라운 발견: "연속 클릭" (Streaking) 현상

실험 결과, 사람들은 새로운 정보를 찾을 때 매우 특이한 패턴을 보였습니다. 이를 '연속 클릭 (Streaking)' 이라고 부릅니다.

비유로 설명하자면:

두 개의 미스터리 상자가 있습니다. 하나는 '파란색 보석'이 많을 것 같고, 다른 하나는 '주황색 보석'이 많을 것 같습니다.

일반적인 상식 (최적의 전략): 두 상자를 번갈아 가며 열어보며 ("한 번은 A, 한 번은 B") 어느 쪽이 더 확실한지 빠르게 판단해야 합니다.

사람들의 실제 행동: 사람들은 한 상자를 연속해서 5~6 번이나 열어봅니다. (A, A, A, A, A...) 그리고 나서야 다른 상자로 넘어갑니다. (B, B, B...)

마치 한 가지 가설을 검증하듯 "이건 파란색이 맞나? 아니, 파란색이 맞아! 확실히 해보자!" 하며 한 번에 몰아서 확인하는 것입니다.

이런 '연속 클릭'은 처음에는 비효율적으로 보일 수 있지만, 연구진은 이것이 인간 뇌의 독특한 지혜임을 발견했습니다.

🧠 왜 인간은 이렇게 할까요? (뇌의 노이즈와 비유)

인간의 뇌는 완벽한 컴퓨터가 아닙니다. 정보를 처리할 때 약간의 '소음 (노이즈)' 이나 '기억력 저하' 가 발생합니다.

  • 비유: 비가 오는 날에 우산을 들고 길을 걷는다고 상상해보세요.
    • 번갈아 걷기 (A, B, A, B): 우산을 왼쪽으로 들었다가 오른쪽으로 들기를 반복하면, 빗물이 얼굴에 튀는 것을 정확히 파악하기 어렵습니다. (정보의 소음이 섞임)
    • 연속 클릭 (A, A, A, A): 한쪽 방향으로만 우산을 계속 들고 있으면, "아, 왼쪽이 훨씬 젖지 않구나!"라고 명확하게 판단할 수 있습니다.

연구에 따르면, 뇌의 처리 과정이 완벽하지 않을 때 (소음이 있을 때), 한 가설에 집중해서 정보를 모으는 '연속 클릭' 방식이 오히려 더 정확한 결론을 내게 해줍니다. 마치 안개가 낀 날, 한곳을 집중해서 바라보면 사물이 더 선명해지는 것과 같습니다.

🤖 로봇은 왜 못 할까요? (AI 와 인간의 차이)

연구진은 인공지능 (RNN) 을 훈련시켜 같은 과제를 시켰습니다.

  • AI 의 결과: AI 는 보상을 최대화하거나 정보를 가장 효율적으로 수집하는 '번갈아 보기' 전략을 금방 터득했습니다. 하지만 '연속 클릭' 같은 비효율적인 행동은 절대 하지 않았습니다.
  • 의미: '연속 클릭'은 인간만이 가진 고유한 습관입니다. 이는 인간 뇌의 한계 (소음, 기억력) 를 보완하기 위해 진화한 전략일 수 있습니다. AI 는 완벽하게 계산하지만, 인간은 ' imperfect (불완전한)' 뇌를 가지고 있기 때문에 오히려 이런 독특한 전략이 더 잘 작동하는 것입니다.

🧩 성격에 따른 차이: "조급함" vs "지혜"

연구진은 참가자들의 성격과 행동 패턴을 비교했습니다.

  1. 조급한 사람 (인지적 폐쇄성 필요): 결론을 빨리 내리고 싶어 하는 사람들은 '연속 클릭'을 잘 하지 않았습니다. 대신 정보를 빨리 정리하려다 실수를 더 많이 했습니다.
  2. 지혜로운 사람 (높은 추론 능력): 논리적 사고력이 뛰어난 사람들은 '연속 클릭'을 잘 활용하면서도, 나중에 불확실한 정보를 찾아내는 능력도 뛰어났습니다.

즉, 조급함은 학습을 방해하지만, 인내심 있게 한 가설을 검증하는 습관은 더 나은 학습으로 이어집니다.

📝 한 줄 요약

"새로운 것을 배울 때, 우리는 한 가지를 몰아서 확인하는 '연속 클릭' 전략을 씁니다. 이는 비효율적으로 보일지라도, 우리 뇌의 약점 (소음) 을 보완하여 더 정확한 결론을 내게 해주는 인간만의 지혜입니다."

이 연구는 우리가 왜 때로는 비효율적으로 보이는 행동을 하는지, 그리고 그것이 실제로는 우리 뇌가 세상을 더 잘 이해하기 위해 개발한 현명한 적응 전략임을 보여줍니다.

연구 분야의 논문에 파묻히고 계신가요?

연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.

Digest 사용해 보기 →