Dynamic distortion of inferred reward probability shapes choice over time

이 연구는 시간 경과와 보상 확률에 대한 불확실성 하에서 선택이 어떻게 이루어지는지 규명하며, 추론된 보상 확률의 체계적 왜곡과 보상 기반의 시간 정밀도 조절이라는 두 가지 상호작용 원리가 시간과 보상을 추론해야 하는 상황에서의 행동을 형성함을 보여줍니다.

Grabenhorst, M., Maloney, L. T.

게시일 2026-04-10
📖 3 분 읽기☕ 가벼운 읽기
⚕️

이것은 동료 심사를 거치지 않은 프리프린트의 AI 생성 설명입니다. 의학적 조언이 아닙니다. 이 내용을 바탕으로 건강 관련 결정을 내리지 마세요. 전체 면책 조항 읽기

Each language version is independently generated for its own context, not a direct translation.

🎮 게임의 설정: "시간에 따른 보상의 미스터리"

상상해 보세요. 여러분이 어떤 게임을 하고 있다고 칩시다.

  1. 시작 신호 (Set): 화면에 빨간불이 켜집니다.
  2. 종료 신호 (Go): 잠시 후 초록불이 켜집니다. 이 '빨간불'과 '초록불' 사이의 시간이 매번 무작위로 바뀝니다.
  3. 선택: 초록불이 켜지면, 여러분은 **'왼쪽 버튼'**을 누를지 **'오른쪽 버튼'**을 누를지 즉시 결정해야 합니다.

여기서 중요한 규칙은 다음과 같습니다:

  • 빨간불이 켜진 지 0.4 초 뒤 (초반): 왼쪽 버튼을 누르면 보상을 받을 확률이 매우 높고, 오른쪽은 매우 낮습니다.
  • 빨간불이 켜진 지 1.4 초 뒤 (후반): 상황이 반전됩니다. 오른쪽 버튼이 매우 유리해지고, 왼쪽은 불리해집니다.
  • 중간 지점: 어느 시점에서는 왼쪽과 오른쪽의 보상 확률이 정확히 50:50 이 됩니다.

이 게임의 목표는 **"지금 시간이 얼마나 지났는지"**를 내적으로 추정하고, 그 시간에 따라 **"어떤 버튼을 누르면 보상을 받을 확률이 높은지"**를 계산하여 최적의 선택을 하는 것입니다.


🔍 연구자가 발견한 두 가지 놀라운 사실

사람들은 이 게임을 잘 해냈지만, 완벽하게 계산된 로봇처럼 행동하지는 않았습니다. 연구자들은 사람의 뇌가 이 문제를 해결할 때 두 가지 독특한 방식을 사용한다는 것을 발견했습니다.

1. "확률의 왜곡": 내면의 나침반이 약간 휘어있다 (Dynamic Distortion)

보통 우리는 "보상 확률이 80% 라면 80% 확률대로 행동한다"고 생각하기 쉽습니다. 하지만 이 연구에 따르면, 사람들의 뇌는 확률을 직선적으로 받아들이지 않습니다.

  • 비유: 마치 왜곡된 거울을 통해 세상을 보는 것과 같습니다.
    • 확률이 아주 낮을 때는 (예: 10%), 뇌는 "아, 이건 거의 불가능한 일이야"라고 생각해서 실제보다 더 낮게 평가합니다.
    • 확률이 아주 높을 때는 (예: 90%), 뇌는 "이건 거의 확실한데!"라고 생각해서 실제보다 더 높게 평가합니다.
    • 하지만 **중간 구간 (50% 근처)**에서는 이 왜곡이 줄어들며, 사람들은 "어느 쪽이든 비슷해"라고 생각하다가도, 조금이라도 유리한 쪽으로 확신 있게 선택하려는 경향을 보입니다.

연구자들은 이 현상을 **"로그-오즈 (Log-odds) 공간에서의 선형 변환"**이라고 불렀는데, 쉽게 말해 **"뇌가 확률을 계산할 때, 극단적인 값은 더 극단적으로, 중간 값은 더 확신 있게 해석하는 특유의 필터"**를 쓴다는 뜻입니다. 이 필터 덕분에 사람들은 완벽한 계산은 못 하더라도, 보상을 최대화하는 방향으로 효율적으로 선택을 했습니다.

2. "시간의 흐림": 보상이 중요한 순간에는 시간이 더 선명하다 (Reward-based Temporal Precision)

두 번째 발견은 우리가 시간을 어떻게 느끼는지에 관한 것입니다.

  • 기존의 생각 (웨버의 법칙): "시간이 오래 지날수록, 우리는 시간을 더 흐릿하게 느낀다." (예: 1 초를 재는 것보다 10 초를 재는 게 더 부정확하다.)

  • 이 연구의 발견: "시간이 얼마나 지났는지가 중요한 게 아니라, 그 시간에 보상이 얼마나 큰지가 시간을 흐리게 만드는지 선명하게 만드는지 결정한다."

  • 비유: 카메라의 초점을 생각해 보세요.

    • 보상이 아주 큰 순간 (예: 90% 확률로 당첨되는 순간) 에는 카메라의 초점이 정말 선명하게 맞춰집니다. 뇌는 "지금 이 순간이 중요해!"라고 생각해서 시간을 정밀하게 측정합니다.
    • 반면, 보상이 거의 없는 순간 (예: 10% 확률) 에는 카메라의 초점이 흐릿해집니다. 뇌는 "이때는 뭐가 되든 상관없지"라고 생각해서 시간을 대충 측정합니다.

즉, 우리의 시간 감각은 시계 바늘의 움직임에 따라 변하는 것이 아니라, 그 순간에 기대되는 보상에 따라 변한다는 것입니다.


💡 결론: 우리는 어떻게 살아남는가?

이 연구는 우리의 뇌가 **"시간"**과 **"보상"**이라는 두 가지 불확실한 정보를 동시에 처리할 때, 다음과 같은 지혜를 발휘한다고 말합니다.

  1. 확률을 완벽하게 계산하지 않는다: 대신, 보상을 극대화하는 방향으로 확률을 적절히 왜곡하여 빠르게 결정합니다. (완벽한 수학자보다는 현명한 전략가)
  2. 시간을 기계적으로 재지 않는다: 보상이 중요한 순간에는 시간을 정밀하게 재고, 중요하지 않은 순간에는 대충 재서 에너지를 아낍니다. (효율적인 자원 관리자)

한 줄 요약:

"우리의 뇌는 시간을 재는 시계가 아니라, 보상을 노리는 사냥꾼입니다. 중요한 순간에는 시간을 예리하게 포착하고, 확률을 계산할 때는 완벽함보다 효율적인 선택을 위해 약간의 왜곡을 감수합니다."

이러한 원리는 우리가 일상생활에서 타이밍을 재고, 기회를 포착하며, 불확실한 상황에서 결정을 내리는 방식의 근본적인 메커니즘을 설명해 줍니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →