The Illusion of Collusion

이 논문은 경쟁자가 서로의 상태나 행동을 알지 못하는 상황에서도 다중-팔 밴딧 알고리즘이 동기화된 행동을 통해 '순진한 담합'을 학습할 수 있음을 보여주며, 이는 탐험과 확정을 어떻게 균형시키는지에 따라 발생 여부가 결정된다고 주장합니다.

Connor Douglas, Foster Provost, Arun Sundararajan

게시일 Tue, 10 Ma
📖 4 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"알고리즘이 서로 대화도 하지 않고, 심지어 상대방의 존재를 모른 채도 어떻게 서로 짜고 가격을 올리는지 (담합)"**에 대한 놀라운 연구를 담고 있습니다.

제목인 **'착각적인 담합 (The Illusion of Collusion)'**이라는 말처럼, 이 알고리즘들은 실제로 "우리 서로 가격 올리자고 합의하자"라고 말한 적이 없습니다. 그냥 각자 "어떻게 하면 돈을 더 많이 벌까?"라고 혼자 고민하다가, 우연히 같은 결론에 도달한 것입니다.

이 복잡한 내용을 일상적인 비유로 쉽게 설명해 드릴게요.


1. 상황 설정: 두 명의 바보 같은 상인

가상 시장이 있다고 상상해 보세요. 여기 두 명의 상인 (A 와 B) 이 있습니다.

  • 상인 A 와 B는 서로의 존재를 알지 못합니다. 상대방이 무엇을 했는지, 어떤 가격을 책정했는지도 모릅니다.
  • 그들은 오직 자신의 경험만 보고 결정을 내립니다. "오늘 비싸게 팔았더니 잘 팔렸어? 아니면 싸게 팔았더니 더 잘 팔렸어?"를 기록만 합니다.
  • 그들은 **'학습 알고리즘 (머신러닝)'**을 사용해서 가격을 정합니다.

이 두 상인이 서로 모르고 각자 학습을 하다가, 우연히 **서로 같은 고가 (High Price)**를 계속 유지하게 되면, 이는 겉보기에 담합처럼 보입니다. 하지만 실제로는 전혀 의도하지 않은 결과입니다.

2. 핵심 발견: "랜덤성 (무작위성)"이 키입니다

이 연구의 가장 중요한 발견은 **"알고리즘이 얼마나 '랜덤 (무작위)'하게 행동하느냐"**에 따라 결과가 완전히 달라진다는 것입니다.

A. "완전한 무작위"를 사용하는 경우 (예: 에psilon-그리디)

  • 비유: 상인이 매일 아침 동전을 던져서 결정합니다. "앞면이면 비싸게, 뒷면이면 싸게 팔자"라고 하되, 가끔은 "오늘은 그냥 임의로 해보자"라고 생각하며 random 하게 행동합니다.
  • 결과: 담합이 일어나지 않습니다.
  • 이유: 너무 자주 random 하게 움직이다 보니, 서로 가격이 맞물려서 "아, 우리가 같이 비싸게 팔면 더 잘 팔리네"라는 패턴을 잡을 틈이 없습니다. 항상 혼란스럽기 때문에 결국 경쟁 상태 (싸게 팔기) 로 돌아갑니다.

B. "점점 덜 랜덤해지고 결정적이 되는" 경우 (예: 탐욕적 알고리즘)

  • 비유: 상인은 처음엔 "무작위"로 실험을 많이 합니다. 하지만 시간이 지나면서 "어? 비싸게 팔았을 때 더 잘 팔리는 것 같아!"라고 확신하게 됩니다. 그리고 나중에는 100% 확신을 가지고 "내일도 무조건 비싸게 팔자!"라고 결정합니다.
  • 결과: 담합이 일어날 가능성이 매우 높습니다.
  • 이유: 두 상인이 모두 "비싸게 팔면 이득이다"라고 학습하게 되면, 서로의 행동을 보지 않아도 **서로 같은 타이밍에 같은 행동 (비싼 가격)**을 하게 됩니다. 마치 두 사람이 거울을 보지 않아도 서로 같은 춤을 추는 것처럼 말이죠.

C. "완전히 결정적인" 경우 (예: UCB 알고리즘)

  • 비유: 상인은 실험도 안 하고, 무작위성도 없습니다. "이론적으로 계산해보니 비싸게 팔아야 이득이다"라고 딱 정해진 규칙대로만 움직입니다.
  • 결과: 항상 담합이 일어납니다.
  • 이유: 두 상인이 똑똑한 똑같은 규칙을 따르기 때문에, 서로의 행동을 예측할 필요도 없이 동일한 시점에 동일한 가격을 책정하게 됩니다. 이는 마치 두 대의 로봇이 같은 프로그래밍을 받아서 같은 행동을 하는 것과 같습니다.

3. '동기화 (Synchronicity)'라는 개념

이 논문은 **'동기화'**라는 새로운 개념을 도입합니다.

  • 두 상인이 동시에 같은 행동을 (예: 동시에 비싼 가격 설정) 하는 빈도입니다.
  • 알고리즘이 무작위성이 적을수록, 두 상인의 행동이 동기화될 확률이 높아집니다.
  • 행동이 동기화되면, 서로가 "아, 우리가 같이 비싸게 팔고 있네? 그럼 이대로 계속하자"라고 학습하게 되어, 결국 담합 상태에 빠지게 됩니다.

4. 왜 이것이 문제인가? (정책적 시사점)

지금까지 법원은 "담합을 하려면 서로 대화하거나 (의사소통), 상대방의 가격을 보고 따라야 한다 (조건부 행동)"는 증거가 있어야만 처벌했습니다.

하지만 이 논문은 **"아니요, 서로 대화도 안 하고, 상대방 가격도 모른 채, 그냥 각자 똑똑한 알고리즘을 썼을 뿐인데도 담합이 일어날 수 있다"**고 말합니다.

  • 경고: 만약 두 회사가 같은 종류의 '최고급 알고리즘'을 쓴다면, 그 알고리즘이 너무 똑똑해서 (랜덤성이 적어서) 서로 의도치 않게 가격을 담합 수준으로 올릴 수 있습니다.
  • 해결책: 단순히 "상대방 가격을 보고 결정하지 마라"라고 금지하는 것만으로는 부족합니다. 알고리즘 자체가 **적당한 수준의 '무작위성 (실수할 가능성)'**을 가지고 있어야, 이런 우연한 담합을 막을 수 있습니다.

5. 한 줄 요약

"두 개의 똑똑한 AI 가 서로 대화도 안 하고 각자 '최고의 이익'을 쫓다 보면, 우연히 서로의 행동을 맞춰서 (동기화되어) 마치 담합한 것처럼 비싼 가격을 유지하게 될 수 있다. 특히 AI 가 너무 확신에 차서 (랜덤성이 사라져서) 행동하면 그 위험은 더 커진다."

이 연구는 AI 가 우리 시장을 어떻게 바꿀 수 있는지에 대한 새로운 경고이자, 규제 당국이 알고리즘의 '랜덤성'까지 고려해야 함을 시사합니다.