On the continuum limit of t-SNE for data visualization

이 논문은 데이터 시각화 기법인 t-SNE 의 수렴한계를 연구하여 데이터 점 수가 무한대로 갈 때의 연속 변분 문제를 유도하고, 비볼록성으로 인한 잘 정의된 문제의 부분적 해결과 1 차원에서의 해의 유일성 및 불연속 해 존재를 증명하며, 이를 Perona-Malik 방정식과 연관지어 t-SNE 의 이론적 기반을 제시합니다.

Jeff Calder, Zhonggan Huang, Ryan Murray, Adam Pickarski

게시일 2026-04-15
📖 4 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🎨 t-SNE 란 무엇인가요? (우주 여행 지도 그리기)

상상해 보세요. 여러분은 100 차원이라는 아주 복잡한 우주에 살고 있는 수만 명의 우주인 (데이터) 들을 2 차원 평면 (종이) 에 그려 넣어야 합니다. 이 우주인들은 서로 친한 친구들끼리 모여 있고, 낯선 사람들과는 멀리 떨어져 있습니다.

t-SNE는 이 우주인들을 종이 위에 그려 넣을 때, "친구끼리는 가까이 붙이고, 낯선 사람끼리는 멀리 떨어뜨리는" 지도를 만들어주는 도구입니다. 우리는 이 지도를 보면 데이터가 어떤 그룹 (클러스터) 으로 나뉘어 있는지 한눈에 알 수 있습니다.

하지만 문제는, 이 도구가 그렇게 작동하는지, 그리고 데이터가 무한히 많아지면 (우주인이 수조 명이 되면) 지도가 어떻게 변할지 수학적으로 정확히 설명하기 어렵다는 점입니다. 이 논문은 바로 그 '수학적 비밀'을 밝혀낸 것입니다.


⚖️ 두 가지 힘: 당기는 힘과 밀어내는 힘

t-SNE 가 지도를 그릴 때 두 가지 힘의 균형을 맞추고 있습니다. 이 논문은 이 두 힘을 연속적인 물리 법칙으로 해석했습니다.

  1. 당기는 힘 (Attraction): 친구 (유사한 데이터) 끼리는 서로 끌어당깁니다.
    • 비유: 마치 자석의 N 극과 S 극이 서로 붙으려는 힘입니다.
  2. 밀어내는 힘 (Repulsion): 낯선 사람 (서로 다른 데이터) 끼리는 서로 밀어냅니다.
    • 비유: 사람이 너무 많이 모이면 서로 밀쳐서 공간이 확보되려는 힘입니다.

이 논문은 데이터의 개수가 무한히 많아지면, 이 두 힘이 어떻게 작용하는지 연속적인 에너지 공식으로 바꿨습니다.


🌊 1 차원 세계 (선) vs 고차원 세계 (공간)

논문의 가장 흥미로운 발견은 **차원 (Dimension)**에 따라 결과가 완전히 달라진다는 것입니다.

1. 1 차원 세계 (선 위의 점들)

  • 상황: 우주인들을 일렬로 줄을 서게 하는 상황입니다.
  • 결과: 수학적으로 **완벽한 해답 (최적의 지도)**이 하나뿐입니다.
  • 비유: 선 위에 점들을 배치할 때, 친구끼리 붙이고 낯선 사람끼리 떨어뜨리는 가장 자연스러운 방법이 딱 하나만 존재한다는 뜻입니다. 이 경우 t-SNE 는 매우 예측 가능하게 작동합니다.

2. 고차원 세계 (실제 2 차원, 3 차원 공간)

  • 상황: 우리가 실제로 사용하는 종이나 3D 공간에 지도를 그리는 상황입니다.
  • 결과: 해답이 존재하지 않습니다! (수학적으로 '잘 정의되지 않음'이라고 합니다).
  • 비유:
    • 종이 위에 우주인들을 배치할 때, t-SNE 는 **무한히 많은 작은 구멍 (미세 구조)**을 만들어내며 공간을 찢어버립니다.
    • 마치 프랙탈처럼, 끝없이 잘게 쪼개지면서 에너지가 낮아지는 상태를 만듭니다.
    • 수학적으로 말하면, "최적의 지도"라는 것이 존재하지 않고, 계속 잘게 쪼개지는 과정만 존재한다는 것입니다.
    • 왜 그럴까요? t-SNE 의 '당기는 힘'이 너무 약해서, 지도를 찢어놓아도 (불연속적으로 만들어도) 에너지를 줄일 수 있기 때문입니다.

🧩 왜 t-SNE 는 이상한 모양을 만들까요?

우리가 t-SNE 를 쓸 때, 가끔 데이터가 없는 곳에 갑자기 새로운 그룹이 생기거나, 지도가 이상하게 찢어지는 것을 봅니다.

  • 이유: 이 논문은 이것이 단순한 버그가 아니라, t-SNE 의 본질적인 성질이라고 말합니다.
  • 비유: t-SNE 는 지도를 그릴 때 "부드러운 종이"를 사용하는 것이 아니라, **"접착제가 약한 종이"**를 사용합니다. 그래서 지도를 그리는 과정에서 종이 자체가 찢어지거나 (불연속), 아주 미세하게 구겨지는 현상이 발생합니다.
  • 이 논문은 t-SNE 가 왜 그런 '아름다운 혼란'을 만들어내는지, 그리고 그背后에 숨겨진 수학적 법칙이 무엇인지를 설명해 줍니다.

📉 Perona-Malik 방정식과의 연결 (이미지 노이즈 제거)

이 논문은 t-SNE 의 수학적 구조가 **이미지 노이즈 제거 (Denoising)**에 쓰이는 유명한 'Perona-Malik' 방정식과 매우 비슷하다고 지적합니다.

  • 비유: 사진의 노이즈를 제거할 때, 부드러운 부분은 매끄럽게 하고, 경계선 (예: 눈과 피부의 경계) 은 날카롭게 유지하는 기술이 있습니다.
  • t-SNE 도 비슷하게, 데이터의 **경계 (그룹 사이)**는 날카롭게 찢어지게 만들고, 그룹 내부는 부드럽게 묶어줍니다.
  • 하지만 이 기술은 수학적으로 매우 불안정 (Ill-posed) 하여, 이론적으로는 해가 없거나 무한히 많은 해가 나올 수 있습니다. t-SNE 가 실제로 작동하는 것은 이 불안정성을 '그라디언트 하강 (Gradient Descent)'이라는 방법으로 우회해서 해결하기 때문입니다.

💡 결론: 이 연구가 우리에게 주는 메시지

  1. t-SNE 는 마법 같은 도구가 아닙니다: 그 뒤에는 복잡한 수학적 원리가 숨어 있으며, 특히 데이터가 많아질수록 지도가 어떻게 변할지 예측할 수 있는 '연속적인 법칙'을 발견했습니다.
  2. 왜 t-SNE 가 이상한 모양을 만드는가: 고차원 공간에서는 '최적의 지도'가 존재하지 않기 때문에, t-SNE 는 데이터를 잘게 쪼개는 (미세 구조를 만드는) 방식으로 에너지를 최소화합니다. 이것이 우리가 보는 '아름다운 군집'의 실체입니다.
  3. 미래의 방향: 이 연구를 통해 t-SNE 의 한계를 이해하고, 더 나은 시각화 도구를 만들거나, t-SNE 의 결과를 더 정확하게 해석하는 데 도움을 줄 수 있습니다.

한 줄 요약:

"t-SNE 는 데이터를 시각화할 때, 친구끼리는 붙이고 낯선 사람끼리는 밀어내지만, 데이터가 너무 많으면 지도가 스스로 찢어지고 구겨지는 '불안정한 예술'을 만들어냅니다. 이 논문은 그 불안정함의 수학적 원인을 밝혀냈습니다."

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →