Geometric Reasoning in the Embedding Space

이 논문은 그래프 신경망과 트랜스포머가 이산 2D 그리드상의 점 위치를 예측하는 과정에서 제약 조건에 따른 숨겨진 도형을 임베딩 공간에서 형성하고 그리드 구조를 복원하며, 특히 설계된 그래프 신경망이 트랜스포머보다 성능과 확장성 측면에서 월등히 우수함을 입증합니다.

Jan Hůla, David Mojžíšek, Jiří Janeček, David Herel, Mikoláš Janota

게시일 2026-03-03
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"인공지능 (AI) 이 어떻게 기하학적 문제를 해결하는지, 그 내부에서 무슨 일이 일어나는지"**를 밝힌 연구입니다.

쉽게 말해, **"AI 가 머릿속으로 도형을 그릴 때, 실제로 그 도형의 모양을 '그림'으로 그려내고 있는 걸까?"**라는 호기심에서 시작합니다.

이 내용을 일상적인 비유로 설명해 드리겠습니다.


1. 연구의 배경: 블랙박스 vs. 머릿속 그림

우리는 AI 가 복잡한 수학 문제 (예: 올림피아드 기하학 문제) 를 잘 푼다는 걸 압니다. 하지만 AI 가 어떻게 그 답을 찾는지 그 '내부 과정'은 마치 **검은 상자 (Black Box)**처럼 보이지 않습니다.

  • 기존의 AI (Transformer): 마치 외국어를 모르는 사람이 단어장만 보고 문장을 맞추는 것과 비슷합니다. "A 는 B 의 중점이다"라는 문장을 외워서 답을 내지만, 그 문장이 의미하는 '공간적인 위치'를 머릿속으로 그리는지는 알 수 없습니다.
  • 이 연구의 질문: "AI 가 문제를 풀 때, 우리 인간처럼 머릿속에 도형을 그려서 (Mental Image) 답을 찾을까?"

2. 실험 방법: 2D 그리드 위의 퍼즐

연구진은 AI 에게 복잡한 수학 문제 대신, 20x20 크기의 점들이 있는 격자 (그리드) 위에서 퍼즐을 풀게 했습니다.

  • 미션: "A 점과 B 점을 연결하면 C 점이 가운데에 오고, D 점은 E 점을 기준으로 대칭이다" 같은 규칙 (제약 조건) 을 주고, 숨겨진 점들의 위치를 찾아내게 했습니다.
  • 모델 비교: 두 가지 AI 모델을 비교했습니다.
    1. Transformer: 문장 처리에 특화된 모델 (예: ChatGPT).
    2. GNN (그래프 신경망): 점과 선의 관계를 그래프로 표현하는 모델.

3. 주요 발견 1: AI 의 '머릿속 지도'가 완성된다!

가장 놀라운 발견은 AI 가 학습을 거듭할수록, 그 내부의 데이터 (임베딩) 가 실제로 2D 격자 모양으로 정렬되었다는 것입니다.

  • 비유: 처음에는 AI 의 머릿속이 무작위로 흩어진 구슬 같았습니다. 하지만 학습이 진행되면서, 이 구슬들이 스스로 20x20 격자 모양으로 줄을 서서 정렬하기 시작했습니다.
  • 의미: AI 가 단순히 "A 라는 글자 다음에 B 가 온다"는 패턴만 외운 게 아니라, 실제 공간적인 거리와 위치 관계를 스스로 이해하게 되었다는 뜻입니다. 마치 AI 가 문제를 풀기 위해 자신만의 지도를 그려낸 것과 같습니다.

4. 주요 발견 2: GNN 이 '건축가', Transformer 는 '시공자'

두 모델의 성능 차이는 극명했습니다.

  • GNN (그래프 신경망): 이 모델은 건축가처럼 행동했습니다. 점과 점 사이의 관계 (선) 를 먼저 파악하고, 그 관계를 바탕으로 전체 구조를 차근차근 쌓아 올렸습니다. 복잡한 문제일수록 훨씬 잘 풀었고, 격자 크기가 커져도 잘 적응했습니다.
  • Transformer: 이 모델은 시공자처럼 문장 순서대로 답을 찾아나갔습니다. 하지만 문제가 복잡해지거나 격자가 커지면 길을 잃고 엉뚱한 답을 내놓는 경우가 많았습니다.
  • 결론: 기하학적인 '관계'를 푸는 문제에는 GNN 이 훨씬 더 적합하고 강력하다는 것을 증명했습니다.

5. 주요 발견 3: 답을 찾는 과정은 '점진적인 수정'

AI 가 정답을 한 번에 맞추는 게 아니라, 점점 더 정확한 위치로 수정해 나가는 과정을 거쳤습니다.

  • 비유: 마치 어두운 방에서 벽을 더듬어 가며 위치를 찾는 사람처럼, AI 는 처음에는 대략적인 위치를 잡았다가 (예: "어디쯤 있겠지?"), 반복해서 정보를 주고받으며 (반복 계산) 정확한 좌표로 수렴해 갔습니다.
  • 의미: 이는 AI 가 단순한 암기가 아니라, **최적화 과정 (Continuous Optimization)**을 통해 답을 찾아내고 있음을 보여줍니다.

6. 왜 이 연구가 중요한가요?

이 연구는 AI 가 단순히 통계적 확률로 답을 맞추는 게 아니라, 실제 세계의 공간적 구조를 이해하는 능력을 스스로 발달시킬 수 있음을 보여줍니다.

  • 해석 가능성 (Interpretability): 우리는 이제 AI 가 문제를 풀 때 머릿속에서 어떤 '지도'를 그리고 있는지, 그 과정이 어떻게 이루어지는지 볼 수 있게 되었습니다.
  • 미래: 만약 AI 가 복잡한 기하학 문제를 스스로 '그림'으로 이해할 수 있다면, 로봇이 물체를 조작하거나 자율주행차가 길을 찾는 등 실제 세계와 상호작용하는 능력도 크게 향상될 것입니다.

요약

이 논문은 **"AI 가 기하학 문제를 풀 때, 머릿속에 실제로 도형을 그려내고 그 모양을 반복해서 다듬어 정답을 찾는다"**는 사실을 밝혀냈습니다. 특히 GNN 이라는 모델이 이 작업을 훨씬 더 잘해내며, AI 가 단순한 암기 기계가 아니라 공간을 이해하는 사고를 가진 존재가 될 수 있음을 보여주었습니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →