GOMA: Geometrically Optimal Mapping via Analytical Modeling for Spatial Accelerators

이 논문은 공간 가속기에서의 행렬 곱셈 (GEMM) 매핑 공간의 조합적 폭발 문제를 해결하고, 기하학적 추상화와 분석적 모델링을 기반으로 전역 최적 해를 보장하면서도 기존 최첨단 기법 대비 에너지 - 지연 곱 (EDP) 을 2.24~4.24 배 개선하고 해답 도출 시간을 3.83~73.6 배 단축하는 'GOMA' 프레임워크를 제안합니다.

Wulve Yang, Hailong Zou, Rui Zhou, Jionghao Zhang, Qiang Li, Gang Li, Yi Zhan, Shushan Qiao

게시일 Tue, 10 Ma
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"GOMA"**라는 새로운 도구를 소개합니다. 이 도구의 역할은 인공지능 (AI) 칩이 방대한 양의 데이터를 계산할 때, **"어떻게 하면 가장 빠르고 전기도 아끼면서 작업을 끝낼 수 있을까?"**라는 질문에 대한 완벽한 정답을 찾아주는 것입니다.

기존의 방법들은 "시행착오"를 반복하거나 "대략적인 추측"을 했지만, GOMA 는 수학적으로 100% 최적의 방법을 아주 빠르게 찾아냅니다.

이 복잡한 내용을 일상적인 비유로 쉽게 설명해 드릴게요.


1. 문제 상황: 거대한 도서관과 복잡한 책 정리법

상상해 보세요. 여러분은 거대한 도서관 (인공지능 칩) 을 운영 중입니다. 도서관에는 수백만 권의 책 (데이터) 이 있고, 독자들은 이 책들을 조합해서 새로운 이야기를 만들어야 합니다 (행렬 곱셈/GEMM 작업).

  • 작업: 책 A, B, C 를 가져와서 조합하고, 그 결과를 다시 정리해야 합니다.
  • 문제: 이 책을 어떻게 정리하느냐에 따라 작업 시간이 1 초가 걸릴 수도, 100 시간이 걸릴 수도 있습니다.
    • 책장을 너무 자주 왔다 갔다 하면 (데이터 이동) 시간이 걸리고, 전기도 많이 씁니다.
    • 책장 (메모리) 의 크기는 정해져 있어서, 한 번에 너무 많은 책을 쌓아둘 수 없습니다.
  • 기존의 어려움: 가능한 정리 방법의 조합은 우주의 별 개수보다 많습니다. 그래서 기존 연구자들은 "우연히 좋은 방법을 찾거나", "가장 좋아 보이는 방법을 대충 추측"했습니다. 하지만 항상 최선의 답을 찾지는 못했고, 그 답을 찾으려다 보니 시간이 너무 오래 걸렸습니다.

2. GOMA 의 해결책: "지도와 나침반"을 가진 천재 설계사

GOMA 는 이 문제를 해결하기 위해 세 가지 혁신적인 아이디어를 도입했습니다.

① 3D 큐브로 세상을 보는 눈 (기하학적 추상화)

기존에는 복잡한 계산 과정을 "코드"나 "루프"로만 보았습니다. 하지만 GOMA 는 이를 **3 차원 큐브 (입체 도형)**로 봅니다.

  • 비유: 책 정리 작업을 3D 큐브로 생각하면, "어떤 책이 어디에 있는지"가 한눈에 보입니다.
  • 효과: 이렇게 보면, "책을 어디로 옮기면 가장 적게 움직일지"가 수학 공식으로 딱 떨어집니다. 더 이상 추측이 필요 없습니다.

② "한 번에 끝내는" 계산법 (분석적 모델링)

기존 도구들은 "이렇게 해보고, 저렇게 해보고"를 반복하며 에너지를 계산했습니다. 하지만 GOMA 는 수학 공식 하나로 모든 상황을 계산해냅니다.

  • 비유: 요리사가 재료를 하나하나 저어보며 맛을 보는 게 아니라, 레시피 (공식) 를 보면 바로 "이 요리는 100 점이다"라고 정확히 아는 것과 같습니다.
  • 효과: 어떤 방법을 선택하든, 그 방법이 얼마나 에너지를 쓸지 **순간 (O(1))**에 계산할 수 있습니다.

③ "완벽한 정답"을 보장하는 나침반 (전역 최적화)

기존 방법들은 "지금까지 본 것 중 가장 좋은 것"을 찾으면 멈췄습니다 (국소 최적). 하지만 GOMA 는 수학적 증명을 통해 "이것보다 더 좋은 방법은 절대 존재하지 않는다"라고 보장합니다.

  • 비유: 미로에서 길을 찾을 때, 기존 방법은 "지금 가는 길이 좋아 보이니 계속 가자"라고 했지만, GOMA 는 미로 전체를 위에서 내려다보며 "여기가 유일한 출구다"라고 정확히 지적해 줍니다.

3. 실제 성과: 얼마나 빠른가요?

실험 결과, GOMA 는 기존 최고의 방법들보다 다음과 같은 압도적인 성과를 냈습니다.

  • 에너지 효율 (전기 절약): 같은 작업을 할 때, 2.2 배에서 4.2 배까지 전기를 아껴줍니다. (마치 같은 거리를 가는데, 기존 차는 100km 를 달리는데 GOMA 는 25km 만 달려서 도착하는 것과 같습니다.)
  • 속도 (답을 찾는 시간): 최적의 방법을 찾아내는 데 걸리는 시간이 3.8 배에서 73 배까지 빨라졌습니다.
    • 기존 방법들이 며칠을 고민해야 할 문제를, GOMA 는 몇 초 만에 "최고의 정답"을 찾아냅니다.

4. 요약: 왜 이것이 중요한가요?

지금 우리는 거대한 AI 모델 (LLM) 시대를 살고 있습니다. 이 모델들은 엄청난 전력을 먹습니다. GOMA 는 **"어떻게 하면 이 거대한 AI 칩을 가장 효율적으로 움직일지"**에 대한 수학적으로 증명된 완벽한 설계도를 제공합니다.

  • 기존: "어쩌다 보니 좋은 방법이 나왔어요." (불안정하고 느림)
  • GOMA: "이것이 수학적으로 가장 좋은 방법입니다. 그리고 증명할 수 있어요." (완벽하고 빠름)

결론적으로 GOMA 는 AI 칩이 더 작고, 더 빠르고, 더 친환경적으로 작동할 수 있게 해주는 핵심 열쇠가 될 것입니다.