Covenant-72B: Pre-Training a 72B LLM with Trustless Peers Over-the-Internet

이 논문은 블록체인 프로토콜을 통해 허가 없는 참여를 허용하고 SparseLoCo 최적화기를 활용한 Covenant-72B 를 통해, 대규모 글로벌 분산 학습이 중앙 집중식 모델과 경쟁력 있는 성능을 내며 실현 가능함을 입증했습니다.

Joel Lidin, Amir Sarfi, Erfan Miahi, Quentin Anthony, Shivam Chauhan, Evangelos Pappas, Benjamin Thérien, Eugene Belilovsky, Samuel Dare

게시일 Tue, 10 Ma
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

Covenant-72B: 전 세계의 '누구나'가 함께 만든 거대 인공지능 이야기

이 논문은 **'Covenant-72B'**라는 이름의 거대한 인공지능 (AI) 을 어떻게 만들었는지 설명하는 보고서입니다. 보통 거대 AI 는 구글이나 메타 같은 거대 기업이 수천 개의 고성능 컴퓨터를 한곳에 모아 비싼 돈으로 만들죠. 하지만 이 연구는 전 세계의 일반인들이 각자의 집에서 컴퓨터를 내어주고, 인터넷을 통해 함께 AI 를 학습시켰습니다.

이 과정을 이해하기 쉽게 몇 가지 비유로 설명해 드릴게요.

1. 거대한 퍼즐을 함께 맞추는 '전 세계 게임'

상상해 보세요. 거대한 AI 모델을 완성하기 위해 **1.1 조 개 (1.1 Trillion)**의 퍼즐 조각을 맞춰야 한다고 칩시다.

  • 기존 방식: 한 회사가 수천 명의 전문 인력과 거대한 공장을 세워, 모든 조각을 한곳에서 빠르게 맞추는 방식입니다. 비용이 엄청나게 비싸죠.
  • 이 연구의 방식 (Covenant-72B): 전 세계에 있는 수백 명의 일반인들에게 "누구나 이 퍼즐 조각을 하나씩 맞춰서 보내면 돼!"라고 말합니다. 사람들은 각자 집 컴퓨터 (GPU) 를 켜고, 인터넷을 통해 조각을 보냅니다.
    • 핵심: 참여를 제한하지 않습니다. 누구나, 언제든, 어디서든 참여할 수 있습니다 (이걸 '허가 없는 참여'라고 합니다).

2. "누가 진짜로 일했는지 어떻게 알까?" (가드레일과 Gauntlet)

전 세계 누구나 참여할 수 있다는 건, 누군가 속임수를 쓰거나 엉뚱한 조각을 보낼 수도 있다는 뜻입니다. 여기서 **'Gauntlet (게틀릿)'**이라는 시스템이 등장합니다.

  • 비유: 마치 거대한 오디션 프로그램의 심사위원처럼 작동합니다.
    • 참가자들이 보낸 퍼즐 조각 (학습 데이터) 을 작은 테스트에 통과시켜 봅니다.
    • 진짜로 열심히 일한 사람에게는 보상을 주고, 속임수를 쓰거나 엉뚱한 일을 한 사람은 탈락시킵니다.
    • 블록체인 기술을 써서 이 과정을 투명하게 기록합니다.

3. "메시지 보내기보다 '요약' 보내기" (SparseLoCo)

전 세계 사람들이 인터넷으로 퍼즐 조각을 보낼 때, 모든 조각을 다 보내면 인터넷이 터져버립니다. 그래서 **'SparseLoCo'**라는 기술을 썼습니다.

  • 비유: 친구에게 긴 편지를 보낼 때, 모든 내용을 다 쓰지 않고 핵심 내용만 146 배나 압축해서 보내는 것과 같습니다.
    • AI 가 학습할 때 필요한 모든 정보를 다 보내는 게 아니라, '가장 중요한 변화'만 추려서 아주 작게 압축 (2 비트 양자화) 해 보냅니다.
    • 이렇게 하면 느린 일반 인터넷 연결에서도 AI 학습이 가능해집니다.

4. 결과: 중앙집중식 AI 와도 대등한 실력!

이 프로젝트의 결과는 놀랍습니다.

  • 규모: 720 억 개의 파라미터 (AI 의 뇌세포) 를 가진 72B 모델을 만들었습니다.
  • 성능: 전 세계 일반인들과 느린 인터넷으로 만든 이 AI 는, 거대 기업들이 비싼 데이터센터에서 만든 AI 들과 비슷하거나 더 좋은 성능을 냈습니다.
  • 의미: "AI 는 부자 기업만 만드는 거야"라는 고정관념을 깨뜨렸습니다. 이제 누구나 참여해서 거대 AI 를 만들 수 있는 길이 열렸습니다.

5. 그 후, 대화하는 AI 로 진화 (SFT)

기본 학습을 마친 후, 이 AI 를 사람과 대화할 수 있도록 조금 더 가르쳤습니다 (SFT 단계).

  • 수학 문제 풀기, 논리적 추론, 코드 작성, 심지어 창의적인 이야기 쓰기까지 잘해냅니다.
  • 특히 "명령을 잘 따르는 능력"과 "수학 문제 해결 능력"에서 기존 유명 AI 들과 견주어도 손색이 없는 결과를 보여줬습니다.

요약하자면

이 논문은 **"거대 AI 를 만드는 것이 더 이상 거대 기업의 독무대가 아니다"**라고 선언합니다.

"전 세계의 작은 컴퓨터들이 인터넷으로 연결되고, 서로를 믿지 않아도 되는 시스템 (블록체인) 으로 검증받으며, 압축된 정보만 주고받으면, 우리는 함께 거대하고 똑똑한 AI 를 만들 수 있다."

이는 AI 의 민주화를 향한 거대한 첫걸음이며, 앞으로 더 많은 사람이 AI 개발의 주역이 될 수 있음을 보여준 획기적인 연구입니다.