Each language version is independently generated for its own context, not a direct translation.
Covenant-72B: 전 세계의 '누구나'가 함께 만든 거대 인공지능 이야기
이 논문은 **'Covenant-72B'**라는 이름의 거대한 인공지능 (AI) 을 어떻게 만들었는지 설명하는 보고서입니다. 보통 거대 AI 는 구글이나 메타 같은 거대 기업이 수천 개의 고성능 컴퓨터를 한곳에 모아 비싼 돈으로 만들죠. 하지만 이 연구는 전 세계의 일반인들이 각자의 집에서 컴퓨터를 내어주고, 인터넷을 통해 함께 AI 를 학습시켰습니다.
이 과정을 이해하기 쉽게 몇 가지 비유로 설명해 드릴게요.
1. 거대한 퍼즐을 함께 맞추는 '전 세계 게임'
상상해 보세요. 거대한 AI 모델을 완성하기 위해 **1.1 조 개 (1.1 Trillion)**의 퍼즐 조각을 맞춰야 한다고 칩시다.
- 기존 방식: 한 회사가 수천 명의 전문 인력과 거대한 공장을 세워, 모든 조각을 한곳에서 빠르게 맞추는 방식입니다. 비용이 엄청나게 비싸죠.
- 이 연구의 방식 (Covenant-72B): 전 세계에 있는 수백 명의 일반인들에게 "누구나 이 퍼즐 조각을 하나씩 맞춰서 보내면 돼!"라고 말합니다. 사람들은 각자 집 컴퓨터 (GPU) 를 켜고, 인터넷을 통해 조각을 보냅니다.
- 핵심: 참여를 제한하지 않습니다. 누구나, 언제든, 어디서든 참여할 수 있습니다 (이걸 '허가 없는 참여'라고 합니다).
2. "누가 진짜로 일했는지 어떻게 알까?" (가드레일과 Gauntlet)
전 세계 누구나 참여할 수 있다는 건, 누군가 속임수를 쓰거나 엉뚱한 조각을 보낼 수도 있다는 뜻입니다. 여기서 **'Gauntlet (게틀릿)'**이라는 시스템이 등장합니다.
- 비유: 마치 거대한 오디션 프로그램의 심사위원처럼 작동합니다.
- 참가자들이 보낸 퍼즐 조각 (학습 데이터) 을 작은 테스트에 통과시켜 봅니다.
- 진짜로 열심히 일한 사람에게는 보상을 주고, 속임수를 쓰거나 엉뚱한 일을 한 사람은 탈락시킵니다.
- 블록체인 기술을 써서 이 과정을 투명하게 기록합니다.
3. "메시지 보내기보다 '요약' 보내기" (SparseLoCo)
전 세계 사람들이 인터넷으로 퍼즐 조각을 보낼 때, 모든 조각을 다 보내면 인터넷이 터져버립니다. 그래서 **'SparseLoCo'**라는 기술을 썼습니다.
- 비유: 친구에게 긴 편지를 보낼 때, 모든 내용을 다 쓰지 않고 핵심 내용만 146 배나 압축해서 보내는 것과 같습니다.
- AI 가 학습할 때 필요한 모든 정보를 다 보내는 게 아니라, '가장 중요한 변화'만 추려서 아주 작게 압축 (2 비트 양자화) 해 보냅니다.
- 이렇게 하면 느린 일반 인터넷 연결에서도 AI 학습이 가능해집니다.
4. 결과: 중앙집중식 AI 와도 대등한 실력!
이 프로젝트의 결과는 놀랍습니다.
- 규모: 720 억 개의 파라미터 (AI 의 뇌세포) 를 가진 72B 모델을 만들었습니다.
- 성능: 전 세계 일반인들과 느린 인터넷으로 만든 이 AI 는, 거대 기업들이 비싼 데이터센터에서 만든 AI 들과 비슷하거나 더 좋은 성능을 냈습니다.
- 의미: "AI 는 부자 기업만 만드는 거야"라는 고정관념을 깨뜨렸습니다. 이제 누구나 참여해서 거대 AI 를 만들 수 있는 길이 열렸습니다.
5. 그 후, 대화하는 AI 로 진화 (SFT)
기본 학습을 마친 후, 이 AI 를 사람과 대화할 수 있도록 조금 더 가르쳤습니다 (SFT 단계).
- 수학 문제 풀기, 논리적 추론, 코드 작성, 심지어 창의적인 이야기 쓰기까지 잘해냅니다.
- 특히 "명령을 잘 따르는 능력"과 "수학 문제 해결 능력"에서 기존 유명 AI 들과 견주어도 손색이 없는 결과를 보여줬습니다.
요약하자면
이 논문은 **"거대 AI 를 만드는 것이 더 이상 거대 기업의 독무대가 아니다"**라고 선언합니다.
"전 세계의 작은 컴퓨터들이 인터넷으로 연결되고, 서로를 믿지 않아도 되는 시스템 (블록체인) 으로 검증받으며, 압축된 정보만 주고받으면, 우리는 함께 거대하고 똑똑한 AI 를 만들 수 있다."
이는 AI 의 민주화를 향한 거대한 첫걸음이며, 앞으로 더 많은 사람이 AI 개발의 주역이 될 수 있음을 보여준 획기적인 연구입니다.