Each language version is independently generated for its own context, not a direct translation.
🇮🇹 이탈리아의 '스마트한 공학자': EngGPT2 이야기
이 논문은 이탈리아의 거대 기술 기업인 'Engineering Group'이 만든 새로운 인공지능, EngGPT2에 대한 기술 보고서입니다. 이 AI 는 단순히 똑똑한 것을 넘어, **유럽의 주권 **(Sovereign)을 지키면서 **효율적 **(Efficient)이고 **열려 있는 **(Open) 모델로 설계되었습니다.
이 복잡한 내용을 일반인도 쉽게 이해할 수 있도록 마음의 도서관과 스마트한 요리사에 비유해서 설명해 드릴게요.
1. 왜 이 AI 가 특별한가요? (주권과 효율성)
지금까지 AI 는 미국이나 중국의 거대 기업들이 주도해 왔습니다. 하지만 유럽은 "우리의 데이터, 우리의 규칙, 우리의 언어로 만든 AI 가 필요하다"고 생각했습니다.
- **주권 **(Sovereign) 마치 유럽이 자신만의 독자적인 도서관을 지은 것과 같습니다. 미국의 거대 도서관 (Qwen, Llama 등) 에 의존하지 않고, 유럽의 법규 (EU AI Act) 에 맞춰 안전하게 지은 도서관입니다.
- **효율 **(Efficient) 다른 거대 AI 들은 거대한 연료 (데이터와 계산 능력) 를 태워 움직이지만, EngGPT2 는 하이브리드 자동차처럼 적은 연료로 더 멀리 갑니다.
- 비유: 다른 AI 들이 36 톤 (Qwen3) 이나 15 톤 (Llama3) 의 책을 모두 읽어야 답을 찾는다면, EngGPT2 는 2.5 톤의 책만 읽어도 똑같은 수준의 지식을 얻습니다. 그리고 그 지식을 꺼낼 때 (추론) 는 필요한 책장만 3 분의 1 정도만 열어쓰기 때문에 전기세 (계산 비용) 가 훨씬 적게 듭니다.
2. 어떻게 만들어졌나요? (4 단계 요리 과정)
이 AI 는 하루아침에 만들어진 게 아니라, 4 단계의 정교한 요리 과정을 거쳤습니다.
**재료 준비 **(Pre-training)
- 인터넷의 책, 논문, 코드, 뉴스 등 **2.5 조 개의 단어 **(토큰)를 모았습니다.
- 특히 이탈리아어 자료를 25% 이상 포함시켜, 이탈리아 사람들과 유럽 문화에 매우 친숙하게 만들었습니다.
- 저작권 보호: 이 과정에서 저작권이 있는 책이나 신문 기사 같은 '위험한 재료'는 꼼꼼히 걸러내어 법적인 문제를 피했습니다.
**긴 이야기 이해하기 **(Long-Context Adaptation)
- 보통 AI 는 긴 책을 읽으면 앞부분을 잊어버립니다. 하지만 이 AI 는 32,000 자에 달하는 긴 문서도 한 번에 읽고 핵심을 파악할 수 있도록 훈련시켰습니다. 마치 긴 소설을 다 읽고도 첫 장과 마지막 장의 연결고리를 기억하는 사람 같습니다.
**논리 훈련 **(Mid-Training)
- 단순히 지식을 쌓는 것을 넘어, 수학 문제나 논리 퍼즐을 풀 수 있도록 두뇌를 단련시켰습니다. 이 단계에서 AI 는 "생각하는 과정 (추론)"을 배우기 시작합니다.
**예절 교육 **(Post-Training)
- 이제 사용자와 대화할 수 있도록 가르쳤습니다.
- 명령어 따르기: "이메일 써줘", "코드 짜줘" 같은 요청을 정확히 수행합니다.
- 이중 모드: 사용자의 요청에 따라 정석적인 답변을 하거나, **생각하는 과정 **(추론)을 보여줄 수도 있습니다.
3. EngGPT2 의 특별한 능력: "생각하는 모드"
이 AI 는 대화할 때 두 가지 방식으로 생각할 수 있습니다.
- **일반 모드 **(Non-reasoning) 바로 답을 말합니다. (예: "파리 수도는 어디야?" → "파리입니다.")
- **생각 모드 **(Reasoning) 복잡한 문제를 풀 때, 생각하는 과정을 먼저 보여줍니다.
- 이탈리아어/영어: 사용자가 원하는 언어로 생각 과정을 보여줍니다.
- **터보 모드 **(Turbo) 생각 과정을 요약해서 빠르게 보여줍니다. 긴 설명 대신 핵심만 쏙쏙 뽑아낸 "요약본"입니다.
- 비유: 복잡한 수학 문제를 풀 때, 풀이 과정을 종이에 길게 적어주는 것 (Full Reasoning) 과, 칠판에 핵심 공식만 빠르게 적어주는 것 (Turbo) 의 차이입니다.
4. 성능은 어떨까요? (작지만 강한 선수)
- 크기: 전체 파라미터는 160 억 개지만, 실제로 작동할 때는 30 억 개만 사용합니다. (다른 AI 들은 160 억 개를 모두 사용합니다.)
- 성능: 80 억~160 억 크기의 다른 AI 들과 비교해도 수학, 논리, 코딩에서 뒤지지 않습니다.
- 비용: 같은 성능을 내는데, 훈련 비용은 1/10~1/6 수준이고, 실행 비용은 1/2~1/5 수준으로 훨씬 저렴합니다.
5. 결론: 유럽의 새로운 희망
EngGPT2 는 **"적은 비용으로 최고의 성능을 내는 유럽형 AI"**의 새로운 기준을 세웠습니다.
- 이탈리아어와 유럽 문화에 특화되어 있어 현지 기업과 정부에 더 잘 어울립니다.
- 저작권과 윤리를 철저히 지켜 유럽 법규에 완벽하게 부합합니다.
- 열린 코드로 공개되어 누구나 자유롭게 연구하고 발전시킬 수 있습니다.
한 줄 요약:
"EngGPT2 는 거대한 연료 없이도 똑똑하게 움직이는 유럽의 스마트한 공학자입니다. 적은 비용으로 이탈리아와 유럽의 문제를 해결할 수 있는, 효율적이고 안전한 AI 입니다."
연구 분야의 논문에 파묻히고 계신가요?
연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.