EngGPT2: Sovereign, Efficient and Open Intelligence

EngGPT2 는 2.5 조 개의 토큰으로 학습된 16B MoE 아키텍처 기반의 오픈 소스 이탈리아어 LLM 으로, 적은 연산 자원으로 동급 모델과 경쟁하는 성능을 발휘하면서 EU AI 법규를 준수하고 다중 추론 모드를 지원하는 유럽 주권 인공지능 모델입니다.

G. Ciarfaglia, A. Rosanova, S. Cipolla, J. Bartoli, A. Di Domenico, C. Fioroni, A. Fontana, M. R. Scoleri, M. I. Mone, D. Franchi, M. C. Del Gaudio, F. Picariello, M. Gabusi, S. Bonura, V. Morreale, I
게시일 2026-03-18
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🇮🇹 이탈리아의 '스마트한 공학자': EngGPT2 이야기

이 논문은 이탈리아의 거대 기술 기업인 'Engineering Group'이 만든 새로운 인공지능, EngGPT2에 대한 기술 보고서입니다. 이 AI 는 단순히 똑똑한 것을 넘어, **유럽의 주권 **(Sovereign)을 지키면서 **효율적 **(Efficient)이고 **열려 있는 **(Open) 모델로 설계되었습니다.

이 복잡한 내용을 일반인도 쉽게 이해할 수 있도록 마음의 도서관스마트한 요리사에 비유해서 설명해 드릴게요.


1. 왜 이 AI 가 특별한가요? (주권과 효율성)

지금까지 AI 는 미국이나 중국의 거대 기업들이 주도해 왔습니다. 하지만 유럽은 "우리의 데이터, 우리의 규칙, 우리의 언어로 만든 AI 가 필요하다"고 생각했습니다.

  • **주권 **(Sovereign) 마치 유럽이 자신만의 독자적인 도서관을 지은 것과 같습니다. 미국의 거대 도서관 (Qwen, Llama 등) 에 의존하지 않고, 유럽의 법규 (EU AI Act) 에 맞춰 안전하게 지은 도서관입니다.
  • **효율 **(Efficient) 다른 거대 AI 들은 거대한 연료 (데이터와 계산 능력) 를 태워 움직이지만, EngGPT2 는 하이브리드 자동차처럼 적은 연료로 더 멀리 갑니다.
    • 비유: 다른 AI 들이 36 톤 (Qwen3) 이나 15 톤 (Llama3) 의 책을 모두 읽어야 답을 찾는다면, EngGPT2 는 2.5 톤의 책만 읽어도 똑같은 수준의 지식을 얻습니다. 그리고 그 지식을 꺼낼 때 (추론) 는 필요한 책장만 3 분의 1 정도만 열어쓰기 때문에 전기세 (계산 비용) 가 훨씬 적게 듭니다.

2. 어떻게 만들어졌나요? (4 단계 요리 과정)

이 AI 는 하루아침에 만들어진 게 아니라, 4 단계의 정교한 요리 과정을 거쳤습니다.

  1. **재료 준비 **(Pre-training)

    • 인터넷의 책, 논문, 코드, 뉴스 등 **2.5 조 개의 단어 **(토큰)를 모았습니다.
    • 특히 이탈리아어 자료를 25% 이상 포함시켜, 이탈리아 사람들과 유럽 문화에 매우 친숙하게 만들었습니다.
    • 저작권 보호: 이 과정에서 저작권이 있는 책이나 신문 기사 같은 '위험한 재료'는 꼼꼼히 걸러내어 법적인 문제를 피했습니다.
  2. **긴 이야기 이해하기 **(Long-Context Adaptation)

    • 보통 AI 는 긴 책을 읽으면 앞부분을 잊어버립니다. 하지만 이 AI 는 32,000 자에 달하는 긴 문서도 한 번에 읽고 핵심을 파악할 수 있도록 훈련시켰습니다. 마치 긴 소설을 다 읽고도 첫 장과 마지막 장의 연결고리를 기억하는 사람 같습니다.
  3. **논리 훈련 **(Mid-Training)

    • 단순히 지식을 쌓는 것을 넘어, 수학 문제나 논리 퍼즐을 풀 수 있도록 두뇌를 단련시켰습니다. 이 단계에서 AI 는 "생각하는 과정 (추론)"을 배우기 시작합니다.
  4. **예절 교육 **(Post-Training)

    • 이제 사용자와 대화할 수 있도록 가르쳤습니다.
    • 명령어 따르기: "이메일 써줘", "코드 짜줘" 같은 요청을 정확히 수행합니다.
    • 이중 모드: 사용자의 요청에 따라 정석적인 답변을 하거나, **생각하는 과정 **(추론)을 보여줄 수도 있습니다.

3. EngGPT2 의 특별한 능력: "생각하는 모드"

이 AI 는 대화할 때 두 가지 방식으로 생각할 수 있습니다.

  • **일반 모드 **(Non-reasoning) 바로 답을 말합니다. (예: "파리 수도는 어디야?" → "파리입니다.")
  • **생각 모드 **(Reasoning) 복잡한 문제를 풀 때, 생각하는 과정을 먼저 보여줍니다.
    • 이탈리아어/영어: 사용자가 원하는 언어로 생각 과정을 보여줍니다.
    • **터보 모드 **(Turbo) 생각 과정을 요약해서 빠르게 보여줍니다. 긴 설명 대신 핵심만 쏙쏙 뽑아낸 "요약본"입니다.
    • 비유: 복잡한 수학 문제를 풀 때, 풀이 과정을 종이에 길게 적어주는 것 (Full Reasoning) 과, 칠판에 핵심 공식만 빠르게 적어주는 것 (Turbo) 의 차이입니다.

4. 성능은 어떨까요? (작지만 강한 선수)

  • 크기: 전체 파라미터는 160 억 개지만, 실제로 작동할 때는 30 억 개만 사용합니다. (다른 AI 들은 160 억 개를 모두 사용합니다.)
  • 성능: 80 억~160 억 크기의 다른 AI 들과 비교해도 수학, 논리, 코딩에서 뒤지지 않습니다.
  • 비용: 같은 성능을 내는데, 훈련 비용은 1/10~1/6 수준이고, 실행 비용은 1/2~1/5 수준으로 훨씬 저렴합니다.

5. 결론: 유럽의 새로운 희망

EngGPT2 는 **"적은 비용으로 최고의 성능을 내는 유럽형 AI"**의 새로운 기준을 세웠습니다.

  • 이탈리아어와 유럽 문화에 특화되어 있어 현지 기업과 정부에 더 잘 어울립니다.
  • 저작권과 윤리를 철저히 지켜 유럽 법규에 완벽하게 부합합니다.
  • 열린 코드로 공개되어 누구나 자유롭게 연구하고 발전시킬 수 있습니다.

한 줄 요약:

"EngGPT2 는 거대한 연료 없이도 똑똑하게 움직이는 유럽의 스마트한 공학자입니다. 적은 비용으로 이탈리아와 유럽의 문제를 해결할 수 있는, 효율적이고 안전한 AI 입니다."

연구 분야의 논문에 파묻히고 계신가요?

연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.

Digest 사용해 보기 →