EngGPT2: Sovereign, Efficient and Open Intelligence

EngGPT2 は、EU 法に準拠し、2.5 兆トークンのデータで学習された 160 億パラメータ(アクティブ 30 億)の MoE 型オープンモデルであり、少ない計算資源で高性能な推論と多言語(特にイタリア語)対応を実現する次世代 LLM です。

G. Ciarfaglia, A. Rosanova, S. Cipolla, J. Bartoli, A. Di Domenico, C. Fioroni, A. Fontana, M. R. Scoleri, M. I. Mone, D. Franchi, M. C. Del Gaudio, F. Picariello, M. Gabusi, S. Bonura, V. Morreale, I
公開日 2026-03-18
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

エンジニアリング・グループの「EngGPT2」:賢くて省エネなイタリアの AI について

この論文は、イタリアの大手 IT 企業「エンジニアリング・グループ」が開発した新しい人工知能(AI)モデル**「EngGPT2」**の技術報告書です。

これを難しく考えずに、**「賢くて、省エネで、イタリアの文化に精通した新しいタイプの頭脳」**としてイメージしてみてください。


1. 何を作ったの?(主役の紹介)

この AI は、**「モザイクの達人」**のような存在です。

  • 従来の AI(密なモデル): 巨大な石でできた像。全部の石(パラメータ)が常に働いていますが、重くてエネルギーを大量に消費します。
  • EngGPT2(MoE 型): 16 億個の石(パラメータ)を持っていますが、実際に作業するときは、その中から3 億個だけを選んで使います。
    • 例えるなら: 大きな図書館(16 億冊)がありますが、質問された瞬間に、必要な本だけを 3 冊取り出して読むようなものです。これにより、**「頭は大きいのに、動くのは軽くて速い」**という、非常に効率的な仕組みになっています。

2. 何で勉強したの?(学習の材料)

この AI は、**「2.5 兆語」**のテキストで勉強しました。

  • 比較: 世界の巨大 AI(Qwen3 や Llama3)は「36 兆語」や「15 兆語」で勉強していますが、EngGPT2 はそれよりずっと少ないデータで、同じくらい、あるいはそれ以上の賢さを身につけました。
  • イタリア語の専門家: 勉強材料の**25%**はイタリア語です。これは、ヨーロッパやイタリアの文化、法律、ニュアンスに特化した「地元の専門家」として育てられたからです。

3. 何がすごいのか?(3 つの強み)

① sovereignty(主権):「自前の頭脳」

アメリカや中国の AI に頼らず、ヨーロッパ(特にイタリア)が自らのルールと価値観で AI を作りました。

  • 例えるなら: 外国から輸入した家電ではなく、自国で設計図から作られた、EU の法律(AI 法)に完璧に compliant(適合)した「国産の高性能家電」です。

② Efficiency(効率):「エコな AI」

  • トレーニング(勉強): 必要なデータ量が少なくて済むので、勉強にかかるお金と電力が1/10〜1/6で済みます。
  • 推論(実際の使用): 使う電力も、同じ性能の AI の1/5〜1/2で済みます。
  • 例えるなら: 同じ距離を走るのに、ガソリンを大量に使う大型トラックではなく、ハイブリッドカーのように「少ない燃料で高性能」を実現しています。

③ Reasoning(思考力):「3 つのモード」

この AI は、状況に合わせて思考のスピードと深さを変えられます。

  1. 通常モード: 素早く答える。
  2. 思考モード(英語・イタリア語): 「えーと、まず A で、次に B...」と思考過程を詳しく説明してから答える。難しい問題に強い。
  3. ターボ思考モード: 「A→B→C」と要点だけサクッとまとめて答える。リアルタイムで使いたい時に最適。

4. 結果はどうだった?(テストの結果)

  • 数学や論理パズル: 80 億〜160 億パラメータの他の AI と比べて、トップクラスの成績を出しました。
  • イタリア語のテスト: イタリアの文化や知識に関するテストでも、非常に高い精度を叩き出しました。
  • コード作成やツール操作: ここはまだ少し弱い部分がありますが、今後のアップデートで強化する予定です。

5. まとめ:なぜこれが重要なの?

この論文は、**「AI は巨大で高価である必要はない」**という新しい基準を示しています。

  • 従来の考え方: 「もっと大きく、もっと多くのデータで勉強させれば賢くなる」。
  • EngGPT2 の考え方: 「賢い仕組み(モザイク型)と、質の高いデータ(特にイタリア語)を使えば、小さくても、安くても、賢く、安全な AI が作れる」。

これは、ヨーロッパが AI 分野で自立し、持続可能で責任ある AI 生態系を作るための重要な一歩です。まるで、**「高価な高級車ではなく、燃費が良く、地元の道に精通した、信頼できる国産スポーツカー」**を完成させたようなものです。


一言で言うと:
「イタリアの文化を深く理解し、少ない電力で賢く働き、ヨーロッパのルールに忠実な、次世代の『賢くてエコな AI』の誕生宣言」です。

自分の分野の論文に埋もれていませんか?

研究キーワードに一致する最新の論文のダイジェストを毎日受け取りましょう——技術要約付き、あなたの言語で。

Digest を試す →