EngGPT2: Sovereign, Efficient and Open Intelligence

EngGPT2-16B-A3B is een nieuw, open-source Mixture-of-Experts taalmodel dat door zijn efficiënte architectuur en sterke Italiaanse vaardigheden een kosteneffectief en EU-wetgeving-conform alternatief biedt voor grotere modellen.

G. Ciarfaglia, A. Rosanova, S. Cipolla, J. Bartoli, A. Di Domenico, C. Fioroni, A. Fontana, M. R. Scoleri, M. I. Mone, D. Franchi, M. C. Del Gaudio, F. Picariello, M. Gabusi, S. Bonura, V. Morreale, I
Gepubliceerd 2026-03-18
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

EngGPT2: De Slimme, Efficiënte en Eigen Italiaanse Brein

Stel je voor dat je een enorme bibliotheek bouwt met alle kennis van de wereld. Meestal bouwen bedrijven zoals Google of Microsoft deze bibliotheken met een ongelofelijke hoeveelheid energie en geld, alsof ze een hele stad moeten verplaatsen om één boek te vinden.

EngGPT2 is een nieuw project van het Italiaanse bedrijf Engineering Group. Ze hebben een heel slimme manier bedacht om een eigen, krachtig "digitale brein" te bouwen, maar dan met veel minder energie en kosten. Hier is hoe het werkt, vertaald naar alledaagse taal:

1. Het Geheim van de "Spookwerkers" (MoE)

Stel je een groot kantoor voor. In een normaal kantoor (een "dicht" model) moeten alle werknemers elke dag naar kantoor komen, ook als er maar één vraag is. Dat kost veel geld en stroom.

EngGPT2 werkt anders. Het is een Mixture-of-Experts (MoE) model.

  • Het Kantoor: Het heeft in totaal 16 miljard "werknemers" (parameters).
  • De Slimme Regeling: Maar voor elke vraag die je stelt, worden er slechts 3 miljard werknemers wakker gemaakt. De rest blijft slapen.
  • De Analogie: Het is alsof je een restaurant hebt met 100 koks. Als je pasta bestelt, komen alleen de pasta-specialisten aan het werk. Als je sushi bestelt, komen alleen de sushi-koks. Je hoeft niet iedereen te betalen voor elke maaltijd. Hierdoor is EngGPT2 razendsnel en goedkoop, terwijl het net zo slim is als de grote concurrenten.

2. De Training: Van Baby tot Expert

Het team heeft dit model niet zomaar "geleerd". Ze hebben een zorgvuldig stappenplan gevolgd:

  • Fase 1: De Basis (Pre-training): Het model heeft gelezen uit een enorme berg boeken, websites en code (2,5 biljoen woorden). Het heeft vooral veel Italiaans en Engels gelezen, zodat het de cultuur en taal van Europa goed begrijpt.
  • Fase 2: Het Lange Geheugen: Ze hebben het model getraind om hele lange documenten te onthouden, alsof je iemand leert een heel boek in één keer te lezen zonder de eerste pagina te vergeten.
  • Fase 3: De Slimme Redenering (Mid-training): Hier leerden ze het model niet alleen feiten, maar hoe je nadenkt. Ze gaven het puzzels en wiskundeproblemen om op te lossen.
  • Fase 4: De Hulpvaardige Assistent (Post-training): Tot slot leerden ze het model hoe het met mensen moet praten, instructies moet volgen en tools (zoals rekenmachines of zoekmachines) moet gebruiken.

3. De "Turbo"-Modus

Een van de coolste dingen is dat EngGPT2 verschillende manieren heeft om te denken:

  • Normaal Denken: Het geeft een kort antwoord.
  • Volledig Redeneren: Het denkt hardop na (in het Italiaans of Engels) en legt stap voor stap uit hoe het tot een antwoord komt. Dit is goed voor moeilijke vragen.
  • Turbo-Modus: Dit is de "snelle schakel". Het model denkt nog steeds na, maar dan in heel korte, krachtige bullet points. Het is alsof je van een lange uitleg overschakelt naar een samenvatting. Dit gaat razendsnel en kost heel weinig energie, perfect voor apps die direct moeten reageren.

4. Waarom is dit belangrijk voor Europa?

Vroeger moesten Europese bedrijven afhankelijk zijn van Amerikaanse of Chinese modellen. Die zijn misschien wel slim, maar ze kennen onze lokale wetten en cultuur niet altijd goed, en ze zijn erg duur.

EngGPT2 is:

  • Souverein: Het is van Europa, voor Europa. We hebben de volledige controle.
  • Open: Iedereen kan het gebruiken en bekijken hoe het werkt (het staat op Hugging Face).
  • Wettelijk: Het voldoet aan de strenge EU-wetten voor AI (de AI Act). Ze hebben zelfs een speciale filter gebruikt om te zorgen dat ze geen auteursrechtelijk beschermd materiaal hebben gebruikt zonder toestemming.
  • Efficiënt: Het kost veel minder stroom om te draaien dan de grote modellen.

Samenvattend

EngGPT2 is als een slimme, Italiaanse meesterkok die niet de hele keuken nodig heeft om een heerlijk gerecht te maken. Hij gebruikt alleen de juiste ingrediënten (de juiste "experts"), denkt snel na (Turbo-modus), en kent de lokale smaken (Italiaans/Europees) perfect. Het bewijst dat je niet altijd de grootste en duurste machine nodig hebt om de beste resultaten te behalen; soms is slimme planning en efficiëntie de echte sleutel tot succes.

Verdrinkt u in papers in uw vakgebied?

Ontvang dagelijkse digests van de nieuwste papers die bij uw onderzoekswoorden passen — met technische samenvattingen, in uw taal.

Probeer Digest →