Sabiá-4 Technical Report

Dit technische rapport introduceert Sabi'a-4 en Sabiazinho-4, een nieuwe generatie taalmodellen die specifiek zijn getraind op Braziliaans-Portugese juridische data en lange context, en die uitstekende prestaties leveren op het gebied van juridisch schrijven, dialoogkwaliteit en agentische taken tegen een gunstige prijs-kwaliteitverhouding.

Thiago Laitz, Thales Sales Almeida, Hugo Abonizio, Roseval Malaquias Junior, Giovana Kerche Bonás, Marcos Piau, Celio Larcher, Ramon Pires, Rodrigo Nogueira

Gepubliceerd 2026-03-12
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Hier is een uitleg van het technische rapport over Sabiá-4 en Sabiazinho-4, vertaald naar eenvoudig Nederlands met een paar creatieve vergelijkingen.

Wat is dit eigenlijk?

Stel je voor dat je een superintelligente assistent hebt die niet alleen perfect Portugees spreekt (vooral het Braziliaanse dialect), maar ook een juridisch genie is. Dat zijn Sabiá-4 en Sabiazinho-4.

Ze zijn gemaakt door het Braziliaanse bedrijf Maritaca AI. De naam "Sabiá" verwijst naar een Braziliaanse zangvogel die bekend staat om zijn prachtige liedjes – een knipoog naar de taalvaardigheid van het model.

Hoe zijn ze getraind? (De "Schooltijd" van de AI)

De onderzoekers hebben deze AI niet zomaar op een computer gezet en laten lezen. Ze hebben een vier-stappenplan gevolgd, alsof je een student voorbereidt op een zware examenreeks:

  1. De Basis (Voortgezette training): Eerst kregen ze een algemene basisopleiding in het Portugees, maar dan met een speciale focus op Braziliaanse wetboeken en juridische documenten.
    • Vergelijking: Het is alsof je een student niet alleen de hele wereldgeschiedenis laat lezen, maar ze ook laat studeren bij de beste advocaten van het land.
  2. Het Geheugen (Context uitbreiding): Ze leerden de AI om 128.000 woorden tegelijk te onthouden.
    • Vergelijking: Normale AI's hebben een geheugen van een post-it-je. Sabiá-4 heeft een geheugen van een hele bibliotheek. Je kunt er een dik juridisch dossier in gooien en het kan het hele verhaal onthouden.
  3. De Oefeningen (Supervised Fine-Tuning): Ze kregen specifieke opdrachten: "Schrijf een chatbericht," "Schrijf code," "Draai een juridisch document op," en "Gebruik tools."
    • Vergelijking: Dit is als een stage bij verschillende bedrijven: eerst als secretaresse, dan als programmeur, en daarna als jurist.
  4. De Menselijke Touch (Preference Alignment): Tot slot leerden ze de AI om te luisteren naar wat mensen echt leuk of nuttig vinden, en om zich te houden aan strakke regels.
    • Vergelijking: Een leraar die de AI corrigeert: "Nee, niet zo'n slordig antwoord, wees beleefd en volg precies de vorm die ik vraag."

Wat kunnen ze doen? (De Krachten)

Het rapport testte de modellen op zes gebieden:

  • Juridisch Goud: Ze zijn extreem goed in het schrijven van juridische stukken, zoals vonnissen van rechters of verdedigingspleidooien. Ze begrijpen de subtiele nuances van Braziliaanse wetten beter dan veel andere modellen.
  • Het Lange Verhaal: Omdat ze zo'n groot geheugen hebben, kunnen ze hele boeken of duizenden pagina's aan wetgeving doorzoeken om het ene stukje informatie te vinden dat je nodig hebt (de "naald in de hooiberg").
  • De Agent: Ze kunnen niet alleen praten, maar ook acties ondernemen. Ze kunnen bijvoorbeeld een vliegticket kopen, een Pix-betaling (een Braziliaanse betaalmethode) doen of op het internet zoeken om een antwoord te vinden.
    • Vergelijking: Ze zijn niet alleen een slimme bibliothecaris die je een boek geeft, maar ook een assistent die het boek voor je uitleest en de bonnetjes regelt.
  • Examenresultaten: Ze halen hoge cijfers op Braziliaanse toelatingsexamens (zoals voor advocaten of artsen).

Waarom is dit speciaal? (De Prijs-Kwaliteit Verhouding)

Dit is misschien wel het belangrijkste punt van het rapport.
Stel je een autoverhuurder voor. Sommige auto's (zoals de dure Amerikaanse modellen) zijn super snel en krachtig, maar kosten een fortuin per uur. Andere auto's zijn goedkoop, maar slecht.

Sabiá-4 en Sabiazinho-4 zitten in de "Gouden Middenweg".

  • Ze zijn goedkoper dan de duurste concurrenten (zoals de nieuwste modellen van OpenAI of Google).
  • Maar ze zijn net zo goed (of zelfs beter) op specifieke taken, vooral als het gaat om Braziliaans Portugees en wetten.

In de grafiek in het rapport (Figuur 1) staan ze linksboven: dat betekent goedkoop én goed. Voor bedrijven die deze AI willen gebruiken in de echte wereld, is dit een droomscenario.

Samenvatting in één zin

Sabiá-4 is een slimme, goedkope Braziliaanse AI-assistent die net zo goed is als een ervaren advocaat, een geheugen heeft van een bibliotheek, en je kan helpen met alledaagse taken zoals betalen of zoeken op internet, allemaal voor een fractie van de prijs van de dure concurrenten.