AMALIA Technical Report: A Fully Open Source Large Language Model for European Portuguese

El artículo presenta AMALIA, un modelo de lenguaje grande de código abierto diseñado específicamente para el portugués europeo mediante el uso de datos de alta calidad en esta variante y la creación de un nuevo conjunto de evaluaciones nativas que demuestran su superioridad frente a los enfoques tradicionales.

Afonso Simplício, Gonçalo Vinagre, Miguel Moura Ramos, Diogo Tavares, Rafael Ferreira, Giuseppe Attanasio, Duarte M. Alves, Inês Calvo, Inês Vieira, Rui Guerra, James Furtado, Beatriz Canave
Publicado 2026-03-30
📖 4 min de lectura☕ Lectura para el café

Each language version is independently generated for its own context, not a direct translation.

¡Hola! Imagina que el mundo de la Inteligencia Artificial es como un gigantesco restaurante internacional donde los chefs (los modelos de lenguaje) cocinan respuestas para todo el mundo.

Hasta ahora, la mayoría de estos chefs eran expertos en cocinar platos americanos (inglés) y, en menor medida, brasileños (portugués de Brasil). Pero si pedías un plato típico de Portugal (portugués europeo), el chef a menudo te traía una versión traducida del menú brasileño o americano. El resultado? Sabía "bien", pero le faltaba el toque auténtico, la sal de la cultura local y las palabras exactas que usaría un vecino de Lisboa o Porto.

Aquí es donde entra AMALIA, la nueva estrella del restaurante.

¿Qué es AMALIA?

AMALIA es un "chef" de inteligencia artificial (un modelo de lenguaje) creado específicamente para Portugal. No es solo una traducción; es un cocinero que ha aprendido a cocinar pensando en el paladar europeo desde el primer día.

¿Cómo lo hicieron? (La receta secreta)

  1. La Despensa (Los Datos):
    Imagina que para aprender a cocinar, necesitas ingredientes frescos. Los modelos anteriores usaban ingredientes traídos de fuera. El equipo de AMALIA fue a la biblioteca digital de Portugal (llamada Arquivo.pt), que es como un inmenso archivo de internet portugués.

    • El truco: Filtraron todo lo que era "brasileño" (como quitar el azúcar si quieres un postre sin dulce) para asegurarse de que solo usaban ingredientes 100% portugueses. Recopilaron 195 terabytes de datos (¡una montaña de libros y webs!) y los limpiaron para que fueran de la máxima calidad.
  2. El Entrenamiento (La Escuela de Cocina):
    No solo aprendieron a leer, sino a hablar y razonar como un portugués.

    • Fase 1 (Pre-entrenamiento): Leyeron millones de páginas para entender la gramática, la historia y la cultura.
    • Fase 2 (Ajuste Fino): Aquí es donde se volvieron expertos en conversaciones. Les enseñaron a seguir instrucciones, a resolver problemas matemáticos y a mantener charlas amenas, pero siempre usando el "portugués de Portugal", no el de Brasil.
    • Fase 3 (Feedback): Les dieron "críticas" de expertos humanos y de otras IAs para corregir errores y mejorar su estilo, asegurándose de que no se confundieran con las diferencias entre los dos tipos de portugués.

¿Cómo sabemos que es bueno? (La Cata de Prueba)

Para probar a AMALIA, no usaron los mismos exámenes que para los otros chefs (que a veces eran traducciones automáticas y fallaban). Crearon nuevos exámenes especiales:

  • El Examen de "Completar la Frase": Les ponían una frase como "Voy a la estación de ____ a comprar un billete". Un modelo normal podría decir "tren" (término brasileño), pero AMALIA dijo inmediatamente "comboios" (término europeo). ¡Ganó!
  • Los Exámenes Nacionales: Usaron preguntas reales de los exámenes de secundaria de Portugal. AMALIA no solo respondió, sino que lo hizo con la gramática y el estilo de un estudiante portugués brillante.
  • La Prueba de "Sesgo": Les pidieron que hablaran en portugués europeo. Muchos otros modelos, aunque se les pidió, terminaban hablando como si estuvieran en Río de Janeiro. AMALIA mantuvo su acento y vocabulario europeo perfectamente.

El Resultado Final

AMALIA es como un superhéroe local.

  • En tareas generales (como matemáticas o lógica), compite de igual a igual con los gigantes mundiales.
  • En tareas portuguesas, ¡es el rey! Entiende los chistes, las expresiones idiomáticas, la historia y la cultura de Portugal mejor que cualquier otro modelo abierto disponible.

Además, es seguro. Imagina que es un chef que sabe exactamente qué ingredientes son peligrosos y no los usa, protegiendo a los comensales de respuestas dañinas.

En resumen

Este documento nos dice que ya no tenemos que conformarnos con versiones "traducidas" de la inteligencia artificial para hablar portugués europeo. Con AMALIA, por fin tenemos un asistente digital que nos entiende, nos habla como nosotros y respeta nuestra cultura, todo ello siendo totalmente abierto (cualquiera puede verlo, usarlo y mejorarlo).

Es un gran paso para que la tecnología deje de ser solo "global" y empiece a ser verdaderamente "local" y humana.

¿Ahogado en artículos de tu campo?

Recibe resúmenes diarios de los artículos más novedosos que coincidan con tus palabras clave de investigación — con resúmenes técnicos, en tu idioma.

Probar Digest →