Towards interpretable models for language proficiency assessment: Predicting the CEFR level of Estonian learner texts

Este estudio presenta modelos de aprendizaje automático interpretables que, mediante la selección cuidadosa de características lingüísticas y de errores, logran predecir con alta precisión (hasta 0.9) los niveles de competencia del MCER en textos de aprendices de estonio, ofreciendo además insights sobre la evolución de la complejidad del lenguaje a lo largo del tiempo.

Kais Allkivi

Publicado 2026-03-10
📖 5 min de lectura🧠 Análisis profundo

Each language version is independently generated for its own context, not a direct translation.

Imagina que aprender un idioma es como subir una montaña. En la base (nivel A2), el camino es empinado y lleno de piedras sueltas; te equivocas mucho y tus frases son cortas. A medida que subes (niveles B1, B2, C1), el terreno se vuelve más suave, las vistas son más amplias y tus pasos son más seguros y complejos.

Este artículo de investigación trata sobre cómo enseñarle a una computadora a "ver" en qué parte de la montaña se encuentra un estudiante que escribe en estonio, sin necesidad de que un profesor humano lea cada palabra.

Aquí tienes la explicación de la investigación, usando analogías sencillas:

1. El Problema: ¿Cómo sabe la máquina si eres un principiante o un experto?

Antes, para saber el nivel de un estudiante, un profesor humano tenía que leer su texto, corregirlo y asignarle una nota. Esto toma mucho tiempo. Los investigadores querían crear un "árbitro digital" que hiciera esto automáticamente.

El desafío es que la computadora no tiene "oído" ni "intuición". Solo ve números y palabras. Si le dices "mira este texto y dime si es nivel B1", la computadora se pierde. Necesitamos darle reglas claras, como si le diéramos una brújula en lugar de un mapa completo.

2. La Solución: Las "Pistas" (Características Lingüísticas)

Los investigadores no le dieron a la computadora todo el texto para que adivinara. En su lugar, le dieron 4 tipos de pistas (llamadas características) que actúan como huellas dactilares del nivel de idioma:

  • 🔍 El Vocabulario (La caja de herramientas):

    • Analogía: Un principiante tiene una caja de herramientas con solo un martillo y un destornillador (palabras muy comunes). Un experto tiene una caja llena de herramientas especiales y raras.
    • Lo que midieron: ¿Cuántas palabras diferentes usa? ¿Usa palabras raras o siempre las mismas? ¿Las palabras son concretas (como "mesa") o abstractas (como "libertad")?
  • 🧩 La Gramática (El esqueleto de la oración):

    • Analogía: Imagina que las palabras son bloques de Lego. Un principiante hace torres simples y rectas. Un experto hace castillos con torres curvas, puentes y formas complicadas.
    • Lo que midieron: ¿Usa muchos tiempos verbales diferentes? ¿Usa casos gramaticales complejos (en estonio hay 14 formas de cambiar una palabra según su función)? ¿Usa pronombres raros en lugar de decir "yo" todo el tiempo?
  • 📏 La Superficie (El tamaño del edificio):

    • Analogía: ¿Cuántos ladrillos tiene la casa? ¿Cuántas habitaciones (oraciones) tiene? ¿Son las habitaciones largas o cortas?
    • Lo que midieron: Longitud de las frases, número de sílabas, longitud de las palabras.
  • 🚫 Los Errores (Los huecos en la pared):

    • Analogía: Un principiante tiene muchas grietas y pintura mal puesta. Un experto tiene una pared casi perfecta, con solo un pequeño rasguño aquí y allá.
    • Lo que midieron: ¿Cuántas palabras necesita corregir el corrector ortográfico? ¿Cuántas frases necesitan reordenarse?

3. El Experimento: Entrenando al "Entrenador"

Los investigadores tomaron 720 textos reales de exámenes estonios (desde nivel A2 hasta C1).

  • El entrenamiento: Dividieron los textos en dos grupos. Uno para "enseñar" a la computadora (el grupo de entrenamiento) y otro para "examinarla" (el grupo de prueba).
  • La regla de oro: No querían que la computadora aprendiera a adivinar por el tema del texto (por ejemplo, "si habla de un concierto, es nivel B1"). Querían que aprendiera por la calidad del idioma. Por eso, filtraron las pistas para que fueran útiles en cualquier tema.

4. Los Resultados: ¡La computadora aprendió!

  • Precisión: Cuando probaron a la computadora con textos nuevos, acertó el nivel correcto en el 90% de los casos (¡casi como un profesor humano!).
  • La sorpresa del tiempo: Probaron el sistema con textos de hace 10 años (2010) y notaron algo curioso: los textos de hace 10 años eran más simples que los actuales. ¡Los estudiantes de hoy escriben de forma más compleja! La computadora tuvo que adaptarse a este cambio.
  • Mejor mezcla: La combinación ganadora fue mezclar todas las pistas (vocabulario + gramática + longitud + errores). Fue como si el entrenador usara la brújula, el mapa y el reloj al mismo tiempo.

5. ¿Para qué sirve esto? (El Legado)

Este sistema no es solo un experimento de laboratorio. Ya se ha integrado en una herramienta llamada ELLE (un entorno de aprendizaje de estonio).

  • Para el estudiante: Ahora, cuando escribe un texto, la herramienta le dice: "¡Hola! Parece que estás en el nivel B1. Tu vocabulario es bueno, pero tus frases son un poco cortas. Intenta usar más conectores".
  • Para el profesor: Le ayuda a revisar tareas rápidamente y a ver el progreso de la clase sin tener que leer cada error manualmente.

En resumen

Esta investigación es como construir un detector de niveles de idioma. En lugar de adivinar, la computadora analiza las "huellas" que deja un estudiante al escribir (qué palabras usa, cómo las une y cuántos errores comete).

El resultado es una herramienta más justa y rápida que ayuda a los estudiantes a saber dónde están en su viaje de aprendizaje y a los profesores a guiarlos mejor, todo sin perder la capacidad de explicar por qué se dio esa nota (algo que las inteligencias artificiales modernas a veces no hacen tan bien).