Gender Bias in MT for a Genderless Language: New Benchmarks for Basque

Este trabajo introduce dos nuevos conjuntos de datos, WinoMTeus y FLORES+Gender, para evaluar el sesgo de género en la traducción automática desde y hacia el euskera, revelando que los modelos actuales muestran una preferencia sistemática por las formas masculinas y una mayor calidad en las traducciones que involucran referentes masculinos.

Amaia Murillo, Olatz-Perez-de-Viñaspre, Naiara Perez

Publicado 2026-03-10
📖 4 min de lectura☕ Lectura para el café

Each language version is independently generated for its own context, not a direct translation.

Imagina que las Inteligencias Artificiales (IA) que traducen textos son como cocineros muy rápidos, pero que nunca han aprendido a cocinar por sí mismos. En su lugar, han "comido" millones de recetas (datos) de internet. El problema es que muchas de esas recetas antiguas tienen prejuicios: si pides "enfermero", el cocinero IA asume automáticamente que es un hombre, y si pides "enfermera", asume que es una mujer, aunque en la vida real haya muchos hombres enfermeros y muchas mujeres mecánicas.

Este artículo de investigación es como una auditoría de cocina que se hace en el País Vasco, una región donde la lengua (euskera) es especial porque no tiene género gramatical. En euskera, una palabra como "mecánico" o "enfermero" es neutra; no dice si es hombre o mujer.

Los investigadores, Amaia, Olatz y Naiara, querían ver qué pasa cuando estos "cocineros IA" traducen desde el euskera (neutro) hacia idiomas que sí tienen género, como el español o el francés. ¿El IA decide por su cuenta quién es hombre y quién es mujer basándose en estereotipos?

Para descubrirlo, crearon dos juegos de pruebas (como si fueran exámenes de cocina):

1. El juego "WinoMTeus": ¿Quién hace qué trabajo?

Imagina que le dices al IA: "El mecánico llamó a la enfermera porque se rompió la pierna". En euskera, las palabras son neutras. Pero cuando el IA tiene que traducirlo al español, tiene que elegir: ¿"El mecánico" o "La mecánica"? ¿"El enfermero" o "La enfermera"?

  • La analogía: Es como si le dieras al IA una foto borrosa de una persona haciendo un trabajo y le preguntaras: "¿Es hombre o mujer?".
  • El hallazgo: Los investigadores compararon las respuestas del IA con las estadísticas reales de trabajo en el País Vasco. Descubrieron que el IA tiene un sesgo masivo hacia lo masculino.
    • Si el trabajo es "enfermera" (que en la realidad es 96% mujeres), el IA a menudo lo traduce como "el enfermero" (hombre).
    • El IA prefiere usar la forma masculina como "por defecto", incluso cuando la realidad dice lo contrario. Es como si el IA pensara: "Si no estoy seguro, mejor pongo 'hombre', que es lo que suena más normal".

2. El juego "FLORES+Gender": ¿Traduce mejor si es hombre?

En este juego, hicieron lo contrario. Tradujeron textos desde español o inglés (donde sí se sabe si es hombre o mujer) hacia euskera.

  • La analogía: Imagina que le das al IA dos recetas idénticas, pero una dice "El chef" y la otra "La chef". ¿Traduce el IA la receta del "chef" hombre con más cuidado o mejor calidad que la de la "chef" mujer?
  • El hallazgo: En general, la calidad de la traducción es muy similar, pero en algunos casos, el IA traduce un poco mejor cuando el sujeto es un hombre. Es como si el IA tuviera un "lente de aumento" para los hombres y un "lente un poco más oscuro" para las mujeres, haciendo que el resultado final sea ligeramente menos preciso para ellas.

¿Por qué es importante esto?

El euskera es una lengua "sin género", lo que significa que en su estructura natural no discrimina. Pero al usar herramientas de traducción automáticas, introducimos el género y, con él, los prejuicios.

Los autores nos dicen que:

  1. Los modelos actuales son "machistas" por defecto: Tienen una preferencia automática por la forma masculina, incluso cuando no hay ninguna razón para ello.
  2. No podemos usar las mismas pruebas para todos: Las pruebas que funcionan para el inglés no sirven para el euskera porque las reglas del juego (la gramática) son diferentes.
  3. Necesitamos nuevos espejos: Para ver los prejuicios en idiomas como el euskero, necesitamos crear nuestros propios espejos (datos de prueba) que reflejen nuestra realidad cultural y lingüística.

En resumen:
Este estudio nos avisa de que, aunque la tecnología avanza rápido, sigue cargando con los "maletines viejos" de los prejuicios sociales. Si no corregimos a estos "cocineros IA" y les enseñamos a respetar la realidad de quién hace qué trabajo (y a no asumir que todo es hombre por defecto), seguiremos reproduciendo una imagen distorsionada del mundo, especialmente en lenguas ricas y únicas como el euskera.