Tucano 2 Cool: Better Open Source LLMs for Portuguese

Le papier présente Tucano 2, une suite de modèles de langage open source de 0,5 à 3,7 milliards de paramètres optimisés pour le portugais grâce à des jeux de données améliorés et des recettes d'entraînement novatrices qui établissent un état de l'art sur plusieurs benchmarks linguistiques.

Nicholas Kluge Corrêa, Aniket Sen, Shiza Fatimah, Sophia Falk, Lennard Landgraf, Julia Kastner, Lucie Flek

Publié 2026-03-05
📖 2 min de lecture☕ Lecture pause café

Each language version is independently generated for its own context, not a direct translation.

`). Avant de répondre, ils prennent le temps de réfléchir à voix haute, étape par étape, uniquement en portugais.
* Pourquoi c'est important ? Avant, quand une IA réfléchissait en portugais, elle avait tendance à basculer en anglais. Tucano 2 a forcé l'IA à garder ses pensées en portugais, ce qui est crucial pour des tâches complexes comme les mathématiques ou le droit.

5. Le Résultat : Un Champion Local

Grâce à tout cela, les modèles Tucano 2 (qui vont du petit 0,5 milliard au grand 3,7 milliard de paramètres) battent ou égalent les modèles multilingues beaucoup plus gros et plus chers sur les tests en portugais.

  • Ils sont plus intelligents sur des sujets locaux (examens brésiliens, lois, culture).
  • Ils sont plus économes en énergie.
  • Surtout, tout est public : n'importe qui peut télécharger les modèles, les données et les recettes pour les améliorer.

En résumé

Tucano 2, c'est comme si une équipe de chercheurs avait décidé de ne plus attendre que les géants de la Silicon Valley s'occupent du portugais. Ils ont construit leur propre ferme, leur propre école et leur propre bibliothèque, et ils ont prouvé qu'avec de bons ingrédients et une méthode intelligente, on peut créer une IA locale qui rivalise avec les géants mondiaux, le tout en restant transparent et accessible à tous. 🦜🇧🇷🇵🇹