Debiasing LLMs by Fine-tuning

Each language version is independently generated for its own context, not a direct translation.

🎓 Le Problème : L'Élève Brillant mais Trop Confiant

Imaginez que vous avez un élève très intelligent, nommé LLM (un grand modèle de langage comme nous le connaissons aujourd'hui). Cet élève a lu des millions de livres, d'articles de journaux et de rapports financiers pendant des années. Il connaît tout, il parle bien, et il peut répondre à n'importe quelle question.

Cependant, il y a un gros défaut dans sa façon de penser : il est trop confiant dans les tendances récentes.

L'analogie de la météo : Si vous lui dites qu'il a plu trois jours de suite, il va prédire qu'il va pleuvoir pendant les trois prochains mois, même si la météo dit le contraire. Il pense que "ce qui se passe maintenant va continuer pour toujours".
En finance : Si une action a monté hier, il pense qu'elle va continuer à monter demain. S'il a baissé, il pense qu'elle va s'effondrer. C'est ce qu'on appelle le biais d'extrapolation.

Les chercheurs ont essayé de lui dire : "Hé, sois plus rationnel, ne suis pas aveuglément la tendance !" (c'est ce qu'on appelle le "prompting"). Mais ça ne marche pas vraiment. C'est comme essayer de corriger un enfant en lui criant dessus : il entend les mots, mais son cerveau (ses paramètres internes) reste programmé pour suivre la tendance.

🛠️ La Solution : Le "Reconditionnement" (Fine-Tuning)

Au lieu de simplement lui donner des conseils à l'oral, les auteurs (Gao, Jiang et Yan) ont décidé de lui donner une nouvelle éducation ciblée.

Imaginez que vous prenez cet élève et que vous lui donnez un cahier d'exercices spécial.

L'exercice : Vous lui montrez une histoire de données (par exemple, les cours d'une action sur 10 ans).
La réponse idéale : Au lieu de laisser l'élève deviner, vous lui donnez la bonne réponse (ce qu'un investisseur très rationnel aurait prédit).
La méthode (LoRA) : Au lieu de réécrire tout le cerveau de l'élève (ce qui serait trop cher et risqué de faire oublier tout le reste), vous lui ajoutez un petit carnet de notes (c'est la technique LoRA). Ce carnet contient des règles spécifiques pour corriger son erreur de prédiction, sans toucher à ses connaissances générales.

C'est comme si vous donniez à un pilote d'avion un petit manuel de correction pour éviter de trop pencher l'avion dans un virage, sans avoir à reconstruire tout l'avion.

🧪 Les Résultats : Ça Marche !

Les chercheurs ont testé cette méthode dans deux situations :

Le laboratoire (Expériences contrôlées) :
Ils ont demandé au modèle de prédire des nombres qui bougent de manière aléatoire. Avant l'éducation, le modèle paniquait dès qu'il voyait une petite hausse ou baisse. Après l'éducation, il est devenu calme et rationnel. Il ne réagissait plus de manière excessive.
La vraie vie (Prédiction des actions boursières) :
Ils ont demandé au modèle de prédire les rendements des actions du S&P 500.
- Avant : Le modèle disait : "Ça monte, ça va continuer à monter !" (Erreur classique).
- Après : Le modèle a appris que les marchés ont tendance à se corriger. Il a dit : "Ça a monté, donc il y a de fortes chances que ça redescende un peu." Il a appris la réversion à la moyenne.

💡 Pourquoi c'est important ?

Aujourd'hui, on commence à utiliser ces intelligences artificielles pour gérer de l'argent (des "robo-conseillers"). Si on laisse un robot avec ce biais d'extrapolation gérer votre épargne, il va vous dire d'acheter quand tout le monde achète (au sommet) et de vendre quand tout le monde vend (au creux). C'est le pire conseil possible !

Ce papier nous dit : "Ne vous contentez pas de demander poliment à l'IA d'être sage. Entraînez-la spécifiquement avec de bons exemples, et vous pouvez corriger ses défauts de caractère."

C'est une méthode peu coûteuse et efficace pour s'assurer que nos futurs assistants financiers ne soient pas des parieurs impulsifs, mais de véritables stratèges rationnels.

Each language version is independently generated for its own context, not a direct translation.

1. Problématique

Les modèles de langage de grande taille (LLM) utilisés comme agents autonomes dans la prise de décision financière présentent un biais d'extrapolation systématique. Ce biais, bien documenté chez les humains, se manifeste par une surpondération des tendances récentes lors de la formation de prévisions (par exemple, sur les rendements boursiers).

Limites des approches actuelles : Les méthodes basées sur l'ingénierie des prompts (incitations, chaînes de pensée, instructions de rôle) se sont révélées inefficaces pour corriger ce biais. Les auteurs suggèrent que ce biais est encodé dans les représentations apprises du modèle lors de son pré-entraînement (sur des corpus financiers contenant un langage d'extrapolation) et renforcé lors de l'étape d'alignement, plutôt que d'être un problème de formulation de la requête.
Nécessité d'une intervention paramétrique : Pour corriger un biais profondément ancré dans les poids du modèle, une intervention au niveau des paramètres est requise, et non une simple modification de l'entrée (prompt).

2. Méthodologie

Les auteurs proposent un cadre d'affinage supervisé (SFT - Supervised Fine-Tuning) utilisant l'adaptation à faible rang (LoRA - Low-Rank Adaptation) pour modifier le comportement de prédiction d'un LLM sans altérer sa compréhension générale du langage.

A. Architecture et Modèle

Modèle de base : Qwen3-32B (32 milliards de paramètres), un modèle open-weight choisi pour permettre l'inspection et la modification des paramètres internes, contrairement aux modèles propriétaires via API.
Technique LoRA : Au lieu d'affiner tous les paramètres (coûteux et risquant l'oubli catastrophique), la méthode gèle les poids pré-entraînés ( $W_0$ $W_{0}$ ) et ajoute de petites matrices de mise à jour de faible rang ( $A$ $A$ et $B$ $B$ ) aux couches d'attention. Seules ces matrices sont entraînées.
- Formule de sortie : $h = W_0x + BAx$ .
- Avantage : Réduction drastique des coûts de calcul et préservation des capacités linguistiques générales du modèle.

B. Construction du Jeu de Données

Le processus suit une séparation stricte entre les données d'entraînement, de validation et de test :

Identification du biais (Test Set) : On mesure le biais initial en présentant au modèle des historiques de rendements et en comparant ses prévisions brutes à des benchmarks rationnels.
Jeu de données d'instruction (Training & Validation) : Création d'un ensemble de paires (prompt, réponse) où :
- Le prompt est identique à celui du test (historique de rendements).
- La réponse cible encode une prévision rationnelle (soit basée sur des attentes rationnelles conditionnelles, soit sur les rendements réalisés futurs).
- L'objectif est d'apprendre au modèle à remplacer l'extrapolation biaisée par une prévision disciplinée.

C. Procédure d'Entraînement

Affinage sur le jeu d'instruction avec LoRA.
Utilisation d'un jeu de validation pour surveiller la généralisation et appliquer un arrêt précoce (early stopping) pour éviter le surajustement (overfitting).
Fusion des matrices LoRA dans les poids originaux pour le déploiement sans surcharge d'inférence.

3. Résultats Expérimentaux

L'étude valide l'approche dans deux environnements distincts :

A. Expériences de Prévision Contrôlées (Processus AR(1))

Configuration : Reproduction de l'expérience d'Afrouzi et al. (2023) où le modèle doit prévoir des séries temporelles générées par des processus AR(1) avec différents niveaux de persistance ( $\rho$ ).
Résultat Initial (Baseline) : Le modèle pré-entraîné montre une sur-réaction significative (coefficient de révision de prévision négatif, $\hat{b} \approx -0.456$ pour $\rho=0.0$ ), imitant le comportement humain de sur-réaction aux chocs transitoires.
Résultat Après Affinage : Après le SFT, le biais de sur-réaction devient statistiquement insignifiant. Les coefficients de révision se rapprochent de zéro (ex: $\hat{b} = -0.027$ pour $\rho=1.0$ ), indiquant que le modèle a appris à ne pas extrapoler les tendances transitoires.

B. Prédiction des Rendements Boursiers (Cross-section S&P 500)

Configuration : Prévision des rendements mensuels des composantes du S&P 500 sur la base des 12 derniers mois de rendements.
Résultat Initial (Baseline) : Le modèle extrapole fortement les performances récentes. Le coefficient sur le rendement du mois le plus récent est positif et élevé ( $\beta_0 = 0.394$ ), confirmant un biais d'extrapolation similaire à celui observé chez les humains et dans les études précédentes (Chen et al., 2024).
Résultat Après Affinage : Le biais est inversé. Le modèle apprend la tendance de retour à la moyenne (mean-reversion) des rendements boursiers à court terme. Le coefficient sur le rendement récent devient négatif ( $\beta_0 = -0.120$ ), reflétant la réalité empirique où les surperformances récentes ont tendance à se renverser.
Validation : Ces corrections tiennent strictement hors échantillon (sur la période 2016-2024), prouvant que le changement de comportement est une généralisation apprise et non un artefact d'ajustement sur les données d'entraînement.

4. Contributions Clés

Preuve de concept du débiaisage paramétrique : Démontre que les biais comportementaux des LLM ne sont pas fixes mais peuvent être corrigés par un affinement ciblé des paramètres, là où les prompts échouent.
Efficacité et Accessibilité : La méthode LoRA rend ce processus peu coûteux (quelques centaines de dollars) et accessible, contrairement au pré-entraînement ou à l'affinage complet de modèles de 32 milliards de paramètres.
Généralisabilité : Le cadre proposé est applicable à divers domaines financiers (évaluation du risque de crédit, nowcasting macroéconomique, trading algorithmique) dès lors qu'un benchmark rationnel ou un résultat réalisé peut être défini pour l'entraînement.

5. Signification et Implications

Déploiement Responsable : Pour que les agents IA soient fiables dans la prise de décision financière autonome (conseillers en investissement, trading), il est impératif de corriger leurs biais cognitifs inhérents. Un agent qui extrapole les tendances récentes amplifierait les biais comportementaux des clients au lieu de les atténuer.
Nouvelle Norme pour les Agents Financiers : L'article suggère que l'étape d'alignement (alignment) standard ne suffit pas. Une étape supplémentaire d'affinage supervisé sur des données de prévision rationnelles est nécessaire pour garantir que les agents financiers opèrent selon des principes économiques rigoureux.
Impact sur la Recherche : Cela ouvre la voie à une nouvelle génération d'agents économiques autonomes capables de simuler un comportement rationnel, dépassant les limites des modèles actuels qui reproduisent simplement les biais statistiques de leurs données d'entraînement.