Verbalizing LLM's Higher-order Uncertainty via Imprecise Probabilities

Each language version is independently generated for its own context, not a direct translation.

Imagine que vous posez une question à un expert très intelligent, mais un peu confus : un grand modèle de langage (LLM). Souvent, cet expert vous répond avec une assurance totale, même quand il se trompe, ou alors il hésite d'une manière que nous ne comprenons pas vraiment.

Ce papier propose une nouvelle façon de demander à cet expert : "À quel point es-tu vraiment sûr de toi ?"

Voici l'explication simple, avec quelques images pour rendre les choses claires.

1. Le Problème : L'Expert qui ment (ou qui se trompe)

Actuellement, si vous demandez à un LLM : "Es-tu sûr de ta réponse ?", il a tendance à répondre : "Oui, à 80 % !" ou "Non, à 50 % !".
Le problème, c'est que ce chiffre unique (une "probabilité précise") est souvent faux.

Exemple : Si vous demandez "Qui a organisé la Coupe du Monde de cricket en 2019 ?", la réponse est à la fois l'Angleterre et le Pays de Galles. Si le modèle dit "Je suis sûr à 80 % que c'est l'Angleterre", il rate la nuance. Il ne dit pas qu'il y a une ambiguïté dans la question elle-même.

Les chercheurs ont remarqué que les modèles échouent souvent dans trois situations :

Questions floues : Quand la question admet plusieurs réponses valides.
Apprentissage par l'exemple : Quand on donne des exemples au modèle, il devrait devenir plus sûr, mais ses scores d'incertitude restent souvent bloqués.
Réflexion sur soi : Quand le modèle doit expliquer pourquoi il a choisi une réponse, ses explications ne correspondent pas toujours à ses chiffres de confiance.

2. La Solution : La "Zone d'Incertitude" (Probabilités Imprécises)

Au lieu de demander un seul chiffre précis (comme 80 %), les auteurs proposent de demander à l'expert de donner une fourchette ou une zone.

Imaginez que vous demandez à un météorologue : "Va-t-il pleuvoir ?"

L'ancienne méthode (Précise) : Il dit : "Il y a 60 % de chance de pluie." (C'est un point précis).
La nouvelle méthode (Imprecise) : Il dit : "Il y a entre 40 % et 80 % de chance de pluie."

Cette zone (l'intervalle) nous dit deux choses importantes :

L'incertitude de base (1er ordre) : La météo est juste imprévisible (il peut pleuvoir ou non). C'est le hasard.
L'incertitude sur l'incertitude (2ème ordre) : La largeur de la zone (de 40 à 80 %) nous dit à quel point le météorologue ignore les détails.
- Si la zone est petite (59 % à 61 %), il est très confiant dans son calcul.
- Si la zone est énorme (10 % à 90 %), il avoue : "Je ne sais pas vraiment, il y a trop de facteurs que je ne maîtrise pas."

3. Les Analogies pour comprendre

A. Le Jeu de Paris (Pour la confiance)

Imaginez que vous jouez à un jeu où vous devez parier sur la réponse.

Méthode classique : On vous demande : "Combien d'argent mettez-vous sur cette réponse ?" Vous répondez : "50 dollars".
Méthode du papier : On vous demande : "Quel est le montant minimum que vous accepteriez de payer pour ce pari, et quel est le maximum que vous accepteriez de payer ?"
- Si vous dites "Entre 10 $et 90$ ", cela signifie que vous êtes très confus sur la valeur réelle du pari.
- Si vous dites "Entre 48 $et 52$ ", vous êtes très sûr de la valeur.

B. La Carte au Trésor (Pour l'apprentissage)

Imaginez que vous cherchez un trésor avec une carte.

Peu d'indices (peu d'exemples) : La carte montre une zone immense où le trésor pourrait être. C'est une grande incertitude de 2ème ordre (vous ne savez pas où chercher).
Beaucoup d'indices (beaucoup d'exemples) : La carte se précise, la zone rétrécit.
Le problème actuel : Les modèles actuels disent toujours "Je suis à 50 % sûr" même quand la carte rétrécit. Ils ne montrent pas que leur ignorance a diminué.
La solution du papier : Avec la nouvelle méthode, la zone sur la carte rétrécit vraiment. On voit visuellement que le modèle a appris et qu'il est moins "aveugle".

C. Le Flou Artistique (Pour les questions ambiguës)

Si vous demandez "Quelle est la capitale de la France ?", la réponse est précise : Paris.
Si vous demandez "Quelle est la meilleure ville de France ?", il n'y a pas de réponse unique.

L'ancien modèle : Essaie de forcer une réponse unique et donne un chiffre bizarre.
Le nouveau modèle : Reconnaît que la question est floue. Il dit : "Je ne peux pas donner un chiffre précis car la question elle-même est subjective. Ma réponse est une large zone d'incertitude."

4. Pourquoi c'est génial ?

Plus honnête : Le modèle ne fait pas semblant de savoir quand il ne sait pas. Il avoue son ignorance par la largeur de sa réponse.
Meilleure aide à la décision : Si vous utilisez un LLM pour prendre une décision importante (médicale, financière), savoir que l'incertitude est "large" (le modèle est confus) est plus utile que de savoir qu'il est "à 80 % sûr" (ce qui pourrait être faux).
Moins cher : Cette méthode utilise des questions simples posées au modèle, sans avoir besoin de le faire tourner des milliers de fois (ce qui coûte cher en temps et en argent).

En résumé

Ce papier dit : "Arrêtons de demander aux IA de donner un seul chiffre de confiance. Demandez-leur plutôt de dessiner une zone d'incertitude."

Cela permet de distinguer ce qui est vraiment imprévisible (comme le temps qu'il fera demain) de ce qui est dû à un manque de connaissances (comme ne pas savoir la réponse parce qu'on n'a pas assez d'indices). C'est une façon beaucoup plus mature et humaine de mesurer la confiance d'une intelligence artificielle.

Each language version is independently generated for its own context, not a direct translation.

1. Problématique

Les modèles de langage (LLM) sont de plus en plus utilisés pour des tâches critiques, ce qui rend l'estimation de leur incertitude (Uncertainty Quantification - UQ) cruciale. Cependant, les méthodes actuelles d'élicitation de l'incertitude, souvent basées sur une probabilité précise unique (ex: "Je suis sûr à 80 %"), présentent des échecs systématiques dans trois scénarios clés :

Questions ambiguës : Les méthodes classiques ne parviennent pas à distinguer une question clairement définie d'une question admettant plusieurs réponses valides simultanément.
Apprentissage en contexte (ICL) : Lorsque des exemples sont ajoutés au prompt, l'erreur de prédiction diminue, mais les scores d'incertitude des méthodes actuelles restent souvent stables et élevés, ne reflétant pas la réduction de l'incertitude épistémique.
Auto-réflexion : Les LLM sélectionnent souvent une réponse qui ne correspond pas à la maximisation de l'utilité attendue déduite de leurs propres scores d'incertitude, violant la rationalité bayésienne.

Le problème fondamental réside dans le fait que les approches existantes tentent de réduire toute l'incertitude à une seule valeur scalaire, ignorant la distinction entre l'incertitude intrinsèque du problème (bruit/ambiguïté) et l'incertitude du modèle sur sa propre connaissance.

2. Méthodologie

Les auteurs proposent un cadre basé sur les Probabilités Imprécises (Imprecise Probabilities - IP) pour modéliser et éliciter l'incertitude d'ordre supérieur.

Concepts Clés

Incertitude du premier ordre (First-order) : Incertitude sur les réponses possibles (variabilité aléatoire ou ambiguïté de la question).
Incertitude du second ordre (Second-order) : Incertitude sur le modèle de probabilité lui-même (manque de connaissance, ignorance). Dans le cadre IP, cela est représenté par des intervalles de probabilité $[p(y), \bar{p}(y)]$ plutôt que par un point unique. La largeur de l'intervalle quantifie l'imprécision.

Techniques d'Élicitation

L'article introduit des stratégies de prompting et de post-traitement pour extraire ces intervalles directement via le langage naturel :

ProbInt (Intervalle de Probabilité) : Le modèle est invité à fournir une probabilité inférieure (ce qui est certainement justifié) et une probabilité supérieure (ce qui est défendable) pour chaque réponse candidate.
Credal (Ensemble de Croyances) : Utilisation d'un ensemble de modèles (ou de plusieurs exécutions avec des graines différentes) pour former un ensemble crédal. L'intervalle est défini par les probabilités minimales et maximales observées parmi les membres de l'ensemble.
Pos (Fonction de Possibilité) : Évaluation de la plausibilité relative des réponses, y compris l'option "aucune des réponses ci-dessus", permettant de gérer les ensembles de réponses incomplets sans contrainte d'additivité stricte.
DeFinetti (Vérification de cohérence) : Pour le premier ordre, le modèle est invité à fixer des "prix de paris" (betting prices) pour chaque réponse, assurant la cohérence avec les axiomes de probabilité (non-négativité, normalisation).

Métrique d'Incertitude : MMI

Pour convertir ces représentations IP en un score scalaire utilisable, les auteurs utilisent le Maximum Mean Imprecision (MMI).

Pour un intervalle unique : $MMI = \bar{p}(y) - p(y)$ .
Pour un ensemble de réponses : Une borne supérieure est utilisée : $MMI \le 1 - \sum \underline{p}(y)$ .
Ce score capture l'imprécision globale (incertitude d'ordre supérieur).

3. Contributions Clés

Cadre théorique appliqué aux LLM : Première instantiation concrète des probabilités imprécises pour l'élicitation verbale de l'incertitude dans les LLM, permettant de séparer l'ambiguïté de la question (premier ordre) de l'incertitude du modèle (second ordre).
Méthodes d'élicitation généralisables : Développement de prompts universels (DeFinetti, ProbInt, Credal, Pos) qui ne nécessitent pas d'accès aux paramètres internes du modèle (boîte noire).
Désambiguïsation de l'incertitude : Démonstration que les méthodes IP peuvent distinguer l'ignorance (l'intervalle est large car le modèle ne sait pas) de l'indifférence (l'intervalle est étroit mais centré sur une valeur incertaine).
Efficacité computationnelle : Contrairement aux méthodes basées sur l'échantillonnage massif (comme l'entropie sémantique), les méthodes IP proposées sont très peu coûteuses en API (coût comparable aux méthodes verbales simples).

4. Résultats Expérimentaux

Les expériences ont été menées sur des données synthétiques et des benchmarks réels (MMLU-Pro, AmbigQA, MAQA).

Séparation des incertitudes (Expériences synthétiques) :
- Face à une augmentation du bruit d'ambiguïté (premier ordre), les scores IP restent stables, tandis que les scores classiques (Vanilla) augmentent linéairement, montrant une meilleure désambiguïsation.
- Face à l'ajout d'exemples en contexte (réduction du second ordre), les scores IP (notamment ProbInt) diminuent pour suivre la baisse de l'erreur de prédiction, contrairement aux méthodes classiques qui restent plates.
Détection d'ambiguïté et de justesse (Benchmarks réels) :
- Ambiguïté : La méthode DeFinetti obtient les meilleurs scores AUROC pour détecter si une question est ambiguë, surpassant les méthodes basées sur l'entropie sémantique.
- Justesse (Correctness) : Les méthodes ProbInt et Credal surpassent les baselines (Vanilla, CoT, Top-4) pour prédire si une réponse est correcte, tant sur des questions non ambiguës que sur des ensembles mixtes.
- Cohérence décisionnelle : Les décisions prises par les LLM (choix de la réponse) s'alignent beaucoup mieux avec la règle Maximin (maximiser la probabilité inférieure) issue de la théorie des probabilités imprécises qu'avec la maximisation de l'utilité bayésienne classique.
Coût : Les méthodes IP sont nettement moins coûteuses que les méthodes d'ensemble basées sur l'échantillonnage (comme MI-Clarifications), coûtant moins de la moitié du prix API.

5. Signification et Impact

Cet article marque un tournant dans la façon dont nous évaluons et utilisons la confiance des LLM :

Fiabilité accrue : En permettant aux modèles d'exprimer une "zone d'incertitude" plutôt qu'un chiffre unique, on obtient une représentation plus fidèle de leur état de connaissance, réduisant les faux positifs de confiance.
Prise de décision robuste : Le cadre IP offre des règles de décision (comme Maximin) qui sont plus robustes face à l'ambiguïté et à l'ignorance, ce qui est crucial pour les applications en santé, droit ou finance.
Accessibilité : La méthode fonctionne avec des modèles fermés (boîte noire) via des prompts simples, rendant l'UQ de haute qualité accessible sans réentraînement coûteux.

En conclusion, l'approche par probabilités imprécises résout les incohérences des méthodes actuelles en reconnaissant que l'incertitude n'est pas toujours une valeur précise, mais souvent un intervalle reflétant la limite de la connaissance du modèle.