Beyond Attribution: Unified Concept-Level Explanations

Ce papier présente UnCLE, un cadre général qui étend les techniques d'explication agnostiques au modèle pour fournir des explications unifiées au niveau des concepts sous plusieurs formes (attributions, conditions suffisantes et contre-factuels), offrant ainsi une plus grande fidélité et une diversité de réponses aux besoins des utilisateurs pour divers modèles multimodaux.

Junhao Liu, Haonan Yu, Xin Zhang

Publié 2026-02-27
📖 4 min de lecture☕ Lecture pause café

Each language version is independently generated for its own context, not a direct translation.

Imaginez que vous essayez de comprendre pourquoi un ami très intelligent (mais un peu mystérieux) a pris une décision étrange, comme refuser de vous prêter sa voiture.

Si vous demandez à un expert en intelligence artificielle classique, il pourrait vous dire : « Il a refusé parce que le mot « pluie » était dans votre message, et le mot « urgent » aussi. » C'est utile, mais un peu technique et froid. C'est comme si on vous expliquait une décision en listant des lettres de l'alphabet.

C'est là qu'intervient le nouveau framework UnCLE, présenté dans cet article. Voici son idée en termes simples :

1. Le Problème : Les Explications Trop « Bricolées »

Actuellement, les outils pour expliquer les décisions de l'IA fonctionnent souvent comme un puzzle mal coupé. Ils regardent l'image ou le texte et disent : « C'est ce petit carré de pixels ici, et ce mot bizarre là, qui ont causé la décision. »
C'est comme essayer d'expliquer pourquoi un film est triste en vous montrant des pixels flous à l'écran. C'est vrai techniquement, mais ça ne parle pas à votre cerveau humain. De plus, ces outils ne peuvent souvent dire que « c'est à cause de ça » (attribution), mais pas « si on changeait ça, le résultat serait différent » (contre-exemple) ou « il faut absolument ça pour que ça marche » (condition suffisante).

2. La Solution d'UnCLE : Passer du « Pixel » au « Concept »

UnCLE est comme un traducteur universel qui transforme le langage des pixels en langage humain.

Au lieu de regarder des petits carrés de pixels, UnCLE demande à une IA très puissante (un « grand modèle pré-entraîné ») de dire : « Ah, dans cette image, je vois un chien, un parapluie et une pluie. »
Ensuite, au lieu de gommer des pixels au hasard, UnCLE demande à cette IA de modifier les concepts : « Et si on enlevait le chien ? » ou « Et si on ajoutait un parapluie ? ».

L'analogie du Chef Cuisinier :

  • L'ancienne méthode (LIME, Anchors, etc.) : Le chef vous dit : « J'ai ajouté 0,5g de sel ici et 0,2g de poivre là. C'est pour ça que c'est salé. » (C'est précis, mais vous ne comprenez pas le goût global).
  • La méthode UnCLE : Le chef vous dit : « J'ai mis du poisson frais et des citrons. C'est pour ça que c'est un plat de poisson. Si je retire le poisson, ce n'est plus un plat de poisson. » (C'est compréhensible et utile).

3. Les Trois Super-Pouvoirs d'UnCLE

UnCLE ne se contente pas de dire « c'est à cause de ça ». Il peut répondre à trois types de questions que les humains posent naturellement :

  1. L'Attribution (Le « Pourquoi ») : « Pourquoi as-tu classé cette photo comme un "chat" ? »
    • Réponse UnCLE : « Parce qu'il y a des oreilles pointues et une queue. » (Au lieu de dire : « à cause de ces pixels gris ici »).
  2. La Condition Suffisante (Le « Garantie ») : « Qu'est-ce qu'il faut absolument pour que tu dises "chat" ? »
    • Réponse UnCLE : « Tant qu'il y a des oreilles pointues et une queue, peu importe la couleur, je dirai "chat". »
  3. Le Contre-Exemple (Le « Et si... ») : « Comment changer cette photo pour que tu dises "chien" ? »
    • Réponse UnCLE : « Si on remplace les oreilles pointues par des oreilles tombantes, je changerai d'avis. »

4. Pourquoi c'est génial ?

L'article montre que cette méthode est :

  • Plus fidèle : Elle reflète vraiment comment l'IA pense, car elle teste des changements réels (enlever un objet, changer un concept) plutôt que de deviner sur des pixels.
  • Plus flexible : Elle fonctionne avec n'importe quel modèle (texte, image, ou les deux), comme un adaptateur universel.
  • Plus humaine : Les utilisateurs comprennent mieux les explications. Dans les tests, les gens ont mieux réussi à prédire les décisions de l'IA quand on leur donnait des explications basées sur des concepts (comme « un chien ») plutôt que sur des pixels.

En Résumé

UnCLE est comme un pont entre la logique froide des machines et la compréhension intuitive des humains. Il prend les outils existants (qui sont souvent limités et techniques) et les élève au niveau des idées et des objets que nous utilisons au quotidien.

Au lieu de vous montrer les engrenages d'une montre pour vous expliquer l'heure, UnCLE vous dit simplement : « Regardez les aiguilles, c'est l'heure. » C'est plus simple, plus clair, et surtout, beaucoup plus utile pour nous, les humains.

Recevez des articles comme celui-ci dans votre boîte mail

Digests quotidiens ou hebdomadaires personnalisés selon vos intérêts. Résumés Gist ou techniques, dans votre langue.

Essayer Digest →