Beyond Attribution: Unified Concept-Level Explanations

Das Paper stellt UnCLE vor, ein allgemeines Framework, das bestehende modellunabhängige Erklärungsmethoden durch die Nutzung großer vortrainierter Modelle erweitert, um einheitliche konzeptbasierte Erklärungen in Form von Attributen, hinreichenden Bedingungen und kontrafaktischen Szenarien für verschiedene Text-, Bild- und Multimodalmodelle bereitzustellen.

Junhao Liu, Haonan Yu, Xin Zhang

Veröffentlicht 2026-02-27
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stellen Sie sich vor, Sie haben einen sehr klugen, aber störrischen Koch (das KI-Modell), der Ihnen ein Gericht serviert. Wenn Sie ihn fragen: „Warum schmeckt das so gut?", antwortet er oft nur mit einer Liste von Zutaten: „Weil 0,3 Gramm Salz, 0,1 Gramm Pfeffer und ein bisschen Zwiebel enthalten waren."

Das ist für uns Menschen schwer zu verstehen. Wir wollen keine chemische Analyse, wir wollen wissen: „Weil das Fleisch saftig war" oder „Weil die Soße perfekt gewürzt war." Das sind Konzepte – die großen Ideen hinter den Details.

Bisher gab es zwei Probleme:

  1. Die meisten Erklärungs-Tools für KI sprachen nur die „Zutaten-Ebene" an (zu technisch).
  2. Die wenigen Tools, die auf „Konzepten" sprachen, konnten nur eine Art von Frage beantworten: „Was hat zum Ergebnis beigetragen?" (Attribution). Sie konnten aber nicht sagen: „Was müsste ich ändern, damit das Ergebnis anders wird?" (Gegenbeispiele) oder „Welche Zutaten reichen aus, damit es immer gut schmeckt?" (Ausreichende Bedingungen).

Hier kommt UnCLE ins Spiel.

Was ist UnCLE?

UnCLE ist wie ein universeller Dolmetscher, der die KI-Sprache in menschliche Konzepte übersetzt. Es ist ein „Rahmenwerk" (ein Werkzeugkasten), das bestehende KI-Erklärungs-Tools nimmt und sie einfach „aufwertet".

Stellen Sie sich vor, Sie haben eine alte Kamera (ein bestehendes KI-Erklärungs-Tool wie LIME oder Anchors). Normalerweise macht diese Kamera nur scharfe, aber langweilige Schwarz-Weiß-Fotos von einzelnen Pixeln. UnCLE ist wie ein neuer Objektiv-Aufsatz, der diese Kamera befähigt, bunte, verständliche Fotos von ganzen Objekten zu machen.

Wie funktioniert das? (Die Magie hinter den Kulissen)

Das Geheimnis von UnCLE ist die Nutzung von großen, vortrainierten Modellen (wie moderne Sprach- oder Bild-KIs, die wir alle kennen).

  1. Das Verstehen: UnCLE schaut sich das Bild oder den Text an und fragt die große KI: „Was ist hier eigentlich zu sehen?" Statt zu sagen „Pixel 10 bis 20 sind rot", sagt sie: „Das ist ein Hund" oder „Das ist ein trauriger Satz".
  2. Das Experimentieren (Der Clou): Früher haben Erklärungs-Tools einfach Teile des Bildes schwarz übermalt (wie ein Zensor). Das sieht unschön aus und ist oft nicht logisch.
    • UnCLE macht es anders: Es sagt der großen KI: „Mach mir bitte ein Bild, auf dem der Hund fehlt, aber der Rest gleich bleibt." Oder: „Erzähl mir eine Geschichte, in der die Stimmung positiv ist, aber das Wort 'schön' fehlt."
    • Die große KI generiert diese neuen Szenen. Das ist wie ein Schauspieler, der eine Szene neu spielt, aber eine bestimmte Eigenschaft ändert.
  3. Die Erklärung: Da UnCLE nun mit ganzen Konzepten (Hund, Stimmung) statt mit Pixeln arbeitet, kann es dem Nutzer viel klarere Antworten geben:
    • Beiträge (Attribution): „Der 'Hund' war der Hauptgrund für die Klassifizierung."
    • Ausreichende Bedingungen: „Solange ein 'Hund' im Bild ist, wird das Modell immer 'Hund' sagen."
    • Gegenbeispiele (Counterfactuals): „Wenn du den 'Hund' durch eine 'Katze' ersetzt, ändert sich die Antwort."

Warum ist das so toll?

  • Ein Werkzeug für alle Fragen: Früher brauchten Sie ein Werkzeug für „Warum?" und ein anderes für „Was wäre wenn?". UnCLE ist wie ein Schweizer Taschenmesser, das beides kann. Sie müssen nur den gewünschten Modus wählen.
  • Besser für den Menschen: Es ist viel einfacher, über „einen Hund" zu diskutieren als über „Pixel 45 bis 60". Die Erklärungen sind treuer (faithful), weil sie sich auf das konzentrieren, was Menschen wirklich verstehen.
  • Flexibel: Es funktioniert bei Texten, Bildern und sogar bei Kombinationen aus beidem (Multimodal).

Zusammenfassung in einem Satz

UnCLE nimmt die trockene, technische KI-Erklärung und verwandelt sie in eine lebendige Geschichte über Konzepte (wie Objekte oder Themen), indem es moderne KI-Modelle als „Kreativ-Assistenten" nutzt, um Szenarien zu simulieren, anstatt nur Daten zu analysieren.

Es ist der Unterschied zwischen einem Koch, der Ihnen eine Liste von Chemikalien gibt, und einem Koch, der Ihnen sagt: „Das Gericht schmeckt so gut, weil wir frische Tomaten verwendet haben – und wenn wir Zitronen nehmen würden, wäre es sauer."

Erhalten Sie solche Paper in Ihrem Posteingang

Personalisierte tägliche oder wöchentliche Digests passend zu Ihren Interessen. Gists oder technische Zusammenfassungen, in Ihrer Sprache.

Digest testen →