Quantifying Harm

Ursprüngliche Autoren: Sander Beckers, Hana Chockler, Joseph Y. Halpern

Veröffentlicht 2026-05-07

📖 6 Min. Lesezeit🧠 Tiefgang

Ursprüngliche Autoren: Sander Beckers, Hana Chockler, Joseph Y. Halpern

Originalarbeit lizenziert unter CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). ✨ Dies ist eine KI-generierte Erklärung des untenstehenden Papers. Sie wurde nicht von den Autoren verfasst oder gebilligt. Für technische Genauigkeit konsultieren Sie das Originalpaper. Vollständigen Haftungsausschluss lesen

Each language version is independently generated for its own context, not a direct translation.

Das große Ganze: Von „Hat es wehgetan?" zu „Wie sehr hat es wehgetan?"

Stellen Sie sich vor, Sie sind ein Richter, der entscheiden muss, ob ein neues KI-System Schaden verursacht hat. In der Vergangenheit hatten die Autoren (Beckers, Chockler und Halpern) eine einfache Regel: Ja oder Nein. Hat die KI Schaden verursacht? Wenn die Antwort „Ja" lautete, war es das.

Aber in der realen Welt müssen wir präziser sein. Wir wollen nicht nur wissen, ob Schaden eingetreten ist; wir wollen wissen, wie schlimm er war, damit wir die beste Option wählen können. Dieses Papier geht darum, ein mathematisches Lineal zu bauen, um die „Menge" des Schadens zu messen, anstatt nur einen Lichtschalter zu haben, der „an" oder „aus" sagt.

1. Die Basislinie: Was ist „normal"?

Um Schaden zu messen, benötigen Sie einen Ausgangspunkt. Denken Sie daran wie an einen Thermostat.

Der Standardnutzen: Dies ist die „normale" Raumtemperatur.
Das Ergebnis: Dies ist die tatsächliche Temperatur, nachdem die Heizung oder die Klimaanlage gelaufen ist.

Wenn der Raum eigentlich 21 °C (der Standard) haben soll und die Heizung ihn auf 24 °C bringt, ist das ein Vorteil. Wenn die Klimaanlage ihn auf 15 °C bringt, ist das ein Schaden. Die Schadenshöhe ist einfach die Differenz zwischen dem Ort, an dem Sie sein sollten, und dem Ort, an dem Sie tatsächlich gelandet sind.

Die Wendung: Das Papier argumentiert, dass „normal" nicht immer null ist. Manchmal ist „normal" ein Bereich.

Analogie: Stellen Sie sich vor, Sie geben einem Kellner ein Trinkgeld.
- Der Bereich: Ein Trinkgeld zwischen 15 % und 20 % ist „normal". Es ist weder gut noch schlecht; es wird einfach erwartet.
- Schaden: Wenn Sie 5 % geben, haben Sie Schaden verursacht (Sie liegen unter dem Boden).
- Vorteil: Wenn Sie 50 % geben, haben Sie einen Vorteil geschaffen (Sie liegen über der Decke).
- Der Punkt: Man kann nicht einfach sagen „mehr Geld ist immer besser". Es gibt einen „Sweet Spot", in dem nichts passiert.

2. Der Würfelwurf: Umgang mit Unsicherheit

Das Leben ist selten sicher. Manchmal heilt eine Operation eines Arztes einen Patienten; manchmal tötet sie ihn. Wie messen wir Schaden, wenn das Ergebnis ein Glücksspiel ist?

Das Papier untersucht, wie Menschen tatsächlich über Risiken denken, was oft seltsam ist.

Das Problem des „fahrerlosen Autos": Stellen Sie sich ein autonomes Fahrzeug vor.
- Option A: Fahren Sie mit dem Tempolimit. Es besteht eine Chance von 1 zu einer Million auf einen tödlichen Unfall.
- Option B: Fahren Sie 20 % langsamer. Es besteht eine Chance von 1 zu 2 Millionen auf einen tödlichen Unfall.
- Die Mathematik: Option B ist sicherer. Wenn Sie einfach die Mathematik machen (Erwartungsnutzen), sollten Sie immer B wählen.
- Die Realität: Menschen bevorzugen oft Option A. Warum? Weil unser Gehirn eine Chance von 1 zu einer Million als „im Grunde null" behandelt. Wir ignorieren winzige Risiken.

Die Autoren schlagen vor, Gewichtung von Wahrscheinlichkeiten zu verwenden. Anstatt ein 1%-Risiko und ein 0,0001%-Risiko linear zu behandeln, wenden wir ein „Gewicht" auf sie an.

Analogie: Denken Sie an eine Lupe.
- Manchmal verwenden wir eine Lupe, die winzige Risiken riesig erscheinen lässt (wie die Angst vor einem Terroranschlag, nachdem man davon gehört hat).
- Manchmal verwenden wir einen „Dimmer", der winzige Risiken verschwinden lässt (wie das Ignorieren des Risikos eines Autounfalls, weil wir jeden Tag fahren).
- Um Schaden genau zu messen, müssen wir berücksichtigen, wie Menschen diese Wahrscheinlichkeiten tatsächlich wahrnehmen, nicht nur die rohen Zahlen.

3. Das Gruppenproblem: Fairness und Aggregation

Was passiert, wenn eine Politik 1.000 Menschen schadet? Addieren wir einfach den Schmerz?

Die „Summen"-Falle: Wenn Politik A 1.000 zufällige Menschen um ein winziges bisschen schadet und Politik B eine spezifische Person stark schadet, könnte eine einfache mathematische Summe sagen, dass sie gleich sind.
Das Fairness-Problem: Intuitiv fühlen wir uns bei diesen beiden Situationen unterschiedlich. 1.000 zufällige Menschen zu verletzen fühlt sich anders an als das gezielte Verletzen einer spezifischen Person (oder einer spezifischen Gruppe, wie einer Minderheitengemeinschaft).

Das Papier schlägt eine Fairness-Strafe vor.

Analogie: Stellen Sie sich eine Schulcafeteria vor.
- Wenn die Cafeteria versehentlich 100 zufälligen Schülern ein schlechtes Mittagessen gibt, ist das ärgerlich.
- Wenn die Cafeteria nur den Schülern an Tisch 5 schlechte Mittagessen gibt, fühlt sich das wie Mobbing an.
- Die Autoren schlagen vor, dass unser „Schadensrechner" eine massive Strafe hinzufügen sollte, wenn eine Politik eine spezifische, identifizierbare Gruppe unverhältnismäßig stark schadet. Es geht nicht nur um die Gesamtzahl der verletzten Menschen; es geht darum, wer verletzt wird.

4. Die Debatte um Präzisionsmedizin

Das Papier verbindet diese Ideen mit einer aktuellen Debatte in der Medizin über „Präzisionsmedizin" (die Anpassung von Behandlungen an spezifische Gene).

Der Konflikt: Einige Experten sagen: „Behandeln Sie den Patienten, wenn der durchschnittliche Nutzen positiv ist." Andere sagen: „Nein, wir müssen vermeiden, dem Einzelnen Schaden zuzufügen, selbst wenn der durchschnittliche Nutzen positiv ist."
Die Sicht der Autoren: Sie zeigen, dass diese Debatte eigentlich nur eine spezifische Version der Probleme ist, die sie bereits gelöst haben.
- Der Ansatz des „durchschnittlichen Nutzens" ignoriert den „Standard" (was passiert, wenn wir nichts tun).
- Der Ansatz „Schaden vermeiden" stützt sich oft auf eine spezifische Definition von Kausalität (der „Aber-durch"-Test: „Wären sie aber durch die Behandlung gestorben?").
- Die Autoren argumentieren, dass die medizinische Debatte die Nuance des Kontexts vermisst. Was „Schaden" ist, hängt davon ab, wie das Leben des Patienten vor der Behandlung war. Wenn ein Patient bereits stirbt, ist eine riskante Behandlung möglicherweise nicht „schädlich", selbst wenn sie ihn tötet, weil die Alternative ohnehin der Tod war.

5. Der schwierige Teil: Die Mathematik ist knifflig

Schließlich gibt das Papier zu, dass die Berechnung dessen rechnerisch sehr schwierig ist.

Analogie: Stellen Sie sich vor, Sie versuchen, ein riesiges Sudoku-Puzzle zu lösen, bei dem sich jedes Mal, wenn Sie eine Zahl verschieben, die Regeln des Puzzles leicht ändern.
Die Autoren beweisen, dass das Herausfinden, genau „wie viel" Schaden eingetreten ist, ein Problem ist, das im schlimmsten Fall einen Supercomputer sehr lange Zeit zur Lösung benötigt.
Allerdings: Sie argumentieren, dass die Puzzles im echten Leben normalerweise nicht so groß sind. Die meisten Entscheidungen beinhalten eine überschaubare Anzahl von Variablen, sodass wir diese Definitionen in der Praxis dennoch verwenden können.

Zusammenfassung

Dieses Papier baut ein ausgeklügeltes Werkzeug zur Messung von Schaden. Es geht über einfache „Ja/Nein"-Antworten hinaus und fragt:

Wie viel schlechter ist das Ergebnis im Vergleich zur „normalen" Basislinie?
Wie passen wir uns an die Art und Weise an, wie Menschen Risiken wahrnehmen (winzige Risiken ignorieren vs. sie fürchten)?
Wie stellen wir sicher, dass wir keine spezifischen Gruppen ungerecht behandeln?

Indem sie diese Fragen beantworten, hoffen die Autoren, KI-Systemen, Ärzten und politischen Entscheidungsträgern zu helfen, Entscheidungen zu treffen, die besser mit der menschlichen Intuition übereinstimmen, was wirklich „schädlich" ist.

Each language version is independently generated for its own context, not a direct translation.

Technische Zusammenfassung: Quantifizierung von Schaden

Problemstellung
Während Künstliche Intelligenz-Systeme zunehmend kritische Bereiche wie Gesundheitswesen, Einstellungen und autonomes Fahren beeinflussen, bleibt die Definition und Messung von „Schaden" eine erhebliche Herausforderung. Bestehende regulatorische Rahmenwerke, wie der Europäische AI Act, erfordern die Bewertung sowohl der Schwere als auch der Wahrscheinlichkeit von Schaden, doch die philosophische Literatur beschreibt das Schadenskonzept oft als ein „frankensteinisches Durcheinander" widersprüchlicher Darstellungen. Vorarbeiten der Autoren etablierten eine qualitative Definition von Schaden (die Feststellung, ob Schaden eingetreten ist oder nicht) auf Basis kausaler Modelle und eines Standardnutzens. Praktische Anwendungen erfordern jedoch ein quantitatives Schadenskonzept, um Interventionen zu vergleichen, Schaden über Populationen hinweg zu aggregieren und Unsicherheit zu berücksichtigen. Die Arbeit schließt die Lücke zwischen qualitativer Kausalität und den quantitativen Metriken, die für politische Entscheidungsfindung und ethische Entscheidungen erforderlich sind.

Methodik
Die Autoren entwickeln einen quantitativen Rahmen, der auf strukturellen kausalen Modellen und der Halpern-Pearl-Definition tatsächlicher Kausalität basiert. Die Methodik verläuft in mehreren Stufen:

Quantitativer Schaden in einem deterministischen Kontext:
Die Autoren definieren quantitativen Schaden ($QH$) für einen einzelnen Agenten in einem festen Kontext. Er wird berechnet als die Differenz zwischen dem Nutzen des tatsächlichen Ergebnisses und einer Basislinie, begrenzt durch einen „Standardnutzen" ( $d$ ). Spezifisch: Wenn eine Aktion $\vec{X}=\vec{x}$ ein Ergebnis $O=o$ verursacht statt eines kontrastiven Ergebnisses $O=o'$ , beträgt der Schaden $\max(0, \min(d, u(o')) - u(o))$ . Diese Formulierung stellt sicher, dass Schaden nur registriert wird, wenn der tatsächliche Nutzen sowohl niedriger ist als der kontrastive Nutzen als auch als der Standardnutzen.
Umgang mit Unsicherheit (Wahrscheinlichkeitsgewichtung):
Um Unsicherheit bezüglich Kontexte zu adressieren, geht die Arbeit von einfachem erwarteten Schaden zu Gewichtetem Erwartetem Quantitativem Schaden (WEQH) über. In Anerkennung dessen, dass menschliche Entscheidungsfindung oft von der strikten Maximierung des erwarteten Nutzens abweicht (z. B. durch Überbewertung kleiner Wahrscheinlichkeiten oder Unterbewertung basierend auf Erfahrung), integrieren die Autoren eine Wahrscheinlichkeitsgewichtsfunktion $w$ . Der WEQH ist die Summe der gewichteten Wahrscheinlichkeiten von Kontexten multipliziert mit dem quantitativen Schaden in diesen Kontexten. Dies ermöglicht es dem Modell, Phänomene wie die Präferenz zur Vermeidung seltener katastrophaler Ereignisse (Überbewertung) oder das Ignorieren vernachlässigbarer Risiken im täglichen Leben (Unterbewertung) zu erfassen.
Aggregation von gesellschaftlichem Schaden und Fairness:
Die Arbeit kritisiert den „offensichtlichen" Ansatz, individuelle Schäden einfach zu summieren, und stellt fest, dass dieser Fairness und die unverhältnismäßige Auswirkung auf bestimmte Subpopulationen nicht berücksichtigt. Die Autoren schlagen ein Kollektives Nutzenmodell vor, das einen Strafterm ( $\alpha$ ) einführt, wenn eine vordefinierte identifizierbare Gruppe ( $G$ ) einen durchschnittlichen Schaden erleidet, der signifikant höher ( $\beta$ ) ist als der Bevölkerungsdurchschnitt. Dieser Mechanismus ermöglicht es dem Rahmen, Politiken zu bestrafen, die Schaden auf bestimmte Gruppen konzentrieren, selbst wenn der gesamte aggregierte Schaden gering ist.
Asymmetrie zwischen Schaden und Nutzen:
Im Gegensatz zu Standard-Kosten-Nutzen-Analysen, die Nutzen als symmetrisches Gegenteil von Schaden behandeln, schlagen die Autoren ein Standardintervall $D = [d_h, d_b]$ vor. Ergebnisse unterhalb von $d_h$ konstituieren Schaden, Ergebnisse oberhalb von $d_b$ konstituieren Nutzen, und Ergebnisse innerhalb des Intervalls sind neutral. Dies erfasst die Intuition, dass es einen „sicheren" Bereich von Ergebnissen gibt, in dem weder Schaden noch Nutzen entstehen.
Komplexitätsanalyse:
Der Anhang analysiert die rechnerische Komplexität der Feststellung und Berechnung von Schaden. Die Entscheidung, ob Schaden eintritt (qualitativ), erweist sich als DP-vollständig, während die Berechnung des Ausmaßes des quantitativen Schadens $FP^{NP[\log n]}$ -vollständig ist. Die Autoren stellen fest, dass diese Klassen zwar im schlimmsten Fall auf Unlösbarkeit hindeuten, praktische Anwendungen mit kleinen Variablensätzen oder Symmetrieüberlegungen das Problem jedoch lösbar machen können.

Hauptbeiträge und Ergebnisse

Formale Definition: Die Arbeit liefert die erste formale, quantitative Definition von Schaden, die kausale Modelle, Nutzentheorie und eine Standardbasislinie integriert.
Widerlegung einfacher Aggregation: Die Autoren zeigen, dass die Summierung erwarteter Schäden zu kontraintuitiven Ergebnissen führen kann, insbesondere in Bezug auf Fairness und die Verteilung von Risiken. Sie demonstrieren, wie Wahrscheinlichkeitsgewichtung und gruppenbasierte Strafen diese Paradoxien auflösen können (z. B. Norcross' Zyklus des Schadens).
Vergleich mit RBT: Die Arbeit bietet einen detaillierten Vergleich mit dem Ansatz von Richens, Beard und Thompson (RBT). Die Autoren argumentieren, dass RBTs reliance auf „but-for"-Kausalität und eine einzelne Standardaktion (keine Behandlung) zu fehlerhaften Schlussfolgerungen führt, wie etwa der Implikation, dass das Nicht-Behandeln eines Patienten keinen Schaden verursacht. Die Verwendung einer allgemeineren Kausalitätsdefinition und eines flexiblen Standardnutzens durch die Autoren führt zu nuancierteren und medizinisch plausibleren Ergebnissen.
Kontext der Präzisionsmedizin: Der Rahmen wird auf eine aktuelle Debatte in der Präzisionsmedizin angewandt (beteiligt sind Dawid, Senn, Sarvet, Stensrud, Mueller und Pearl). Die Autoren zeigen, dass die Debatten über Behandlungsregeln (z. B. Maximierung des durchschnittlichen Behandlungseffekts vs. Abwägung von Nutzen gegen Schaden) im Wesentlichen Spezialfälle der breiteren Probleme von Standardnutzen und Wahrscheinlichkeitsgewichtung sind, die in ihrem Rahmen behandelt werden.

Bedeutung und Behauptungen
Die Arbeit positioniert sich als grundlegender Schritt hin zu einem formalen Ansatz zur Bestimmung von Schaden in der Praxis, insbesondere für KI-Systeme und öffentliche Politik. Die Autoren behaupten bescheiden, dass diese Arbeit einen „ersten Schritt" darstellt und keine vollständige Lösung ist. Sie betonen, dass:

Die Definition von quantitativem Schaden für einen einzelnen Agenten in einem festen Kontext unkompliziert ist, aber Feinheiten bei Unsicherheit und Aggregation entstehen.
Der vorgeschlagene Ansatz für Fairness (Bestrafung unverhältnismäßigen Schadens) eine Skizze ist, die weiterer empirischer Validierung bedarf, um sicherzustellen, dass sie mit menschlichen Heuristiken übereinstimmt.
Der Umgang mit Wahrscheinlichkeitsgewichtung (Überbewertung vs. Unterbewertung) komplex und kontextabhängig ist und politische Entscheidungsträger dazu zwingt, normative und deskriptive Überlegungen abzuwägen, anstatt eine universelle Gewichtsfunktion anzunehmen.
Der Rahmen Schaden und Schuld integriert und einen Weg zu einer vollständigen Theorie moralischer Verantwortung aufzeigt, obwohl sich die Arbeit primär auf die Mechanik der Quantifizierung von Schaden konzentriert.

Letztlich argumentiert die Arbeit, dass eine rigorose, kausalitätsbasierte quantitative Definition von Schaden entscheidend für den ethischen Einsatz von KI und die Formulierung von Vorschriften wie dem Europäischen AI Act ist, um über das „Durcheinander" qualitativer philosophischer Debatten hinaus zu handlungsleitbaren Metriken zu gelangen.