Investigating Disability Representations in Text-to-Image Models

Each language version is independently generated for its own context, not a direct translation.

Immagina che i modelli di intelligenza artificiale che creano immagini (come DALL·E o Stable Diffusion) siano come cuochi molto veloci che cucinano piatti basandosi su ricette scritte (i "prompt" o comandi testuali). Se chiedi al cuoco: "Fammi vedere un'immagine di una persona con una disabilità", cosa ti serve?

Questo studio ha messo alla prova due di questi "cuochi digitali" (uno chiamato Stable Diffusion XL e l'altro DALL·E 3) per vedere come preparano il piatto quando si parla di disabilità.

Ecco cosa hanno scoperto, spiegato con delle metafore:

1. Il "Default" della Sedia a Rotelle (La prima scoperta)

Quando hai chiesto al cuoco di disegnare genericamente "una persona con una disabilità", entrambi i cuochi hanno avuto un pensiero fisso: hanno quasi sempre disegnato una persona su una sedia a rotelle.

L'analogia: È come se chiedessi a un amico: "Disegnami un animale domestico" e lui disegnasse sempre un cane, ignorando completamente gatti, pesci o conigli.
Il risultato: L'IA ha un pregiudizio nascosto. Quando non le dai dettagli specifici, assume che "disabilità" significhi quasi automaticamente "problemi di movimento".
La differenza tra i cuochi: Il cuoco DALL·E 3 era un po' più vario (disegnava anche persone cieche o sorde, anche se meno spesso), mentre Stable Diffusion era ancora più rigido e ripetitivo, disegnando quasi esclusivamente sedie a rotelle.

2. Il "Filtro di Sicurezza" e l'Atmosfera (La seconda scoperta)

I ricercatori hanno poi chiesto ai cuochi di disegnare persone con disturbi mentali (come ansia o depressione) e hanno confrontato le immagini con quelle di persone con disabilità fisiche (come la cecità).

Qui è diventato interessante, perché i due cuochi hanno reagito in modo opposto a seconda di chi li guardava:

Il giudizio della Macchina (L'occhio robotico): Un software automatico ha guardato le immagini e ha detto: "Quello di Stable Diffusion sembra più triste e negativo". Ha guardato i volti e ha visto meno sorrisi.
Il giudizio degli Umani (L'occhio umano): Quando delle persone vere hanno guardato le stesse immagini, hanno detto: "No, aspetta! Quelle di DALL·E 3 sembrano molto più tristi e inquietanti".
Perché?
- Stable Diffusion (il cuoco meno controllato) disegnava persone con disturbi mentali in modo molto "neutro" o grigio, quasi come se non stesse succedendo nulla di speciale.
- DALL·E 3 (il cuoco con più filtri di sicurezza) aveva un approccio diverso: disegnava scene con sfondi scuri, figure isolate e atmosfere cupe.
- La metafora: Immagina di dover disegnare la "tristezza".
  - Il primo cuoco ti dà un foglio bianco (neutro).
  - Il secondo cuoco, che vuole essere sicuro di non offendere nessuno, ti dà un quadro con un cielo tempestoso, pioggia e una persona sola sotto un lampione.
  - La macchina guarda solo il foglio bianco e dice "è più triste". L'umano guarda la tempesta e dice "questa è una tragedia!".

3. Il Paradosso dei Filtri

C'è un paradosso curioso: DALL·E 3, che ha più filtri di sicurezza e cerca di essere più inclusivo, ha finito per creare stereotipi più forti per i disturbi mentali.

Per le disabilità fisiche (come la cecità), DALL·E 3 ha fatto un ottimo lavoro: ha disegnato persone felici, in ambienti luminosi, con cani guida o bastoni bianchi.
Ma per i disturbi mentali, ha esagerato con l'atmosfera "dark". Ha trasformato una condizione medica in un film horror o drammatico, rafforzando lo stereotipo che chi ha problemi mentali sia "pericoloso" o "infelice".

In sintesi: Cosa ci insegna questo studio?

L'IA non è neutra: Non è uno specchio perfetto della realtà. È come un bambino che ha visto troppe volte le stesse cose in TV e ripete sempre le stesse cose. Se non le dici "disegna una persona sorda", lei non lo farà mai.
I filtri non sono magici: Avere più controlli di sicurezza (come fa DALL·E 3) aiuta a evitare contenuti offensivi, ma può creare nuovi stereotipi. A volte, nel tentativo di essere "attenti", l'IA esagera e crea scene troppo drammatiche.
Dobbiamo guardare oltre: Non basta affidarsi a un computer per giudicare se un'immagine è giusta o sbagliata. A volte la macchina vede solo i dettagli tecnici, mentre gli umani percepiscono l'atmosfera e il messaggio emotivo.

Il messaggio finale: Per rendere l'Intelligenza Artificiale davvero inclusiva, non basta "aggiustare" il codice. Dobbiamo insegnarle a vedere la diversità della disabilità come un mondo vasto e colorato, non come un unico colore grigio (la sedia a rotelle) o come un film drammatico (i disturbi mentali). E soprattutto, dobbiamo ascoltare le persone con disabilità per capire come vogliono essere rappresentate.

Each language version is independently generated for its own context, not a direct translation.

Titolo: Investigazione delle rappresentazioni della disabilità nei modelli Text-to-Image

1. Problema e Contesto

I modelli generativi Text-to-Image (T2I), come Stable Diffusion e DALL·E, hanno raggiunto livelli eccezionali nella creazione di immagini fotorealistiche. Tuttavia, questi modelli, addestrati su enormi dataset web (es. LAION), ereditano e riproducono i bias sociali presenti nei dati di origine. Mentre le rappresentazioni di genere, razza ed etnia sono state ampiamente studiate, le rappresentazioni delle persone con disabilità (PwD) rimangono un'area sottoposta a indagine.
Il problema centrale è che le T2I tendono a perpetuare stereotipi dannosi (es. la visione "calda ma incompetente" delle persone con disabilità) e a ridurre l'esperienza della disabilità a categorie visive dominanti (come l'uso della sedia a rotelle), ignorando la diversità delle condizioni (es. sordità, cecità, disturbi mentali). Inoltre, è poco chiaro come le diverse strategie di mitigazione implementate dai sviluppatori (es. filtri di sicurezza, re-weighting dei dati) influenzino queste rappresentazioni.

2. Metodologia

Lo studio adotta un disegno sperimentale in due fasi per analizzare due modelli all'avanguardia: Stable Diffusion XL (SDXL) e DALL·E 3.

Esperimento 1: Differenze di Rappresentazione (Generico vs. Specifico)

Obiettivo: Determinare se i modelli tendono a sovrarappresentare una specifica categoria di disabilità quando viene fornito un prompt generico.
Prompt:
- Generico: "Foto di una persona con disabilità" (senza ulteriori specifiche).
- Specifici: "Foto di una persona con disabilità motoria", "Foto di una persona cieca", "Foto di una persona sorda".
Dati: 100 immagini generate per ogni prompt da entrambi i modelli (totale 800 immagini).
Metrica: Calcolo della similarità coseno tra gli embedding CLIP delle immagini generate dal prompt generico e quelle dei prompt specifici.
- Una similarità più alta indica che la categoria specifica è più vicina alla rappresentazione "di default" del modello.
- È stato calcolato un punteggio di similarità relativa ( $\Delta$ ) per valutare lo sbilanciamento rispetto alle altre categorie.

Esperimento 2: Impatto delle Strategie di Mitigazione (Analisi del Sentimento)

Obiettivo: Valutare come le diverse strategie di mitigazione (SDXL ha filtri più laschi, DALL·E 3 ha filtri rigorosi e classifiche di prompt) influenzano il quadro affettivo (sentiment) delle immagini.
Focus: Confronto tra disturbi mentali (bipolarismo, depressione, ansia) e disabilità fisiche/sensoriali.
Metodi di Valutazione:
1. Valutazione Automatica: Utilizzo di un sistema BLIP VQA per generare descrizioni testuali delle immagini (atmosfera, umore, emozioni), seguite da un classificatore di sentiment (RoBERTa) per assegnare etichette (positivo, neutro, negativo).
2. Valutazione Umana: Tre valutatori hanno confrontato coppie di immagini (modello vs modello e disturbo mentale vs fisico) per giudicare quale trasmettesse un'emozione più negativa, fornendo anche un punteggio di fiducia (1-5).

3. Risultati Chiave

Esperimento 1: Bias verso la Disabilità Motoria

Default alla mobilità: Entrambi i modelli, quando richiesti di generare "una persona con disabilità", hanno prodotto immagini prevalentemente di persone con disabilità motoria (spesso in sedia a rotelle).
Squilibrio: La similarità tra il prompt generico e la disabilità motoria è stata significativamente più alta rispetto a cecità e sordità.
Confronto Modelli:
- SDXL: Ha mostrato una forte inclinazione verso la disabilità motoria, con una similarità media più alta (0.901) rispetto a DALL·E 3, indicando una rappresentazione più omogenea e stereotipata.
- DALL·E 3: Ha mostrato una distribuzione leggermente più bilanciata tra le categorie sensoriali, ma con una maggiore variabilità nelle uscite. Tuttavia, anche DALL·E 3 ha sottorappresentato cecità e sordità rispetto alla mobilità.

Esperimento 2: Framing Affettivo e Disturbi Mentali

Divario tra Analisi Automatica e Umana:
- L'analisi automatica (BLIP) ha suggerito che SDXL produceva rappresentazioni più negative (basandosi su parole chiave come "tristezza" o "rabbia").
- I valutatori umani, invece, hanno giudicato le immagini di DALL·E 3 come significativamente più negative.
- Spiegazione: I valutatori umani hanno percepito elementi contestuali (sfondi scuri, figure isolate, posture chiuse) che il modello BLIP, focalizzato su descrittori testuali diretti, ha ignorato o classificato come neutri.
Disparità Mentale vs. Fisica:
- Entrambi i modelli hanno rappresentato i disturbi mentali in modo molto più negativo rispetto alle disabilità fisiche/sensoriali.
- Le immagini di disabilità fisiche tendevano a mostrare persone sorridenti in ambienti luminosi.
- Le immagini di disturbi mentali erano spesso ambientate in interni bui o con atmosfere opprimenti.
- Paradosso della Mitigazione: DALL·E 3, pur avendo strategie di mitigazione più forti per diversificare le rappresentazioni, ha involontariamente amplificato gli stereotipi negativi per i disturbi mentali, creando un divario affettivo ancora più marcato rispetto a SDXL.

4. Contributi Principali

Quantificazione del Bias di Default: Dimostrazione empirica che i prompt generici sulle disabilità nei modelli T2I si riducono quasi esclusivamente alla disabilità motoria, marginalizzando altre forme di disabilità.
Analisi Comparativa delle Mitigazioni: Evidenzia che strategie di mitigazione più rigorose (come quelle di DALL·E 3) non eliminano necessariamente gli stereotipi, ma possono reconfigurarli, talvolta esacerbando la negatività in categorie specifiche (disturbi mentali) pur migliorando la diversità in altre.
Limiti dell'Analisi Automatica: Sottolinea la discrepanza tra l'analisi automatica del sentiment (che si basa su descrittori testuali) e la percezione umana (che integra contesto, atmosfera e linguaggio del corpo), suggerendo che l'analisi automatica da sola è insufficiente per valutare l'impatto sociale delle immagini generate.
Quadro Teorico: Collega i risultati al concetto di "techno-ableism", mostrando come l'IA possa rafforzare la visione della disabilità come problema da correggere o gestire, piuttosto che come parte della diversità umana.

5. Significato e Implicazioni

Lo studio rivela che i modelli generativi non sono neutrali, ma codificano bias sociali complessi che variano a seconda della categoria di disabilità e delle strategie di mitigazione adottate.

Per i Ricercatori: È necessario un approccio misto (automatico + umano) per valutare l'equità nell'IA, poiché l'automazione può perdere sfumature contestuali cruciali.
Per gli Sviluppatori: Le attuali strategie di mitigazione devono essere riviste per evitare di creare nuovi squilibri o di rafforzare stereotipi negativi su specifiche categorie (come i disturbi mentali).
Per la Società: La rappresentazione visiva dell'IA influenza la percezione pubblica; una rappresentazione sbilanciata o negativa contribuisce all'esclusione sociale delle persone con disabilità.

Il paper conclude che è urgente un'evoluzione verso sistemi che non solo diversifichino le categorie rappresentate, ma che affrontino anche il quadro affettivo e contestuale, coinvolgendo attivamente le comunità con disabilità nella fase di valutazione e sviluppo.