A Visualization for Comparative Analysis of Regression Models

Questo articolo introduce un nuovo metodo di visualizzazione per l'analisi comparativa dei modelli di regressione che, rappresentando i residui in uno spazio bidimensionale, utilizzando la distanza di Mahalanobis e una mappa di colori per le percentili, supera i limiti delle metriche aggregate tradizionali offrendo una visione più dettagliata e completa delle prestazioni e delle distribuzioni degli errori.

Nassime Mountasir (ICube), Baptiste Lafabregue (ICube), Bruno Albert (ICube), Nicolas Lachiche (ICube)

Pubblicato 2026-03-23
📖 5 min di lettura🧠 Approfondimento

Each language version is independently generated for its own context, not a direct translation.

Immagina di essere un allenatore di calcio che deve scegliere il miglior portiere per la sua squadra. Hai due candidati, il Portiere A e il Portiere B.

Per decidere, guardi il loro numero di gol subiti (la media).

  • Il Portiere A ha subito 5 gol in tutta la stagione.
  • Il Portiere B ne ha subiti 6.

Secondo i numeri, il Portiere A vince. Ma c'è un problema: i numeri non raccontano tutta la storia.

  • Forse il Portiere A ha fatto 5 parate perfette, ma l'ultima volta ha sbagliato un rigore che ha fatto perdere la partita (un errore "catastrofico").
  • Forse il Portiere B ha sbagliato spesso, ma sempre di poco, facendo parate "brutte ma non disastrose".

Se guardi solo la media (i gol totali), perdi queste informazioni cruciali. È esattamente il problema che affrontano gli autori di questo articolo quando parlano di modelli di regressione (quei programmi di intelligenza artificiale che cercano di prevedere numeri, come il prezzo di una casa o la temperatura di domani).

Ecco come spiegano il loro metodo, usando metafore semplici:

1. Il Problema: I Numeri Ingannano

Di solito, per vedere se un modello è bravo, usiamo metriche come la MAE (errore medio) o la RMSE. Sono come il "punteggio medio" di uno studente.

  • Se uno studente prende sempre 6, la media è 6.
  • Se un altro prende un 10 e uno 2, la media è sempre 6.

Ma nel mondo reale, un errore di 10 (un 10) è molto diverso da un errore di 2 (un 2). A volte, un singolo errore enorme può essere disastroso (pensate a un'auto a guida autonoma che calcola male la distanza e sbatte contro un muro). I numeri medi nascondono questi "mostri" nascosti.

2. La Soluzione: Una Nuova "Lente" Visiva

Gli autori propongono di smettere di guardare solo i numeri e iniziare a guardare le mappe degli errori. Immaginate di non guardare più il punteggio finale, ma di guardare un video di tutte le partite giocate.

Il loro metodo funziona in due passaggi:

Passo 1: Il Filtro (La "Sagoma" dell'errore)

Prima di tutto, usano dei grafici semplici (chiamati boxplot) per scartare i portieri pessimi. È come guardare la distribuzione delle parate:

  • Un modello "bravo" ha errori piccoli e raggruppati tutti insieme (come un gruppo di amici stretti).
  • Un modello "strano" ha errori sparpagliati o con valori estremi (come un gruppo di amici che si sono dispersi in tutta la città).
    Questo aiuta a eliminare subito chi è chiaramente peggio degli altri.

Passo 2: La "Battaglia a Due" (Lo Spazio 2D degli Errori)

Qui arriva la parte creativa. Prendiamo due modelli che sembrano simili (il Portiere A e il Portiere B) e li mettiamo a confronto in una mappa speciale.

  • Immaginate un campo da gioco con due assi: l'asse orizzontale è l'errore del Modello A, quello verticale è l'errore del Modello B.
  • Ogni punto sulla mappa rappresenta un singolo giorno di previsione.
  • Se un punto è vicino al centro, entrambi hanno fatto bene.
  • Se un punto è lontano, uno dei due (o entrambi) ha sbagliato.

Ma come si legge questa mappa?
Invece di usare linee noiose, usano dei colori caldi e freddi (come una mappa termica):

  • Colori caldi (Rosso/Arancione): Indicano dove si trovano la maggior parte dei punti. È la "zona sicura", dove i modelli si comportano normalmente.
  • Colori freddi (Blu): Indicano le zone dove i punti sono rari, spesso dove ci sono errori enormi (i "mostri" di cui parlavamo prima).

Inoltre, dividono la mappa in due zone:

  1. Zona Arancione: Qui il Modello A è migliore del B.
  2. Zona Verde: Qui il Modello B è migliore dell'A.

3. La Magia della "Distanza Intelligente"

C'è un ultimo trucco. Quando misuriamo quanto un punto è lontano dal centro, non usiamo un righello normale (distanza euclidea), ma una distanza "intelligente" (distanza di Mahalanobis).

Facciamo un'analogia:
Immaginate di lanciare palline su un tappeto.

  • Se il tappeto è rotondo, le palline si distribuiscono in cerchio. Un righello normale funziona bene.
  • Ma se il tappeto è allungato (come un uovo o un'ovale), le palline si allineano lungo l'ovale. Se usate un righello normale, pensate che le palline siano tutte ugualmente lontane dal centro. Invece, la "distanza intelligente" capisce che il tappeto è schiacciato e misura la distanza seguendo la forma dell'uovo.

Questo è fondamentale perché gli errori dei modelli spesso non sono casuali: tendono a seguire schemi specifici. Questa "distanza intelligente" ci aiuta a vedere subito se un modello sta facendo errori "strani" o "pericolosi" che un righello normale non vedrebbe.

Perché è importante?

Nel mondo reale, non tutti gli errori sono uguali.

  • Se prevedi il meteo, sbagliare di 2 gradi è fastidioso, ma sbagliare di 20 gradi è inutile.
  • Se prevedi il guasto di un macchinario industriale, dire che si romperà tra 10 giorni quando in realtà si rompe tra 1 giorno (sottostima) è grave, ma dire che si romperà tra 100 giorni quando si rompe tra 10 (sovrastima) può essere catastrofico perché non fai la manutenzione.

I numeri medi (MAE/RMSE) ti dicono solo "quanti errori hai fatto in totale". Il metodo grafico proposto dagli autori ti dice che tipo di errori hai fatto, dove li hai fatti e quanto sono pericolosi.

In sintesi:
Invece di fidarsi ciecamente di un numero medio che nasconde i dettagli, questo metodo ti dà una mappa visiva per vedere esattamente come si comportano i modelli, aiutandoti a scegliere non solo il modello "più preciso in media", ma quello più sicuro e affidabile per il tuo scopo specifico.