Using ChatGPT for Data Science Analyses

Questo articolo valuta il potenziale di ChatGPT come co-pilota nei flussi di lavoro di data science, esaminando le sue capacità nell'esplorazione dei dati, nella visualizzazione e nelle attività di modellazione supervisionata e non supervisionata, pur sottolineando la necessità di considerare attentamente i suoi limiti nell'analisi empirica.

Ozan Evkaya, Miguel de Carvalho

Pubblicato 2026-03-03
📖 4 min di lettura☕ Lettura da pausa caffè

Each language version is independently generated for its own context, not a direct translation.

Immagina di avere un assistente personale super intelligente, capace di leggere, capire e analizzare enormi quantità di dati in pochi secondi, ma che a volte ha bisogno di una guida esperta per non fare confusione. Questo è il cuore del paper "USING CHATGPT PER LE ANALISI DI DATA SCIENCE" scritto da Ozan Evkaya e Miguel de Carvalho dell'Università di Edimburgo.

Ecco una spiegazione semplice, con qualche metafora per rendere tutto più chiaro.

1. Il Contesto: Dalle Macchine Calcolatrici all'Intelligenza Artificiale

Fino a poco tempo fa, per analizzare i dati (come il censimento della popolazione negli anni '80), servivano macchine enormi e anni di lavoro. Oggi, con l'Intelligenza Artificiale (AI), abbiamo fatto un salto di qualità. Gli autori hanno testato un nuovo "superpotere" di ChatGPT chiamato Data Analysis (DA).

Pensa a questo strumento come a un co-pilota per un aereo. Tu sei il capitano (l'analista umano), e ChatGPT è il primo ufficiale che ti aiuta a leggere le mappe, controllare il carburante e suggerire rotte. Ma ricorda: il capitano deve sempre tenere le mani sul timone. Non puoi lasciare che l'aereo voli da solo senza supervisione, perché l'AI può commettere errori o "allucinazioni" (inventare cose).

2. Cosa hanno fatto? (Il Test sul Campo)

Gli autori hanno messo alla prova questo co-pilota con due scenari reali, come se fossero due viaggi diversi:

  • Viaggio 1: Esplorare un nuovo territorio (Analisi Esplorativa)
    Hanno usato un elenco di prezzi di laptop.

    • Cosa ha fatto bene: ChatGPT è stato bravissimo a "fare i compiti a casa". Ha caricato i dati, ha fatto grafici a barre, ha calcolato medie e ha risposto a domande semplici come "Quali sono i brand più comuni?". È stato veloce e preciso nel creare visualizzazioni colorate.
    • Dove ha inciampato: A volte ha letto male i grafici. Per esempio, ha detto che i prezzi erano su una scala "logaritmica" (una scala matematica complessa) quando invece erano normali. È come se un navigatore GPS ti dicesse che sei in montagna quando sei in pianura. Inoltre, quando ha creato grafici complessi (come i "mosaici" per confrontare categorie), i colori e le etichette erano spesso disordinati e difficili da leggere.
  • Viaggio 2: Prevedere il futuro (Modelli Supervisionati)
    Hanno usato dati sulle case di una foresta (Duke Forest) per prevedere i prezzi.

    • Cosa ha fatto bene: Ha suggerito ottimi punti di partenza. Ha detto: "Proviamo una regressione lineare" (una linea retta che collega le variabili) o "Proviamo alberi decisionali". Ha anche creato i grafici giusti per controllare se il modello funzionava.
    • Dove ha inciampato:
      • Il problema della "Causa ed Effetto": A volte ha confuso la correlazione (due cose che vanno insieme) con la causalità (una cosa che causa l'altra).
      • Il problema dei "Numeri Negativi": In un modello per prevedere i prezzi delle case, il modello ha suggerito che una casa potesse costare meno di zero (un prezzo negativo!). È un errore matematico che un umano esperto avrebbe subito notato.
      • Modelli troppo complessi: Ha provato a usare reti neurali (cervelli artificiali molto complessi) su un dataset troppo piccolo, come se cercassi di insegnare a un bambino a fare il calcolo integrale con solo 5 minuti di lezione. Non è stato possibile eseguirlo direttamente, ma ChatGPT ha dato il codice per farlo altrove.

3. Il Verdetto: Un Assistente, non un Sostituto

La conclusione degli autori è chiara e importante:

  • È un ottimo "Co-pilota": Se sei un principiante o hai fretta, ChatGPT può farti risparmiare ore di lavoro. Può scrivere il codice, fare grafici e suggerire quali domande fare.
  • Non è un "Pilota Automatico": Non puoi fidarti ciecamente di tutto ciò che dice. Se non hai una conoscenza di base, potresti accettare conclusioni sbagliate.
  • Il fattore umano è cruciale: L'AI è come un motore potente, ma serve un meccanico esperto (l'analista umano) per assicurarsi che il motore non si surriscaldi e che la direzione sia quella giusta.

In sintesi

Immagina il Data Science come la costruzione di una casa.
ChatGPT con il plugin Data Analysis è un bravissimo muratore e architetto junior. Può portare i mattoni, misurare le pareti e disegnare i piani molto velocemente. Tuttavia, se non c'è un capocantiere esperto che controlla i calcoli, verifica che le fondamenta siano solide e corregge gli errori di prospettiva, la casa potrebbe crollare o essere costruita male.

Il futuro della Data Science non è sostituire gli umani con l'AI, ma unire le forze: l'intelligenza artificiale per la velocità e l'automazione, e l'intelligenza umana per la critica, la supervisione e la saggezza.