Forecast collapse of transformer-based models under squared loss in financial time series

Il paper dimostra che, in contesti finanziari con debole struttura condizionale, l'aumentata espressività dei modelli Transformer sotto perdita quadratica non migliora l'accuratezza predittiva ma genera fluttuazioni spurie e varianza elevata, portando a errori di previsione superiori rispetto a semplici benchmark lineari.

Pierre Andreoletti (IDP)

Pubblicato 2026-04-02
📖 5 min di lettura🧠 Approfondimento

Each language version is independently generated for its own context, not a direct translation.

Il Titolo: Perché i "Super-Cervelli" falliscono quando prevedono il mercato azionario

Immagina di avere un super-cervello artificiale (chiamato Transformer, la stessa tecnologia che fa funzionare ChatGPT) capace di imparare qualsiasi cosa guardando milioni di esempi. Se lo metti a prevedere il traffico, il consumo di energia elettrica o il meteo, è un genio: vede i pattern, le stagioni e i ritmi e fa previsioni incredibili.

Ma se provi a usare questo stesso super-cervello per prevedere il prezzo dell'Euro contro il Dollaro (o azioni, o criptovalute), succede qualcosa di strano: il modello diventa stupido. Invece di fare previsioni complesse, inizia a dire: "Domani il prezzo sarà esattamente uguale a oggi" (per i prezzi) o "Domani il guadagno sarà zero" (per i rendimenti).

Questo paper di Pierre Andreoletti spiega perché questo succede e perché non è colpa del modello, ma della natura stessa del mercato.


1. La Metafora del "Previsionista del Meteo" vs. "Il Lancio della Moneta"

Per capire il problema, dobbiamo distinguere due tipi di mondi:

  • Il Mondo Strutturato (come il Meteo o il Traffico):
    Immagina di prevedere il meteo. Se oggi è una giornata di pioggia torrenziale, è molto probabile che domani piova ancora, o almeno che ci siano nuvole. C'è una logica, una causa ed effetto. Se dai a un'intelligenza artificiale molti dati su come piove, impara a riconoscere i pattern e a fare previsioni utili. Qui, più il modello è potente, meglio è.

  • Il Mondo Finanziario (come il mercato azionario):
    Immagina di dover prevedere il risultato del lancio di una moneta. Se oggi esce "Testa", cosa succederà domani? Non lo sai. Potrebbe essere Testa o Croce. Non c'è una logica che collega il passato al futuro immediato. In finanza, si dice che i prezzi sono un "cammino casuale" (random walk). Il futuro è dominato dal rumore (il caso), non dal segnale (la logica).

2. Il Paradosso: Più sei intelligente, più sbagli

Il paper dice che quando un modello super-potente (come un Transformer) viene addestrato su dati finanziari, cerca disperatamente di trovare un pattern dove non esiste.

Ecco l'analogia del Rumore di Fondo:
Immagina di essere in una stanza piena di persone che urlano a caso (il mercato).

  • Un modello semplice (come una linea retta) ascolta e dice: "Non sento nulla di chiaro, quindi ipotizzo che il rumore rimanga uguale". È noioso, ma è la risposta più sicura.
  • Un modello complesso (il Transformer) è come un orecchio da super-eroe. Cerca di distinguere ogni singola voce, ogni sussurro. Poiché non ci sono voci reali, il modello inizia a inventare pattern nel rumore. Cerca di "imparare" il caso.

Il risultato? Il modello complesso inizia a fare previsioni che oscillano in modo assurdo, cercando di adattarsi al "rumore" dei dati di addestramento. Ma poiché quel rumore è casuale, domani non si ripeterà. Quindi, il modello amplifica l'errore invece di ridurlo.

3. La Soluzione Matematica (spiegata facile)

Il paper dimostra matematicamente due cose:

  1. L'Obiettivo Giusto: Quando si chiede a un'IA di prevedere il futuro con l'errore quadratico (il metodo standard), la risposta "perfetta" è la media condizionale.

    • Se il mercato è strutturato, la media è interessante (es. "domani pioverà").
    • Se il mercato è casuale, la media è banale (es. "domani il prezzo sarà uguale a oggi").
  2. Il Collasso: Quando il modello è troppo potente, invece di fermarsi alla risposta banale e sicura, inizia a "sovrareagire". Prende il rumore casuale dei dati passati e lo usa per creare fluttuazioni finte.

    • È come se un pittore, invece di dipingere un cielo azzurro (la risposta corretta), iniziasse a dipingere nuvole strane basandosi su un granello di polvere sulla tela. Più è bravo il pittore (più è potente il modello), più le nuvole strane saranno dettagliate... e più sbagliate saranno.

4. L'Esperimento Reale

L'autore ha preso dati reali del cambio Euro/Dollaro (ogni 30 secondi) e ha fatto una gara:

  • Sfida 1: Un modello semplice (una linea retta).
  • Sfida 2: Un modello Transformer (PatchTST), molto complesso.

Il Risultato:
Il modello semplice ha vinto quasi sempre. Il modello complesso ha commesso errori molto più grandi nel 92% dei casi.
Non è che il modello complesso fosse "rotto" o mal addestrato. Era troppo bravo nel trovare pattern che non esistevano, trasformando il rumore in errori costosi.

Conclusione: Cosa dobbiamo imparare?

Il messaggio del paper è un monito per chi fa finanza con l'Intelligenza Artificiale:

"Non puoi risolvere un problema di caos con un modello troppo complesso."

Se il mercato è fondamentalmente imprevedibile (come dice la teoria), cercare di costruire un "super-modello" per prevedere il prezzo esatto di domani è inutile. Anzi, più rendi il modello complesso, più lo spingi a inventare cose che non sono vere.

Cosa fare allora?
Invece di cercare di prevedere il prezzo esatto (che è impossibile), dovremmo cambiare strategia:

  • Prevedere la distribuzione delle probabilità (es. "c'è il 60% di probabilità che salga, ma non sappiamo di quanto").
  • Usare modelli che gestiscono l'incertezza, non quelli che cercano di indovinare il numero esatto.

In sintesi: Nel caos finanziario, a volte la risposta più intelligente è ammettere che non si sa nulla, invece di cercare di inventare una storia complessa.