From Raw Data to Reliable Predictions: The Significance of Data Processing in COVID-19 Modelling
Questo studio dimostra che l'implementazione di una pipeline di preelaborazione dei dati personalizzata, che include la trasformazione dei totali settimanali in aggiornamenti giornalieri, il rilevamento localizzato degli outlier, la verifica delle dipendenze computazionali e la selezione iterativa delle caratteristiche, migliora significativamente l'accuratezza dei modelli predittivi sulla mortalità da COVID-19 rispetto alle metodologie standard.