Un importante obiettivo della statistica è quello di ricavare previsioni in base all'informazione storica disponibile; si vuole comprendere come il passato possa influenzare il futuro, al fine di prendere decisioni ragionevoli in svariati ambiti, quali: l'economia, la finanza, il controllo di produzione industriale o la demografia. In questo contesto, risulta molto importante l'analisi delle serie storiche, successioni ordinate di osservazioni associate ad un istante o intervallo temporale. L'obiettivo, è quello di identificare ed estrapolare andamenti o peculiarità dai dati passati per specificare accurati modelli che possano riassumere ed esprimere le relazioni tra le osservazioni. A tal fine, si ricorre a modelli sviluppati appositamente per questo tipo di analisi, come, ad esempio, i modelli ARIMA (Autoregressive Integrated Moving Average) introdotti da Box e Jenkins nel 1976. Con l'attuale disponibilità di grandi moli di dati, tuttavia, si è pensato di adattare alcuni dei più noti metodi di machine learning, i quali, apprendono dai dati e migliorano la propria accuratezza in modo automatico; nonostante quest'ultimi non siano stati sviluppati con il fine di analizzare serie storiche, sotto particolari condizioni, risultano molto funzionali e appropriati. In questo lavoro si analizzano i più importanti algoritmi di apprendimento automatico e il relativo adattamento delle procedure di previsione per serie storiche, le quali, richiedono una particolare configurazione dei dati disponibili. Si conduce, inoltre, un'applicazione empirica volta a descrivere le potenzialità di "forecastML", pacchetto R sviluppato da Redell (2020), ispirato all'articolo di Bergmeir, Hyndman e Koo (2018) che, sotto particolari condizioni, sostiene di poter fare previsioni a più passi, con modelli di machine learning per dati multidimensionali, senza l'utilizzo dei metodi specifici per serie storiche. "ForecastML" infatti, contiene una serie di funzioni volte a semplificare l'adattamento di qualsiasi metodo di machine learning presente sul software, e a rendere immediata la valutazione dell'accuratezza delle previsioni. Infine, offre l'opportunità di combinare le previsioni di differenti modelli su diversi orizzonti di previsione per ottenere un risultato più performante.

Machine learning e previsione di serie storiche: le potenzialità di "forecastML"

ROTOLO, LETIZIA
2021/2022

Abstract

Un importante obiettivo della statistica è quello di ricavare previsioni in base all'informazione storica disponibile; si vuole comprendere come il passato possa influenzare il futuro, al fine di prendere decisioni ragionevoli in svariati ambiti, quali: l'economia, la finanza, il controllo di produzione industriale o la demografia. In questo contesto, risulta molto importante l'analisi delle serie storiche, successioni ordinate di osservazioni associate ad un istante o intervallo temporale. L'obiettivo, è quello di identificare ed estrapolare andamenti o peculiarità dai dati passati per specificare accurati modelli che possano riassumere ed esprimere le relazioni tra le osservazioni. A tal fine, si ricorre a modelli sviluppati appositamente per questo tipo di analisi, come, ad esempio, i modelli ARIMA (Autoregressive Integrated Moving Average) introdotti da Box e Jenkins nel 1976. Con l'attuale disponibilità di grandi moli di dati, tuttavia, si è pensato di adattare alcuni dei più noti metodi di machine learning, i quali, apprendono dai dati e migliorano la propria accuratezza in modo automatico; nonostante quest'ultimi non siano stati sviluppati con il fine di analizzare serie storiche, sotto particolari condizioni, risultano molto funzionali e appropriati. In questo lavoro si analizzano i più importanti algoritmi di apprendimento automatico e il relativo adattamento delle procedure di previsione per serie storiche, le quali, richiedono una particolare configurazione dei dati disponibili. Si conduce, inoltre, un'applicazione empirica volta a descrivere le potenzialità di "forecastML", pacchetto R sviluppato da Redell (2020), ispirato all'articolo di Bergmeir, Hyndman e Koo (2018) che, sotto particolari condizioni, sostiene di poter fare previsioni a più passi, con modelli di machine learning per dati multidimensionali, senza l'utilizzo dei metodi specifici per serie storiche. "ForecastML" infatti, contiene una serie di funzioni volte a semplificare l'adattamento di qualsiasi metodo di machine learning presente sul software, e a rendere immediata la valutazione dell'accuratezza delle previsioni. Infine, offre l'opportunità di combinare le previsioni di differenti modelli su diversi orizzonti di previsione per ottenere un risultato più performante.
2021
Machine learning for time series forecasting: "forecastML" potentialities
Previsione
Serie storiche
Machine learning
forecastML
File in questo prodotto:
File Dimensione Formato  
Rotolo_Letizia.pdf

accesso riservato

Dimensione 925.55 kB
Formato Adobe PDF
925.55 kB Adobe PDF

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/11343