Un importante obiettivo della statistica è quello di ricavare previsioni in base all'informazione storica disponibile; si vuole comprendere come il passato possa influenzare il futuro, al fine di prendere decisioni ragionevoli in svariati ambiti, quali: l'economia, la finanza, il controllo di produzione industriale o la demografia. In questo contesto, risulta molto importante l'analisi delle serie storiche, successioni ordinate di osservazioni associate ad un istante o intervallo temporale. L'obiettivo, è quello di identificare ed estrapolare andamenti o peculiarità dai dati passati per specificare accurati modelli che possano riassumere ed esprimere le relazioni tra le osservazioni. A tal fine, si ricorre a modelli sviluppati appositamente per questo tipo di analisi, come, ad esempio, i modelli ARIMA (Autoregressive Integrated Moving Average) introdotti da Box e Jenkins nel 1976. Con l'attuale disponibilità di grandi moli di dati, tuttavia, si è pensato di adattare alcuni dei più noti metodi di machine learning, i quali, apprendono dai dati e migliorano la propria accuratezza in modo automatico; nonostante quest'ultimi non siano stati sviluppati con il fine di analizzare serie storiche, sotto particolari condizioni, risultano molto funzionali e appropriati. In questo lavoro si analizzano i più importanti algoritmi di apprendimento automatico e il relativo adattamento delle procedure di previsione per serie storiche, le quali, richiedono una particolare configurazione dei dati disponibili. Si conduce, inoltre, un'applicazione empirica volta a descrivere le potenzialità di "forecastML", pacchetto R sviluppato da Redell (2020), ispirato all'articolo di Bergmeir, Hyndman e Koo (2018) che, sotto particolari condizioni, sostiene di poter fare previsioni a più passi, con modelli di machine learning per dati multidimensionali, senza l'utilizzo dei metodi specifici per serie storiche. "ForecastML" infatti, contiene una serie di funzioni volte a semplificare l'adattamento di qualsiasi metodo di machine learning presente sul software, e a rendere immediata la valutazione dell'accuratezza delle previsioni. Infine, offre l'opportunità di combinare le previsioni di differenti modelli su diversi orizzonti di previsione per ottenere un risultato più performante.
Machine learning e previsione di serie storiche: le potenzialità di "forecastML"
ROTOLO, LETIZIA
2021/2022
Abstract
Un importante obiettivo della statistica è quello di ricavare previsioni in base all'informazione storica disponibile; si vuole comprendere come il passato possa influenzare il futuro, al fine di prendere decisioni ragionevoli in svariati ambiti, quali: l'economia, la finanza, il controllo di produzione industriale o la demografia. In questo contesto, risulta molto importante l'analisi delle serie storiche, successioni ordinate di osservazioni associate ad un istante o intervallo temporale. L'obiettivo, è quello di identificare ed estrapolare andamenti o peculiarità dai dati passati per specificare accurati modelli che possano riassumere ed esprimere le relazioni tra le osservazioni. A tal fine, si ricorre a modelli sviluppati appositamente per questo tipo di analisi, come, ad esempio, i modelli ARIMA (Autoregressive Integrated Moving Average) introdotti da Box e Jenkins nel 1976. Con l'attuale disponibilità di grandi moli di dati, tuttavia, si è pensato di adattare alcuni dei più noti metodi di machine learning, i quali, apprendono dai dati e migliorano la propria accuratezza in modo automatico; nonostante quest'ultimi non siano stati sviluppati con il fine di analizzare serie storiche, sotto particolari condizioni, risultano molto funzionali e appropriati. In questo lavoro si analizzano i più importanti algoritmi di apprendimento automatico e il relativo adattamento delle procedure di previsione per serie storiche, le quali, richiedono una particolare configurazione dei dati disponibili. Si conduce, inoltre, un'applicazione empirica volta a descrivere le potenzialità di "forecastML", pacchetto R sviluppato da Redell (2020), ispirato all'articolo di Bergmeir, Hyndman e Koo (2018) che, sotto particolari condizioni, sostiene di poter fare previsioni a più passi, con modelli di machine learning per dati multidimensionali, senza l'utilizzo dei metodi specifici per serie storiche. "ForecastML" infatti, contiene una serie di funzioni volte a semplificare l'adattamento di qualsiasi metodo di machine learning presente sul software, e a rendere immediata la valutazione dell'accuratezza delle previsioni. Infine, offre l'opportunità di combinare le previsioni di differenti modelli su diversi orizzonti di previsione per ottenere un risultato più performante.File | Dimensione | Formato | |
---|---|---|---|
Rotolo_Letizia.pdf
accesso riservato
Dimensione
925.55 kB
Formato
Adobe PDF
|
925.55 kB | Adobe PDF |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/11343