L'applicazione della statistica nel mondo del calcio sta prendendo sempre più piede, ma a differenza di altri sport risulta molto più difficile attribuire una correlazione evidente tra prestazione e risultato essendo uno sport "a punteggio basso". L'analisi presentata in questo lavoro mira quindi a comprendere quali siano gli aspetti che influenzano maggiormente l'esito di una gara. Inizialmente si conduce un'analisi esplorativa completa, andando a comprendere quali aspetti del gioco possano essere più interessanti da analizzare a fini statistici. Si modella la probabilità di vittoria di una squadra usando un modello Bradley-Terry che include, come variabili esplicative, alcuni dei principali eventi che accadono durante le partite. Sempre in questa prima parte dell'elaborato si stima inoltre un coefficiente di "abilità" diverso per ogni squadra, al netto dell'effetto delle covariate. Nel prosieguo del lavoro si pone l'attenzione nel cogliere la componente temporale per quanto riguarda l'abilità delle squadre nel corso del campionato. In particolare si è scelto di utilizzare un processo EWMA per modellare l'andamento delle abilità delle squadre nell'arco della stagione, permettendo così di comprendere anche l'effetto dovuto allo stato di forma. L'obiettivo della parte successiva invece è quello di ridurre il numero di covariate, tenendo nel modello solamente le variabili esplicative che maggiormente influenzano l'esito delle partite, tramite l'utilizzo del Lasso. L'applicazione di questa tecnica inoltre permette anche di creare clusters di squadre che si comportano allo stesso modo rispetto ad una o più variabili. Infine viene quindi stimato il modello Bradley-Terry che utilizza un processo temporale e la penalizzazione di tipo Lasso, unendo quindi le analisi svolte nei capitoli precedenti.
Il modello Bradley-Terry dinamico penalizzato per l'analisi di risultati calcistici
CASAGRANDE, MATTEO
2021/2022
Abstract
L'applicazione della statistica nel mondo del calcio sta prendendo sempre più piede, ma a differenza di altri sport risulta molto più difficile attribuire una correlazione evidente tra prestazione e risultato essendo uno sport "a punteggio basso". L'analisi presentata in questo lavoro mira quindi a comprendere quali siano gli aspetti che influenzano maggiormente l'esito di una gara. Inizialmente si conduce un'analisi esplorativa completa, andando a comprendere quali aspetti del gioco possano essere più interessanti da analizzare a fini statistici. Si modella la probabilità di vittoria di una squadra usando un modello Bradley-Terry che include, come variabili esplicative, alcuni dei principali eventi che accadono durante le partite. Sempre in questa prima parte dell'elaborato si stima inoltre un coefficiente di "abilità" diverso per ogni squadra, al netto dell'effetto delle covariate. Nel prosieguo del lavoro si pone l'attenzione nel cogliere la componente temporale per quanto riguarda l'abilità delle squadre nel corso del campionato. In particolare si è scelto di utilizzare un processo EWMA per modellare l'andamento delle abilità delle squadre nell'arco della stagione, permettendo così di comprendere anche l'effetto dovuto allo stato di forma. L'obiettivo della parte successiva invece è quello di ridurre il numero di covariate, tenendo nel modello solamente le variabili esplicative che maggiormente influenzano l'esito delle partite, tramite l'utilizzo del Lasso. L'applicazione di questa tecnica inoltre permette anche di creare clusters di squadre che si comportano allo stesso modo rispetto ad una o più variabili. Infine viene quindi stimato il modello Bradley-Terry che utilizza un processo temporale e la penalizzazione di tipo Lasso, unendo quindi le analisi svolte nei capitoli precedenti.File | Dimensione | Formato | |
---|---|---|---|
Casagrande_Matteo.pdf
accesso aperto
Dimensione
998.9 kB
Formato
Adobe PDF
|
998.9 kB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/35384