L'applicazione della statistica nel mondo del calcio sta prendendo sempre più piede, ma a differenza di altri sport risulta molto più difficile attribuire una correlazione evidente tra prestazione e risultato essendo uno sport "a punteggio basso". L'analisi presentata in questo lavoro mira quindi a comprendere quali siano gli aspetti che influenzano maggiormente l'esito di una gara. Inizialmente si conduce un'analisi esplorativa completa, andando a comprendere quali aspetti del gioco possano essere più interessanti da analizzare a fini statistici. Si modella la probabilità di vittoria di una squadra usando un modello Bradley-Terry che include, come variabili esplicative, alcuni dei principali eventi che accadono durante le partite. Sempre in questa prima parte dell'elaborato si stima inoltre un coefficiente di "abilità" diverso per ogni squadra, al netto dell'effetto delle covariate. Nel prosieguo del lavoro si pone l'attenzione nel cogliere la componente temporale per quanto riguarda l'abilità delle squadre nel corso del campionato. In particolare si è scelto di utilizzare un processo EWMA per modellare l'andamento delle abilità delle squadre nell'arco della stagione, permettendo così di comprendere anche l'effetto dovuto allo stato di forma. L'obiettivo della parte successiva invece è quello di ridurre il numero di covariate, tenendo nel modello solamente le variabili esplicative che maggiormente influenzano l'esito delle partite, tramite l'utilizzo del Lasso. L'applicazione di questa tecnica inoltre permette anche di creare clusters di squadre che si comportano allo stesso modo rispetto ad una o più variabili. Infine viene quindi stimato il modello Bradley-Terry che utilizza un processo temporale e la penalizzazione di tipo Lasso, unendo quindi le analisi svolte nei capitoli precedenti.

Il modello Bradley-Terry dinamico penalizzato per l'analisi di risultati calcistici

CASAGRANDE, MATTEO
2021/2022

Abstract

L'applicazione della statistica nel mondo del calcio sta prendendo sempre più piede, ma a differenza di altri sport risulta molto più difficile attribuire una correlazione evidente tra prestazione e risultato essendo uno sport "a punteggio basso". L'analisi presentata in questo lavoro mira quindi a comprendere quali siano gli aspetti che influenzano maggiormente l'esito di una gara. Inizialmente si conduce un'analisi esplorativa completa, andando a comprendere quali aspetti del gioco possano essere più interessanti da analizzare a fini statistici. Si modella la probabilità di vittoria di una squadra usando un modello Bradley-Terry che include, come variabili esplicative, alcuni dei principali eventi che accadono durante le partite. Sempre in questa prima parte dell'elaborato si stima inoltre un coefficiente di "abilità" diverso per ogni squadra, al netto dell'effetto delle covariate. Nel prosieguo del lavoro si pone l'attenzione nel cogliere la componente temporale per quanto riguarda l'abilità delle squadre nel corso del campionato. In particolare si è scelto di utilizzare un processo EWMA per modellare l'andamento delle abilità delle squadre nell'arco della stagione, permettendo così di comprendere anche l'effetto dovuto allo stato di forma. L'obiettivo della parte successiva invece è quello di ridurre il numero di covariate, tenendo nel modello solamente le variabili esplicative che maggiormente influenzano l'esito delle partite, tramite l'utilizzo del Lasso. L'applicazione di questa tecnica inoltre permette anche di creare clusters di squadre che si comportano allo stesso modo rispetto ad una o più variabili. Infine viene quindi stimato il modello Bradley-Terry che utilizza un processo temporale e la penalizzazione di tipo Lasso, unendo quindi le analisi svolte nei capitoli precedenti.
2021
Dynamic penalized Bradley-Terry model for the analysis of football results
Bradley-Terry
processo EWMA
Lasso
File in questo prodotto:
File Dimensione Formato  
Casagrande_Matteo.pdf

accesso aperto

Dimensione 998.9 kB
Formato Adobe PDF
998.9 kB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/35384