Goals have always been considered the central aspect of football, as they determine the final result and thus the judgments of the public and critics. To evaluate the performances of teams and players more objectively, efforts have been made for years to model the probabilities of scoring as accurately as possible, aiming to separate the component of luck from that of merit in each goal scored and missed. The objective of this report is to show how the application of different statistical techniques can provide an analysis of football performance, going beyond the simple result. In particular, the first chapter will introduce the concept of Expected Goals or xG, which is the probability that a single shot will result in a goal. The second chapter will present the dataset used to estimate xG, which includes various explanatory variables of the shots, such as the distance from the goal, the angle of the shot, and the type of action that preceded the shot. Additionally, the three approaches adopted to balance the number of successes and failures in the dataset will be presented here. The third chapter will present various models that can be used to estimate xG and will compare their results on the dataset under examination as the balancing techniques used vary. In the fourth chapter, the xG estimated by the best model presented in the previous chapter will be used to evaluate the goal-scoring opportunities created in a single match and to calculate the Expected Points (xP). The xP estimates will be obtained using the Monte Carlo method.
I gol sono da sempre considerati l'aspetto centrale del gioco del calcio, poiché determinano il risultato finale e quindi i giudizi del pubblico e della critica. Per valutare più oggettivamente le prestazioni delle squadre e dei calciatori, si cerca da anni di modellare nel modo più accurato possibile le probabilità di segnare con ogni singolo tiro, al fine di separare la componente di fortuna da quella di merito in ogni gol realizzato e gol mancato. L'obiettivo di questa relazione è mostrare come l'applicazione di diverse tecniche statistiche possa fornire un'analisi delle prestazioni nel calcio, andando oltre il semplice risultato. In particolare, nel primo capitolo verrà introdotto il concetto di Expected Goals o xG, ossia la probabilità che un singolo tiro risulti in gol. Nel secondo verrà presentato il dataset utilizzato per stimare gli xG, che include diverse variabili esplicative dei tiri, come la distanza dalla porta, l'angolo di tiro e il tipo di azione che ha preceduto il tiro. Inoltre, qui verranno presentati i tre approcci adottati per bilanciare il numero di successi e insuccessi nel dataset. Nel terzo capitolo verranno presentati diversi modelli utilizzabili per stimare gli xG e ne verranno confrontati i risultati sul dataset in esame al variare delle tecniche di bilanciamento utilizzate. Nel quarto, verranno utilizzati gli xG stimati dal migliore dei modelli presentati nel precedente capitolo per valutare le occasioni da gol create in una singola partita e per calcolare gli Expected Points (xP). Le stime degli xP saranno ottenute con il metodo Monte Carlo.
Applicazione di modelli di classificazione per la valutazione delle prestazioni nel calcio: gli Expected Goals e gli Expected Points
VAROTTO, LUCA
2023/2024
Abstract
Goals have always been considered the central aspect of football, as they determine the final result and thus the judgments of the public and critics. To evaluate the performances of teams and players more objectively, efforts have been made for years to model the probabilities of scoring as accurately as possible, aiming to separate the component of luck from that of merit in each goal scored and missed. The objective of this report is to show how the application of different statistical techniques can provide an analysis of football performance, going beyond the simple result. In particular, the first chapter will introduce the concept of Expected Goals or xG, which is the probability that a single shot will result in a goal. The second chapter will present the dataset used to estimate xG, which includes various explanatory variables of the shots, such as the distance from the goal, the angle of the shot, and the type of action that preceded the shot. Additionally, the three approaches adopted to balance the number of successes and failures in the dataset will be presented here. The third chapter will present various models that can be used to estimate xG and will compare their results on the dataset under examination as the balancing techniques used vary. In the fourth chapter, the xG estimated by the best model presented in the previous chapter will be used to evaluate the goal-scoring opportunities created in a single match and to calculate the Expected Points (xP). The xP estimates will be obtained using the Monte Carlo method.File | Dimensione | Formato | |
---|---|---|---|
Varotto_Luca.pdf
accesso aperto
Dimensione
1.01 MB
Formato
Adobe PDF
|
1.01 MB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/71278