Nell'ambito della classificazione, due metodi tra i più conosciuti sono la Linear Discriminant Analysis (LDA) e una sua generalizzazione, la Quadratic Discriminant Analysis (QDA). In entrambi questi classificatori, le stime impiegate per il vettore delle medie e per la matrice di varianze e covarianze risentono della presenza di valori anomali. Delle criticità emergono anche quando la dimensione dei dati è superiore alla numerosità campionaria o anche semplicemente vi si avvicina. La LDA, ad esempio, non può gestire un numero di variabili pari o superiore a quante sono le osservazioni, infatti la matrice di varianze e covarianze in tal caso risulta non invertibile, dunque non è possibile portare a termine correttamente la classificazione. In questa tesi vengono studiati alcuni stimatori robusti multivariati e il loro impiego nell'analisi discriminante. Inoltre vengono trattati dei metodi che adattano l'analisi discriminante al caso di dimensionalità elevata. Vengono svolti infine due studi di simulazione, uno per ciascuno dei due tipi di estensione.
Stima robusta e metodi per dimensionalità elevata nell'analisi discriminante
MONDIN, MIRKO
2022/2023
Abstract
Nell'ambito della classificazione, due metodi tra i più conosciuti sono la Linear Discriminant Analysis (LDA) e una sua generalizzazione, la Quadratic Discriminant Analysis (QDA). In entrambi questi classificatori, le stime impiegate per il vettore delle medie e per la matrice di varianze e covarianze risentono della presenza di valori anomali. Delle criticità emergono anche quando la dimensione dei dati è superiore alla numerosità campionaria o anche semplicemente vi si avvicina. La LDA, ad esempio, non può gestire un numero di variabili pari o superiore a quante sono le osservazioni, infatti la matrice di varianze e covarianze in tal caso risulta non invertibile, dunque non è possibile portare a termine correttamente la classificazione. In questa tesi vengono studiati alcuni stimatori robusti multivariati e il loro impiego nell'analisi discriminante. Inoltre vengono trattati dei metodi che adattano l'analisi discriminante al caso di dimensionalità elevata. Vengono svolti infine due studi di simulazione, uno per ciascuno dei due tipi di estensione.File | Dimensione | Formato | |
---|---|---|---|
Mondin_Mirko.pdf
accesso riservato
Dimensione
1.39 MB
Formato
Adobe PDF
|
1.39 MB | Adobe PDF |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/49988