Nell'ambito della classificazione, due metodi tra i più conosciuti sono la Linear Discriminant Analysis (LDA) e una sua generalizzazione, la Quadratic Discriminant Analysis (QDA). In entrambi questi classificatori, le stime impiegate per il vettore delle medie e per la matrice di varianze e covarianze risentono della presenza di valori anomali. Delle criticità emergono anche quando la dimensione dei dati è superiore alla numerosità campionaria o anche semplicemente vi si avvicina. La LDA, ad esempio, non può gestire un numero di variabili pari o superiore a quante sono le osservazioni, infatti la matrice di varianze e covarianze in tal caso risulta non invertibile, dunque non è possibile portare a termine correttamente la classificazione. In questa tesi vengono studiati alcuni stimatori robusti multivariati e il loro impiego nell'analisi discriminante. Inoltre vengono trattati dei metodi che adattano l'analisi discriminante al caso di dimensionalità elevata. Vengono svolti infine due studi di simulazione, uno per ciascuno dei due tipi di estensione.

Stima robusta e metodi per dimensionalità elevata nell'analisi discriminante

MONDIN, MIRKO
2022/2023

Abstract

Nell'ambito della classificazione, due metodi tra i più conosciuti sono la Linear Discriminant Analysis (LDA) e una sua generalizzazione, la Quadratic Discriminant Analysis (QDA). In entrambi questi classificatori, le stime impiegate per il vettore delle medie e per la matrice di varianze e covarianze risentono della presenza di valori anomali. Delle criticità emergono anche quando la dimensione dei dati è superiore alla numerosità campionaria o anche semplicemente vi si avvicina. La LDA, ad esempio, non può gestire un numero di variabili pari o superiore a quante sono le osservazioni, infatti la matrice di varianze e covarianze in tal caso risulta non invertibile, dunque non è possibile portare a termine correttamente la classificazione. In questa tesi vengono studiati alcuni stimatori robusti multivariati e il loro impiego nell'analisi discriminante. Inoltre vengono trattati dei metodi che adattano l'analisi discriminante al caso di dimensionalità elevata. Vengono svolti infine due studi di simulazione, uno per ciascuno dei due tipi di estensione.
2022
Robust estimation and high dimensional methods for discriminant analysis
classificazione
robustezza
alta dimensionalità
File in questo prodotto:
File Dimensione Formato  
Mondin_Mirko.pdf

accesso riservato

Dimensione 1.39 MB
Formato Adobe PDF
1.39 MB Adobe PDF

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/49988