In questa relazione è stato analizzato il pacchetto GLMNET che viene utilizzato per il calcolo delle funzioni di regressione logistica. Funzione utilizzata nei Genome-Wide Association Studies per l'identificazione del migliore insieme di SNPs che descrivono una malattia. Dopo aver analizzato l'algoritmo è stata adattata la parte di codice presente nel pacchetto GLMNET per risolvere questo problema. Prima di effettuare le ottimizzazioni vere e proprie è stato individuato il valore di alpha migliore per ciascun tipo di diabete confrontando le accuratezze date da ogni modello ottenuto variando alpha sul test set. Il programma è stato infine ottimizzato attraverso la parallelizzazione della k-fold cross-validation per trovare il lambda ottimo riducendone anche il numero di iterazioni, del collo di bottiglia individuato e del blocco di codice che calcola la normalizzazione della matrice X
Ottimizzazione di algoritmi per la regressione logistica nell'ambito di Genome-Wide Association Studies
Compostella, Roberto
2012/2013
Abstract
In questa relazione è stato analizzato il pacchetto GLMNET che viene utilizzato per il calcolo delle funzioni di regressione logistica. Funzione utilizzata nei Genome-Wide Association Studies per l'identificazione del migliore insieme di SNPs che descrivono una malattia. Dopo aver analizzato l'algoritmo è stata adattata la parte di codice presente nel pacchetto GLMNET per risolvere questo problema. Prima di effettuare le ottimizzazioni vere e proprie è stato individuato il valore di alpha migliore per ciascun tipo di diabete confrontando le accuratezze date da ogni modello ottenuto variando alpha sul test set. Il programma è stato infine ottimizzato attraverso la parallelizzazione della k-fold cross-validation per trovare il lambda ottimo riducendone anche il numero di iterazioni, del collo di bottiglia individuato e del blocco di codice che calcola la normalizzazione della matrice XFile | Dimensione | Formato | |
---|---|---|---|
TesiCompostella.pdf
accesso aperto
Dimensione
959.07 kB
Formato
Adobe PDF
|
959.07 kB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/16290