La stima della struttura di un grafo è una questione di grande interesse in ambito genomico, in quanto funzionale a fornire indicazioni sulle relazioni tra gruppi di geni. Un algoritmo che ha dimostrato un ottimo funzionamento in diverse casistiche è l’algoritmo PC, che stima la presenza/assenza di un arco tra due geni attraverso un percorso di molteplici regressioni condizionate; questo meccanismo, tuttavia, può risultare computazionalmente oneroso quando il numero di osservazioni e di geni aumenta. Un’alternativa più rapida è la selezione del vicinato (neighborhood selection) tramite lasso, che prevede, appunto, di effettuare, per ciascun gene, un’unica regressione con penalizzazione di tipo lasso e procedere all’inserimento di un arco tra il gene considerato e tutti quei geni i cui coefficienti stimati risultano diversi da 0. Lo scopo di questa tesi è quello di confrontare le prestazioni tra gli algoritmi presentati; viene, inoltre, proposta una modifica dell’algoritmo PC, il cui obiettivo è quello di ridurre i tempi necessari al suo utilizzo replicando i risultati della procedura originale.
Selezione degli archi tramite regressione Lasso per modelli grafici: un confronto con l'algoritmo PC
BERTI, MIRKO
2022/2023
Abstract
La stima della struttura di un grafo è una questione di grande interesse in ambito genomico, in quanto funzionale a fornire indicazioni sulle relazioni tra gruppi di geni. Un algoritmo che ha dimostrato un ottimo funzionamento in diverse casistiche è l’algoritmo PC, che stima la presenza/assenza di un arco tra due geni attraverso un percorso di molteplici regressioni condizionate; questo meccanismo, tuttavia, può risultare computazionalmente oneroso quando il numero di osservazioni e di geni aumenta. Un’alternativa più rapida è la selezione del vicinato (neighborhood selection) tramite lasso, che prevede, appunto, di effettuare, per ciascun gene, un’unica regressione con penalizzazione di tipo lasso e procedere all’inserimento di un arco tra il gene considerato e tutti quei geni i cui coefficienti stimati risultano diversi da 0. Lo scopo di questa tesi è quello di confrontare le prestazioni tra gli algoritmi presentati; viene, inoltre, proposta una modifica dell’algoritmo PC, il cui obiettivo è quello di ridurre i tempi necessari al suo utilizzo replicando i risultati della procedura originale.File | Dimensione | Formato | |
---|---|---|---|
Berti_Mirko.pdf
accesso riservato
Dimensione
3.12 MB
Formato
Adobe PDF
|
3.12 MB | Adobe PDF |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/44766