La stima della struttura di un grafo è una questione di grande interesse in ambito genomico, in quanto funzionale a fornire indicazioni sulle relazioni tra gruppi di geni. Un algoritmo che ha dimostrato un ottimo funzionamento in diverse casistiche è l’algoritmo PC, che stima la presenza/assenza di un arco tra due geni attraverso un percorso di molteplici regressioni condizionate; questo meccanismo, tuttavia, può risultare computazionalmente oneroso quando il numero di osservazioni e di geni aumenta. Un’alternativa più rapida è la selezione del vicinato (neighborhood selection) tramite lasso, che prevede, appunto, di effettuare, per ciascun gene, un’unica regressione con penalizzazione di tipo lasso e procedere all’inserimento di un arco tra il gene considerato e tutti quei geni i cui coefficienti stimati risultano diversi da 0. Lo scopo di questa tesi è quello di confrontare le prestazioni tra gli algoritmi presentati; viene, inoltre, proposta una modifica dell’algoritmo PC, il cui obiettivo è quello di ridurre i tempi necessari al suo utilizzo replicando i risultati della procedura originale.

Selezione degli archi tramite regressione Lasso per modelli grafici: un confronto con l'algoritmo PC

BERTI, MIRKO
2022/2023

Abstract

La stima della struttura di un grafo è una questione di grande interesse in ambito genomico, in quanto funzionale a fornire indicazioni sulle relazioni tra gruppi di geni. Un algoritmo che ha dimostrato un ottimo funzionamento in diverse casistiche è l’algoritmo PC, che stima la presenza/assenza di un arco tra due geni attraverso un percorso di molteplici regressioni condizionate; questo meccanismo, tuttavia, può risultare computazionalmente oneroso quando il numero di osservazioni e di geni aumenta. Un’alternativa più rapida è la selezione del vicinato (neighborhood selection) tramite lasso, che prevede, appunto, di effettuare, per ciascun gene, un’unica regressione con penalizzazione di tipo lasso e procedere all’inserimento di un arco tra il gene considerato e tutti quei geni i cui coefficienti stimati risultano diversi da 0. Lo scopo di questa tesi è quello di confrontare le prestazioni tra gli algoritmi presentati; viene, inoltre, proposta una modifica dell’algoritmo PC, il cui obiettivo è quello di ridurre i tempi necessari al suo utilizzo replicando i risultati della procedura originale.
2022
Edges selection through Lasso regression for graphical models: a comparison with the PC algorithm
Modelli grafici
Regressione Lasso
Algoritmo PC
File in questo prodotto:
File Dimensione Formato  
Berti_Mirko.pdf

accesso riservato

Dimensione 3.12 MB
Formato Adobe PDF
3.12 MB Adobe PDF

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/44766