Negli ultimi anni, l’analisi genomica ha vissuto una rapida evoluzione grazie all’integrazione tra tecniche statistiche tradizionali e approcci di machine learning, soprattutto nell’ambito degli studi di associazione genome-wide (GWAS). In questa tesi viene proposta una panoramica critica dei principali metodi GWAS e delle strategie di machine learning applicate, con particolare attenzione ai recenti sviluppi delle reti neurali profonde e dei modelli transformer. L’analisi della letteratura evidenzia come questi strumenti innovativi stiano superando i limiti dei modelli classici, permettendo di identificare pattern complessi e interazioni geniche non lineari, come l’epistasi. Si sottolinea, inoltre, l’importanza strategica di un approccio integrato che combini le potenzialità del machine learning con i rigorosi fondamenti della statistica classica, al fine di ottenere analisi più robuste, modelli predittivi più accurati e una comprensione più profonda dei fenomeni osservati. Partendo da queste basi teoriche, la parte sperimentale si è concentrata sullo sviluppo di una pipeline post-GWAS basata su un modello transformer (Genotype-to-Phenotype Transformer, G2PT), applicata allo studio della variabilità nella progressione della Distrofia Muscolare di Duchenne (DMD), patologia caratterizzata da notevole eterogeneità clinica. La parte sperimentale della tesi, mira ad interpretare i layer di self-attention della rete neurale per esplorare l’importanza delle connessioni funzionali di geni coinvolti nel fenotipo. Nel complesso, questa tesi offre una possibile applicazione di modelli avanzati di intelligenza artificiale all’analisi post-GWAS, dimostrando come l’integrazione tra deep learning, annotazioni biologiche e metodi statistici possa offrire nuove prospettive per la medicina di precisione nelle malattie rare.
Implementazione di sistemi di Deep Learning nell’analisi genomica
IANNACO, RICCARDO
2024/2025
Abstract
Negli ultimi anni, l’analisi genomica ha vissuto una rapida evoluzione grazie all’integrazione tra tecniche statistiche tradizionali e approcci di machine learning, soprattutto nell’ambito degli studi di associazione genome-wide (GWAS). In questa tesi viene proposta una panoramica critica dei principali metodi GWAS e delle strategie di machine learning applicate, con particolare attenzione ai recenti sviluppi delle reti neurali profonde e dei modelli transformer. L’analisi della letteratura evidenzia come questi strumenti innovativi stiano superando i limiti dei modelli classici, permettendo di identificare pattern complessi e interazioni geniche non lineari, come l’epistasi. Si sottolinea, inoltre, l’importanza strategica di un approccio integrato che combini le potenzialità del machine learning con i rigorosi fondamenti della statistica classica, al fine di ottenere analisi più robuste, modelli predittivi più accurati e una comprensione più profonda dei fenomeni osservati. Partendo da queste basi teoriche, la parte sperimentale si è concentrata sullo sviluppo di una pipeline post-GWAS basata su un modello transformer (Genotype-to-Phenotype Transformer, G2PT), applicata allo studio della variabilità nella progressione della Distrofia Muscolare di Duchenne (DMD), patologia caratterizzata da notevole eterogeneità clinica. La parte sperimentale della tesi, mira ad interpretare i layer di self-attention della rete neurale per esplorare l’importanza delle connessioni funzionali di geni coinvolti nel fenotipo. Nel complesso, questa tesi offre una possibile applicazione di modelli avanzati di intelligenza artificiale all’analisi post-GWAS, dimostrando come l’integrazione tra deep learning, annotazioni biologiche e metodi statistici possa offrire nuove prospettive per la medicina di precisione nelle malattie rare.| File | Dimensione | Formato | |
|---|---|---|---|
|
Iannaco_Riccardo.pdf
Accesso riservato
Dimensione
11.74 MB
Formato
Adobe PDF
|
11.74 MB | Adobe PDF |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/94047