Questo elaborato tratta della pipeline computazionale miR&moRe2, in grado di rilevare i microRNA ed i microRNA-offset RNA (moRNA), appartenenti alla classe degli small RNA, e quantificarne l'espressione a partire da dei file grezzi di sequenziamento, in formato FASTQ, ottenuti grazie alla tecnologia Illumina RNA-seq. Mentre per lo studio dell'espressione dei microRNA esistono già altri software, l'innovazione che miR&moRe2 introduce consiste in un metodo in grado di rilevare in maniera automatizzata anche i moRNA, classificandoli e quantificandoli con criteri omogenei a quelli utilizzati per i primi. Dopo un'introduzione che ha la funzionalità di introdurre alcuni concetti fondamentali per comprendere il contesto, verrà descritto ed analizzato il funzionamento della pipeline computazionale per l’analisi dei dati RNA-seq, dall'input dei dati di sequenziamento fino alla matrice contenente gli small RNA espressi e le corrispondenti stime di espressione ("read counts") in ogni campione sequenziato. Segue poi un'esposizione ed un'analisi di come il software sia stato validato, ovvero tramite una comparazione tra risultati pubblici validati e le stime predette da miR&moRe2 a partire dai medesimi dati in ingresso. Di particolare importanza sarà validare i criteri con cui il software classifica i moRNA ed osservare come gli small RNA che miR&moRe2 ha rilevato appartengano al pathway di biogenesi noto per questo tipo di trascritti. L'elaborato si conclude con un confronto tra i risultati ottenuti con miR&moRe2 ed una seconda pipeline computazionale, smrnaseq di nf-core, a partire da file di sequenziamento di campioni derivanti da pazienti malati di leucemia linfoblastica acuta.
Valutazione comparativa della pipeline computazionale miR&moRe2 per la caratterizzazione dell'espressione di piccoli RNA da dati RNA-seq
MATTIELLO, NICOLA
2024/2025
Abstract
Questo elaborato tratta della pipeline computazionale miR&moRe2, in grado di rilevare i microRNA ed i microRNA-offset RNA (moRNA), appartenenti alla classe degli small RNA, e quantificarne l'espressione a partire da dei file grezzi di sequenziamento, in formato FASTQ, ottenuti grazie alla tecnologia Illumina RNA-seq. Mentre per lo studio dell'espressione dei microRNA esistono già altri software, l'innovazione che miR&moRe2 introduce consiste in un metodo in grado di rilevare in maniera automatizzata anche i moRNA, classificandoli e quantificandoli con criteri omogenei a quelli utilizzati per i primi. Dopo un'introduzione che ha la funzionalità di introdurre alcuni concetti fondamentali per comprendere il contesto, verrà descritto ed analizzato il funzionamento della pipeline computazionale per l’analisi dei dati RNA-seq, dall'input dei dati di sequenziamento fino alla matrice contenente gli small RNA espressi e le corrispondenti stime di espressione ("read counts") in ogni campione sequenziato. Segue poi un'esposizione ed un'analisi di come il software sia stato validato, ovvero tramite una comparazione tra risultati pubblici validati e le stime predette da miR&moRe2 a partire dai medesimi dati in ingresso. Di particolare importanza sarà validare i criteri con cui il software classifica i moRNA ed osservare come gli small RNA che miR&moRe2 ha rilevato appartengano al pathway di biogenesi noto per questo tipo di trascritti. L'elaborato si conclude con un confronto tra i risultati ottenuti con miR&moRe2 ed una seconda pipeline computazionale, smrnaseq di nf-core, a partire da file di sequenziamento di campioni derivanti da pazienti malati di leucemia linfoblastica acuta.| File | Dimensione | Formato | |
|---|---|---|---|
|
Mattiello_Nicola.pdf
accesso aperto
Dimensione
1.09 MB
Formato
Adobe PDF
|
1.09 MB | Adobe PDF | Visualizza/Apri |
The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License
https://hdl.handle.net/20.500.12608/91962