Chronic lymphocytic leukemia (CLL) is a hematological malignancy with generally a mild course and is due to the expansion of mature B–cells. The negative prognostic factors include chromosomal deletions inactivating tumor suppressor genes, mutational status of the IGHV genes and complex karyotype. The t(14;19) involving BCL3 marks a rare and more aggressive subtype of CLL, still poorly characterized. Specific CLL gene expression profiles emerged from transcriptomics studies of mRNAs but have only partially elucidated the typical features of t(14;19)–CLL. Circular RNAs (circRNAs) are evolutionarily conserved transcripts involved in disease and cancer mechanisms. Given their resistance to degradation, they are promising biomarkers. In this Thesis, I have investigated the genomewide circRNA expression profile in CLL and t(14;19)–CLL through a bioinformatics analysis of whole transcriptome sequencing data. I studied a cohort of 56 patients, 22 with canonical CLL and a sizable number (n=25) with t(14;19)–CLL, collected in the frame of the European Research Initiative on CLL. CircRNAs were identified, quantified and annotated with the CirComPara2 software. Differential expression analysis was conducted with the Limma–Voom R/Bioconductor package and custom R scripts. I identified 23,760 circRNAs with consistent expression throughout the data set. Most (96.8%) were derived from backsplicing of annotated gene exons, whereas intronic and intergenic circRNAs were only a minor fraction, 1.8% and 1.4%, respectively. Intergenic circRNAs indicate putative new genes. About two–thirds (63%) of the genes expressing circRNAs produced multiple, from 2 up to 65, different circRNAs. Quality control and descriptive analyses were conducted on circRNA expression data to identify and control confounding factors and biases. The circRNAome of CLL and t(14;19)–CLL deeply differed from each other and B–cells of healthy individuals, indicating a circRNA expression signature correlated with disease aggressiveness. The differential expression analysis identified 1,415 and 1,102 circRNAs abnormally expressed in CLL and t(14;19)–CLL compared to B–cells, respectively. The comparison between t(14;19)–CLL and canonical CLL disclosed mainly circRNAs less expressed in the aggressive form (n=340, 72.8%), and 127 with higher abundance. The finding of this study, the first about circRNAs in t(14;19)–CLL, could be compared with the literature about canonical CLL and other malignancies. A few circRNAs found altered in CLL were already reported in leukemias or solid cancers, and almost none was associated with a known function. A known oncogenic circRNA, circZNF609, resulted abnormally highly expressed both in CLL and in t(14;19)–CLL. My data validated the upregulation in CLL of circRIC8B, previously correlated with a worse prognosis, and the downregulation of two circLIX1–AS1 isoforms. CircWWC3 depletion in CLL was consistent with findings in multiple myeloma. CircAFF2 upregulation was concordantly found in acute pediatric leukemias. CircRNAs dysregulated only in CLL, only in t(14;19)–CLL, or dysregulated in both groups were highlighted. A group of 813 circRNAs was commonly dysregulated in the considered patients, 22 circRNAs were also differentially expressed among t(14;19)–CLL and CLL. Notably, 267 circRNAs were found altered in t(14;19)–CLL, including 72 also in comparison with canonical CLL. Only some of these circRNAs have been reported in the literature, including circUSP34, circPRDM2 and circJMJD1C upregulated in CLL and other types of cancer and a circSMARCA5, different from the most characterized isoform. In summary, I provided new data about circRNA dysregulation in canonical CLL and uncovered it in the translocated subtype. This study prioritized dysregulated circRNAs for further functional studies to investigate their pathogenetic role in CLL, and laid the basis for the development of new therapies in the future.

La leucemia linfatica cronica (LLC) è una neoplasia ematologica da accumulo di cellule B mature con decorso piuttosto indolente. I fattori prognostici negativi includono alcune delezioni cromosomiche che disattivano geni oncosoppressori, lo stato mutazionale dei geni IGHV e un cariotipo complesso. La t(14;19) con sovraespressione di BCL3 definisce un tipo di LLC molto raro, aggressivo e ancora poco caratterizzato. Studi trascrittomici hanno definito profili di espressione genica nella LLC, fornendo pochissimi dati sulla t(14;19)–LLC. Gli RNA circolari (circRNA), trascritti evolutivamente conservati, piuttosto stabili e coinvolti nei meccanismi di malattia e oncogeni, sono interessanti bersagli terapeutici e biomarcatori tumorali. In questa Tesi, il profilo di espressione dei circRNA nella LLC e nella t(14;19)–LLC è stato indagato con analisi bioinformatiche di dati RNA–seq. Lo studio è basato su una coorte di 56 pazienti con LLC, 22 canonica e un considerevole numero (n=25) con la t(14;19) raccolto dall’European Research Initiative on CLL. I circRNA sono stati identificati, quantificati e annotati con il software CirComPara2, selezionando quelli rilevati in almeno 9 campioni. L’analisi di espressione differenziale è stata condotta con il pacchetto Limma–Voom attraverso il linguaggio di programmazione R. La maggior parte (96.8%) dei 23,760 circRNA studiati è prodotta dal backsplicing di esoni noti, mentre una frazione di circRNA intronici e intergenici, 1.8% e 1.4% rispettivamente, suggerisce l’espressione di possibili nuovi geni. Circa due terzi (63%) dei geni che esprimono circRNA è associato a molteplici, da 2 a 65, isoforme circolari. I controlli di qualità e le analisi descrittive condotte sui dati di espressione hanno permesso di identificare e controllare effetti confondenti e bias. È emerso quindi che i circRNAomi delle LLC e t(14;19)–LLC sono profondamente diversi tra loro e da quello delle cellule B sane. Specifici pattern d’espressione dei circRNA correlano con l’aggressività della malattia. L’analisi di espressione differenziale ha identificato 1,415 e 1,102 circRNA espressi in modo anomalo nella LLC e nella t(14;19)–LLC rispetto alla controparte normale, rispettivamente. Il confronto tra i due gruppi di pazienti ha rilevato molti circRNA meno espressi nella forma aggressiva (n=340, 72.8%), e 127 sovraespressi. I risultati di questo primo studio sui circRNA nella t(14;19)–LLC sono stati confrontati con la letteratura sulla LLC canonica e altre malattie. Solo alcuni circRNA trovati alterati nella LLC erano già stati riportati in malattie tumorali, e quasi nessuno ha funzione nota. Il circRNA oncogeno circZNF609 è sovraespresso nella LLC e nella t(14;19)–LLC. I dati hanno confermato la sovraespressione di circRIC8B, precedentemente correlata con una prognosi peggiore, e la sottoespressione di due isoforme di circLIX1–AS1. La ridotta espressione di circWWC3 in LLC è consistente con dati in mieloma multiplo, così come la sovraespressione di circAFF2 con osservazioni in leucemie acute. Le analisi hanno poi discriminato i circRNA la cui espressione è alterata solo nella LLC, solo nella t(14;19)–LLC, o in entrambe. Ho così definito 813 circRNA alterati in entrambi i gruppi, 22 anche differenzialmente espressi tra le due forme, e 267 sregolati nella t(14;19)–LLC, tra cui 72 anche nel confronto con la LLC canonica. Solo alcuni di questi circRNA erano già stati riportati in letteratura, come circUSP34, circPRDM2 e circJMJD1C, sovraespressi nella LLC e in altri tipi di cancro, e una isoforma di circSMARCA5, diversa però da quella già caratterizzata. Questo studio ha prodotto nuovi dati riguardo alla sregolazione dei circRNA nella LLC canonica, e soprattutto nella variante traslocata, conducendo alla selezione di circRNA che potranno essere oggetto, in futuro, di studi funzionali per investigarne il ruolo patogenetico, ponendo le basi per lo sviluppo di nuove terapie.

Identification of circular RNA expression dysregulation in Chronic Lymphocytic Leukemia with t(14;19) through RNA-seq data analysis

RONCAGLIA, ELEONORA
2022/2023

Abstract

Chronic lymphocytic leukemia (CLL) is a hematological malignancy with generally a mild course and is due to the expansion of mature B–cells. The negative prognostic factors include chromosomal deletions inactivating tumor suppressor genes, mutational status of the IGHV genes and complex karyotype. The t(14;19) involving BCL3 marks a rare and more aggressive subtype of CLL, still poorly characterized. Specific CLL gene expression profiles emerged from transcriptomics studies of mRNAs but have only partially elucidated the typical features of t(14;19)–CLL. Circular RNAs (circRNAs) are evolutionarily conserved transcripts involved in disease and cancer mechanisms. Given their resistance to degradation, they are promising biomarkers. In this Thesis, I have investigated the genomewide circRNA expression profile in CLL and t(14;19)–CLL through a bioinformatics analysis of whole transcriptome sequencing data. I studied a cohort of 56 patients, 22 with canonical CLL and a sizable number (n=25) with t(14;19)–CLL, collected in the frame of the European Research Initiative on CLL. CircRNAs were identified, quantified and annotated with the CirComPara2 software. Differential expression analysis was conducted with the Limma–Voom R/Bioconductor package and custom R scripts. I identified 23,760 circRNAs with consistent expression throughout the data set. Most (96.8%) were derived from backsplicing of annotated gene exons, whereas intronic and intergenic circRNAs were only a minor fraction, 1.8% and 1.4%, respectively. Intergenic circRNAs indicate putative new genes. About two–thirds (63%) of the genes expressing circRNAs produced multiple, from 2 up to 65, different circRNAs. Quality control and descriptive analyses were conducted on circRNA expression data to identify and control confounding factors and biases. The circRNAome of CLL and t(14;19)–CLL deeply differed from each other and B–cells of healthy individuals, indicating a circRNA expression signature correlated with disease aggressiveness. The differential expression analysis identified 1,415 and 1,102 circRNAs abnormally expressed in CLL and t(14;19)–CLL compared to B–cells, respectively. The comparison between t(14;19)–CLL and canonical CLL disclosed mainly circRNAs less expressed in the aggressive form (n=340, 72.8%), and 127 with higher abundance. The finding of this study, the first about circRNAs in t(14;19)–CLL, could be compared with the literature about canonical CLL and other malignancies. A few circRNAs found altered in CLL were already reported in leukemias or solid cancers, and almost none was associated with a known function. A known oncogenic circRNA, circZNF609, resulted abnormally highly expressed both in CLL and in t(14;19)–CLL. My data validated the upregulation in CLL of circRIC8B, previously correlated with a worse prognosis, and the downregulation of two circLIX1–AS1 isoforms. CircWWC3 depletion in CLL was consistent with findings in multiple myeloma. CircAFF2 upregulation was concordantly found in acute pediatric leukemias. CircRNAs dysregulated only in CLL, only in t(14;19)–CLL, or dysregulated in both groups were highlighted. A group of 813 circRNAs was commonly dysregulated in the considered patients, 22 circRNAs were also differentially expressed among t(14;19)–CLL and CLL. Notably, 267 circRNAs were found altered in t(14;19)–CLL, including 72 also in comparison with canonical CLL. Only some of these circRNAs have been reported in the literature, including circUSP34, circPRDM2 and circJMJD1C upregulated in CLL and other types of cancer and a circSMARCA5, different from the most characterized isoform. In summary, I provided new data about circRNA dysregulation in canonical CLL and uncovered it in the translocated subtype. This study prioritized dysregulated circRNAs for further functional studies to investigate their pathogenetic role in CLL, and laid the basis for the development of new therapies in the future.
2022
Identification of circular RNA expression dysregulation in Chronic Lymphocytic Leukemia with t(14;19) through RNA-seq data analysis
La leucemia linfatica cronica (LLC) è una neoplasia ematologica da accumulo di cellule B mature con decorso piuttosto indolente. I fattori prognostici negativi includono alcune delezioni cromosomiche che disattivano geni oncosoppressori, lo stato mutazionale dei geni IGHV e un cariotipo complesso. La t(14;19) con sovraespressione di BCL3 definisce un tipo di LLC molto raro, aggressivo e ancora poco caratterizzato. Studi trascrittomici hanno definito profili di espressione genica nella LLC, fornendo pochissimi dati sulla t(14;19)–LLC. Gli RNA circolari (circRNA), trascritti evolutivamente conservati, piuttosto stabili e coinvolti nei meccanismi di malattia e oncogeni, sono interessanti bersagli terapeutici e biomarcatori tumorali. In questa Tesi, il profilo di espressione dei circRNA nella LLC e nella t(14;19)–LLC è stato indagato con analisi bioinformatiche di dati RNA–seq. Lo studio è basato su una coorte di 56 pazienti con LLC, 22 canonica e un considerevole numero (n=25) con la t(14;19) raccolto dall’European Research Initiative on CLL. I circRNA sono stati identificati, quantificati e annotati con il software CirComPara2, selezionando quelli rilevati in almeno 9 campioni. L’analisi di espressione differenziale è stata condotta con il pacchetto Limma–Voom attraverso il linguaggio di programmazione R. La maggior parte (96.8%) dei 23,760 circRNA studiati è prodotta dal backsplicing di esoni noti, mentre una frazione di circRNA intronici e intergenici, 1.8% e 1.4% rispettivamente, suggerisce l’espressione di possibili nuovi geni. Circa due terzi (63%) dei geni che esprimono circRNA è associato a molteplici, da 2 a 65, isoforme circolari. I controlli di qualità e le analisi descrittive condotte sui dati di espressione hanno permesso di identificare e controllare effetti confondenti e bias. È emerso quindi che i circRNAomi delle LLC e t(14;19)–LLC sono profondamente diversi tra loro e da quello delle cellule B sane. Specifici pattern d’espressione dei circRNA correlano con l’aggressività della malattia. L’analisi di espressione differenziale ha identificato 1,415 e 1,102 circRNA espressi in modo anomalo nella LLC e nella t(14;19)–LLC rispetto alla controparte normale, rispettivamente. Il confronto tra i due gruppi di pazienti ha rilevato molti circRNA meno espressi nella forma aggressiva (n=340, 72.8%), e 127 sovraespressi. I risultati di questo primo studio sui circRNA nella t(14;19)–LLC sono stati confrontati con la letteratura sulla LLC canonica e altre malattie. Solo alcuni circRNA trovati alterati nella LLC erano già stati riportati in malattie tumorali, e quasi nessuno ha funzione nota. Il circRNA oncogeno circZNF609 è sovraespresso nella LLC e nella t(14;19)–LLC. I dati hanno confermato la sovraespressione di circRIC8B, precedentemente correlata con una prognosi peggiore, e la sottoespressione di due isoforme di circLIX1–AS1. La ridotta espressione di circWWC3 in LLC è consistente con dati in mieloma multiplo, così come la sovraespressione di circAFF2 con osservazioni in leucemie acute. Le analisi hanno poi discriminato i circRNA la cui espressione è alterata solo nella LLC, solo nella t(14;19)–LLC, o in entrambe. Ho così definito 813 circRNA alterati in entrambi i gruppi, 22 anche differenzialmente espressi tra le due forme, e 267 sregolati nella t(14;19)–LLC, tra cui 72 anche nel confronto con la LLC canonica. Solo alcuni di questi circRNA erano già stati riportati in letteratura, come circUSP34, circPRDM2 e circJMJD1C, sovraespressi nella LLC e in altri tipi di cancro, e una isoforma di circSMARCA5, diversa però da quella già caratterizzata. Questo studio ha prodotto nuovi dati riguardo alla sregolazione dei circRNA nella LLC canonica, e soprattutto nella variante traslocata, conducendo alla selezione di circRNA che potranno essere oggetto, in futuro, di studi funzionali per investigarne il ruolo patogenetico, ponendo le basi per lo sviluppo di nuove terapie.
RNA circolari
Trascrittomica
Bioinformatica
Leucemia
RNA–seq
File in questo prodotto:
File Dimensione Formato  
Roncaglia_Eleonora.pdf

accesso riservato

Dimensione 12.59 MB
Formato Adobe PDF
12.59 MB Adobe PDF

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/52334