Human embryonic development is the complex process in which the zygote grows and specialises to form all the tissues, organs and apparatuses of the human body. The differentiation process is still widely studied because it is still not clear how gene expression varies during the process. In particular, there is interest in assessing which genes are upregulated or downregulated and at what stages this happens. Each cell expresses only a group of genes, that varies according to the cell type and the "life phase" in which the cell is. The main problem in the study of embryonic development is to build a reliable in vitro model that can faithfully replicate what happens in vivo. The starting point for the formation of these models are stem cells, that can differentiate into other cells. In particular, Embryonic Stem Cells would be an excellent tool, but their use is related to bioethical issues. An affordable alternative is Induced Pluripotent Stem Cells (iPSCs), obtained from differentiated cells genetically manipulated to go back to the stem state. Starting from those cells many models can be derived, and organoids are one of these. They are 3D in vitro models that can better replicate the 3D structure in vivo, respect to 2D models. A powerful technique to study the behaviour of genes during the differentiation process is RNA-sequencing. This approach is useful for the study of gene expression profiles in cells during a dynamic process like neurodifferentiation. RNA-seq can be performed in many ways but we will focus on the single cell analysis, that can be used in trajectory studies. While observing a sample in a certain period, it is possible to detect how some genes modulate their levels of expression in the various stages. This thesis aims to apply single-cell techniques to deepen the mechanisms of differentiation, particularly in neurodifferentiation, starting with datasets available in the literature. Moreover, it is expected to understand how gene expression varies and differentiates over the time of this phase of embryonic development, trying to understand the behaviour of the genes that drive it. For this analysis was selected a single cell dataset composed by brain organoids obtained at three different timepoints (23 days, 1 month, 2 months) and it was taken from the paper: "Proper acquisition of cell class identity in organoids allows the definition of fate specification programs of the human cerebral cortex" (Arlotta et al., 2022). Firstly, scRNA-seq analysis allowed to trace a trajectory that connects the individual cells of the dataset considering the assignment of pseudotime, a fictitious time value, calculated for each cell. It allows to represent the time development, specific for the process of neurodifferentiation. From the evaluation of the graph emerged a branching point almost at the beginning of the trajectory and in correspondence of cells in a still undifferentiated state. Considering the two branches separately, the 2000 most variable genes respect to pseudotime were identified. To deepen the mechanisms that regulates the activation and deactivation of genes, the expression profiles respect to pseudotime were studied first individually, to compare the characteristic development of each, and then classified through the K-means algorithm.Both branches show activation profiles, but with different trends. This is confirmed with what was previously observed by the pseudotime values, which are greater for the left branch than the right one. Finally, a functional analysis was applied to each cluster and the results support the upregulation of genes related to characteristic pathway of neural development. Particularly interesting is the pathway NOTCH1, a receptor that regulates cell differentiation and processes related to the development of neurons, that turned out to be activated in both branches.

Lo sviluppo embrionale umano è un processo complesso durante il quale lo zigote cresce e si specializza per formare tutte le cellule presenti nel corpo umano. Il modo in cui l'espressione genica varia durante il processo è ancora oggetto di studio, in particolare quali geni sono sovra espressi o sotto espressi e in quali fasi questo accade. Sebbene ogni cellula contenga la completa informazione genica ne esprime solo una parte. Il problema principale è costruire un modello in vitro affidabile che possa replicare fedelmente ciò che accade in vivo. Il punto di partenza per la formazione di questi modelli sono le cellule staminali, che possono differenziarsi in cellule differenti. Le cellule staminali embrionali rappresenterebbero un ottimo strumento per creare modelli in vitro che permettano di studiare ciò che accade in vivo, ma il loro uso è legato a questioni bioetiche. Una alternativa sono le cellule staminali pluripotenti indotte. Queste sono ottenute da cellule differenziate che sono geneticamente manipolate per essere indotte a tornare allo stato staminale. Partendo da queste si possono ricavare molti modelli utilizzabili, come ad esempio gli organoidi. Si tratta di modelli in vitro tridimensionali che possono replicare meglio la struttura presente in vivo che si sviluppa nelle tre dimensioni. Una tecnica potente per studiare il comportamento dei geni durante il processo di differenziamento è l’RNA-sequencing. Questo metodo è utile per lo studio dei profili di espressione genica nelle cellule durante un processo dinamico come il neurodifferenziamento. In questo lavoro è stata utilizzata l’Analisi Single Cell, che può essere applicata nello studio delle traiettorie. Osservando un campione in un periodo, è possibile individuare come alcuni geni varino i loro livelli di espressione nelle differenti fasi. L'obiettivo di questa tesi è quello di applicare tecniche di Analisi Single Cell per approfondire i meccanismi che guidano il neuro differenziamento. Si vuole capire come l'espressione genica vari e si evolva nel corso di queste fasi dello sviluppo embrionale, approfondendo il comportamento dei geni che la guidano. È stato utilizzato un dataset single cell composto da organoidi di cervello, ottenuti in tre diversi timepoints (23 giorni, 1 mese, 2 mesi), che è stato scaricato dal paper: “Proper acquisition of cell class identity in organoids allows the definition of fate specification programs of the human cerebral cortex” (Arlotta et al., 2022). Inizialmente, l’analisi scRNA-seq ha permesso di tracciare una traiettoria che collega le singole cellule del dataset basandosi sull’assegnazione dello pseudotime, un valore di tempo fittizio, calcolato per ogni cellula. Questo ha permesso di riuscire a rappresentare lo sviluppo nel tempo caratteristico del processo di neurodifferenziamento. Dal tracciato è emerso un branching point quasi all’inizio della traiettoria e in corrispondenza di cellule in uno stato ancora indifferenziato. Dall’analisi separata dei due rami è stato possibile individuare i 2000 geni più variabili. Per approfondire i meccanismi di attivazione e disattivazione dei geni, i profili di espressione rispetto allo pseudotime sono stati studiati, prima individualmente, in modo da confrontare lo sviluppo caratteristico di ognuno, e poi classificati attraverso l’algoritmo del K-means. Questo è in accordo con quanto osservato dai valori di pseudotime ottenuti, che sono maggiori per il braccio sinistro rispetto al destro. Infine, è stata applicata un’analisi funzionale condotta su ogni cluster che ha confermato l’upregolazione di geni riconducibili a pathways collegati allo sviluppo neurale. Particolarmente interessante è il pathway NOTCH1, recettore che regola il differenziamento cellulare e processi legati allo sviluppo neuronale, che è risultato essere attivato in entrambi i rami.

Study of gene expression dynamics at Single Cell resolution during neurodifferentiation

DE BENI, FRANCESCA
2023/2024

Abstract

Human embryonic development is the complex process in which the zygote grows and specialises to form all the tissues, organs and apparatuses of the human body. The differentiation process is still widely studied because it is still not clear how gene expression varies during the process. In particular, there is interest in assessing which genes are upregulated or downregulated and at what stages this happens. Each cell expresses only a group of genes, that varies according to the cell type and the "life phase" in which the cell is. The main problem in the study of embryonic development is to build a reliable in vitro model that can faithfully replicate what happens in vivo. The starting point for the formation of these models are stem cells, that can differentiate into other cells. In particular, Embryonic Stem Cells would be an excellent tool, but their use is related to bioethical issues. An affordable alternative is Induced Pluripotent Stem Cells (iPSCs), obtained from differentiated cells genetically manipulated to go back to the stem state. Starting from those cells many models can be derived, and organoids are one of these. They are 3D in vitro models that can better replicate the 3D structure in vivo, respect to 2D models. A powerful technique to study the behaviour of genes during the differentiation process is RNA-sequencing. This approach is useful for the study of gene expression profiles in cells during a dynamic process like neurodifferentiation. RNA-seq can be performed in many ways but we will focus on the single cell analysis, that can be used in trajectory studies. While observing a sample in a certain period, it is possible to detect how some genes modulate their levels of expression in the various stages. This thesis aims to apply single-cell techniques to deepen the mechanisms of differentiation, particularly in neurodifferentiation, starting with datasets available in the literature. Moreover, it is expected to understand how gene expression varies and differentiates over the time of this phase of embryonic development, trying to understand the behaviour of the genes that drive it. For this analysis was selected a single cell dataset composed by brain organoids obtained at three different timepoints (23 days, 1 month, 2 months) and it was taken from the paper: "Proper acquisition of cell class identity in organoids allows the definition of fate specification programs of the human cerebral cortex" (Arlotta et al., 2022). Firstly, scRNA-seq analysis allowed to trace a trajectory that connects the individual cells of the dataset considering the assignment of pseudotime, a fictitious time value, calculated for each cell. It allows to represent the time development, specific for the process of neurodifferentiation. From the evaluation of the graph emerged a branching point almost at the beginning of the trajectory and in correspondence of cells in a still undifferentiated state. Considering the two branches separately, the 2000 most variable genes respect to pseudotime were identified. To deepen the mechanisms that regulates the activation and deactivation of genes, the expression profiles respect to pseudotime were studied first individually, to compare the characteristic development of each, and then classified through the K-means algorithm.Both branches show activation profiles, but with different trends. This is confirmed with what was previously observed by the pseudotime values, which are greater for the left branch than the right one. Finally, a functional analysis was applied to each cluster and the results support the upregulation of genes related to characteristic pathway of neural development. Particularly interesting is the pathway NOTCH1, a receptor that regulates cell differentiation and processes related to the development of neurons, that turned out to be activated in both branches.
2023
Study of gene expression dynamics at Single Cell resolution during neurodifferentiation
Lo sviluppo embrionale umano è un processo complesso durante il quale lo zigote cresce e si specializza per formare tutte le cellule presenti nel corpo umano. Il modo in cui l'espressione genica varia durante il processo è ancora oggetto di studio, in particolare quali geni sono sovra espressi o sotto espressi e in quali fasi questo accade. Sebbene ogni cellula contenga la completa informazione genica ne esprime solo una parte. Il problema principale è costruire un modello in vitro affidabile che possa replicare fedelmente ciò che accade in vivo. Il punto di partenza per la formazione di questi modelli sono le cellule staminali, che possono differenziarsi in cellule differenti. Le cellule staminali embrionali rappresenterebbero un ottimo strumento per creare modelli in vitro che permettano di studiare ciò che accade in vivo, ma il loro uso è legato a questioni bioetiche. Una alternativa sono le cellule staminali pluripotenti indotte. Queste sono ottenute da cellule differenziate che sono geneticamente manipolate per essere indotte a tornare allo stato staminale. Partendo da queste si possono ricavare molti modelli utilizzabili, come ad esempio gli organoidi. Si tratta di modelli in vitro tridimensionali che possono replicare meglio la struttura presente in vivo che si sviluppa nelle tre dimensioni. Una tecnica potente per studiare il comportamento dei geni durante il processo di differenziamento è l’RNA-sequencing. Questo metodo è utile per lo studio dei profili di espressione genica nelle cellule durante un processo dinamico come il neurodifferenziamento. In questo lavoro è stata utilizzata l’Analisi Single Cell, che può essere applicata nello studio delle traiettorie. Osservando un campione in un periodo, è possibile individuare come alcuni geni varino i loro livelli di espressione nelle differenti fasi. L'obiettivo di questa tesi è quello di applicare tecniche di Analisi Single Cell per approfondire i meccanismi che guidano il neuro differenziamento. Si vuole capire come l'espressione genica vari e si evolva nel corso di queste fasi dello sviluppo embrionale, approfondendo il comportamento dei geni che la guidano. È stato utilizzato un dataset single cell composto da organoidi di cervello, ottenuti in tre diversi timepoints (23 giorni, 1 mese, 2 mesi), che è stato scaricato dal paper: “Proper acquisition of cell class identity in organoids allows the definition of fate specification programs of the human cerebral cortex” (Arlotta et al., 2022). Inizialmente, l’analisi scRNA-seq ha permesso di tracciare una traiettoria che collega le singole cellule del dataset basandosi sull’assegnazione dello pseudotime, un valore di tempo fittizio, calcolato per ogni cellula. Questo ha permesso di riuscire a rappresentare lo sviluppo nel tempo caratteristico del processo di neurodifferenziamento. Dal tracciato è emerso un branching point quasi all’inizio della traiettoria e in corrispondenza di cellule in uno stato ancora indifferenziato. Dall’analisi separata dei due rami è stato possibile individuare i 2000 geni più variabili. Per approfondire i meccanismi di attivazione e disattivazione dei geni, i profili di espressione rispetto allo pseudotime sono stati studiati, prima individualmente, in modo da confrontare lo sviluppo caratteristico di ognuno, e poi classificati attraverso l’algoritmo del K-means. Questo è in accordo con quanto osservato dai valori di pseudotime ottenuti, che sono maggiori per il braccio sinistro rispetto al destro. Infine, è stata applicata un’analisi funzionale condotta su ogni cluster che ha confermato l’upregolazione di geni riconducibili a pathways collegati allo sviluppo neurale. Particolarmente interessante è il pathway NOTCH1, recettore che regola il differenziamento cellulare e processi legati allo sviluppo neuronale, che è risultato essere attivato in entrambi i rami.
Single Cell
gene expression
neurodifferentiation
File in questo prodotto:
File Dimensione Formato  
DeBeni_Francesca.pdf

accesso riservato

Dimensione 4.89 MB
Formato Adobe PDF
4.89 MB Adobe PDF

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/64995