L'analisi di dati di espressione genica negli ultimi anni si è rilevata fondamentale nella ricerca medica: ha infatti permesso di sviluppare farmaci mirati ed efficaci, di diagnosticare precocemente alcune patologie e di conseguenza di intervenire tempestivamente ed agevolarne il decorso. Le tecniche fino ad oggi più utilizzare si basano sul sequenziamento del codice genetico e permettono di ottenere i dati di espressione genica di una determinata cellula o di un campione. Non preservano però l'informazione relativa alla localizzazione spaziale della cellula analizzata, e questo diventa problematico in alcune applicazioni. Uno degli esempi in tal senso più noti è rappresentato dagli studi sul cervello umano: in questo caso, in virtù della struttura laminare ben definita propria del cervello, conoscere la posizione esatta di una sua cellula diventa decisivo, considerando ad esempio che per alcuni disturbi neuropsichiatrici sono state trovate alterazioni nell'espressione genica in punti specifici della corteccia. Per far fronte a questa difficoltà è nata la trascrittomica spaziale, che comprende un insieme di tecniche che permettono di ottenere i dati di espressione genica mantenendo l'informazione relativa alla localizzazione spaziale del campione analizzato. Un problema ben noto nel contesto delle neuroscienze è che i cervelli di diversi individui non sono allineati dal punto di vista funzionale. In altre parole significa che, anche supponendo che i cervelli siano allineati dal punto di vista anatomico, la stessa zona svolge, in individui diversi, una funzione diversa. Se dunque si vuole sfruttare l'informazione relativa alla localizzazione spaziale per confrontare campioni di soggetti diversi in diverse condizione biologiche o patologiche (ad esempio sani contro malati), si rischia di utilizzare coordinate sbagliate. Si può quindi pensare di far precedere all'analisi differenziale un passo preliminare in cui si allineano le immagini ottenute dal punto di vista funzionale. Prendendo spunto dalle neuroscienze, dove viene già regolarmente impiegata, l'analisi di Procuste sembra essere uno strumento promettente anche per l'allineamento di dati di trascrittomica spaziale. L'analisi di Procuste in algebra ha l'obiettivo di rendere il più simile tra loro diverse matrici tramite similitudini. Nel caso in cui si vogliano allineare due sole matrici è disponibile una soluzione in forma chiusa; nel caso invece in cui si vogliano allineare più matrici bisogna avvalersi di algoritmi iterativi. Tra tali algoritmi, uno dei più promettenti deriva dal modello ProMises Efficiente. Quest'ultimo permette infatti di mantenere l'interpretazione spaziale delle immagini allineate garantendo l'unicità della soluzione, ha una complessità computazionale ridotta ed è applicabile anche a matrici con diverso numero di colonne. In questo lavoro di tesi sono stati applicati metodi di allineamento Procuste ai dati di trascrittomica spaziale che derivano da sezioni di tessuto della corteccia dorso-laterale pre-frontale di tre soggetti adulti sani, per ognuno dei quali sono stati raccolti due paia di repliche spaziali. Si hanno quindi a disposizione 4 immagini per soggetto, per un totale di 12 immagini. L’obiettivo è duplice: si vuole da un lato dimostrare che il modello funziona e rende le immagini effettivamente più simili, dall’altro mostrarne il beneficio biologico. Per rispondere al primo obiettivo si mostrerà che la distanza tra le matrici a seguito dell’allineamento cala e che la media delle immagini allineate è un oggetto più omogeneo della media delle immagini non allineate. Per quanto riguarda invece il beneficio biologico, si condurrà un esperimento nullo allineando 4 immagini di un soggetto e 4 di un altro, si applicherà un modello per l’espressione differenziale e si mostrerà che vengono rilevati meno falsi positivi rispetto a quelli rilevati dallo stesso modello applicato ai dati non allineati.

Analisi di Procuste per dati di trascrittomica spaziale

CORBETTA, DANIELA
2021/2022

Abstract

L'analisi di dati di espressione genica negli ultimi anni si è rilevata fondamentale nella ricerca medica: ha infatti permesso di sviluppare farmaci mirati ed efficaci, di diagnosticare precocemente alcune patologie e di conseguenza di intervenire tempestivamente ed agevolarne il decorso. Le tecniche fino ad oggi più utilizzare si basano sul sequenziamento del codice genetico e permettono di ottenere i dati di espressione genica di una determinata cellula o di un campione. Non preservano però l'informazione relativa alla localizzazione spaziale della cellula analizzata, e questo diventa problematico in alcune applicazioni. Uno degli esempi in tal senso più noti è rappresentato dagli studi sul cervello umano: in questo caso, in virtù della struttura laminare ben definita propria del cervello, conoscere la posizione esatta di una sua cellula diventa decisivo, considerando ad esempio che per alcuni disturbi neuropsichiatrici sono state trovate alterazioni nell'espressione genica in punti specifici della corteccia. Per far fronte a questa difficoltà è nata la trascrittomica spaziale, che comprende un insieme di tecniche che permettono di ottenere i dati di espressione genica mantenendo l'informazione relativa alla localizzazione spaziale del campione analizzato. Un problema ben noto nel contesto delle neuroscienze è che i cervelli di diversi individui non sono allineati dal punto di vista funzionale. In altre parole significa che, anche supponendo che i cervelli siano allineati dal punto di vista anatomico, la stessa zona svolge, in individui diversi, una funzione diversa. Se dunque si vuole sfruttare l'informazione relativa alla localizzazione spaziale per confrontare campioni di soggetti diversi in diverse condizione biologiche o patologiche (ad esempio sani contro malati), si rischia di utilizzare coordinate sbagliate. Si può quindi pensare di far precedere all'analisi differenziale un passo preliminare in cui si allineano le immagini ottenute dal punto di vista funzionale. Prendendo spunto dalle neuroscienze, dove viene già regolarmente impiegata, l'analisi di Procuste sembra essere uno strumento promettente anche per l'allineamento di dati di trascrittomica spaziale. L'analisi di Procuste in algebra ha l'obiettivo di rendere il più simile tra loro diverse matrici tramite similitudini. Nel caso in cui si vogliano allineare due sole matrici è disponibile una soluzione in forma chiusa; nel caso invece in cui si vogliano allineare più matrici bisogna avvalersi di algoritmi iterativi. Tra tali algoritmi, uno dei più promettenti deriva dal modello ProMises Efficiente. Quest'ultimo permette infatti di mantenere l'interpretazione spaziale delle immagini allineate garantendo l'unicità della soluzione, ha una complessità computazionale ridotta ed è applicabile anche a matrici con diverso numero di colonne. In questo lavoro di tesi sono stati applicati metodi di allineamento Procuste ai dati di trascrittomica spaziale che derivano da sezioni di tessuto della corteccia dorso-laterale pre-frontale di tre soggetti adulti sani, per ognuno dei quali sono stati raccolti due paia di repliche spaziali. Si hanno quindi a disposizione 4 immagini per soggetto, per un totale di 12 immagini. L’obiettivo è duplice: si vuole da un lato dimostrare che il modello funziona e rende le immagini effettivamente più simili, dall’altro mostrarne il beneficio biologico. Per rispondere al primo obiettivo si mostrerà che la distanza tra le matrici a seguito dell’allineamento cala e che la media delle immagini allineate è un oggetto più omogeneo della media delle immagini non allineate. Per quanto riguarda invece il beneficio biologico, si condurrà un esperimento nullo allineando 4 immagini di un soggetto e 4 di un altro, si applicherà un modello per l’espressione differenziale e si mostrerà che vengono rilevati meno falsi positivi rispetto a quelli rilevati dallo stesso modello applicato ai dati non allineati.
2021
Procrustes analysis for spatial transcriptomics data
Analisi Procrustes
Modello ProMises
Trascrittomica spazi
Allineamento
File in questo prodotto:
File Dimensione Formato  
Corbetta_Daniela.pdf

accesso aperto

Dimensione 14.22 MB
Formato Adobe PDF
14.22 MB Adobe PDF Visualizza/Apri

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/11368