La comunicazione tra cellule, tipicamente rappresentata da interazioni cellula-cellula regolate dalla segnalazione biochimica, è un aspetto fondamentale e di vitale importanza per molte funzioni della vita cellulare. La classe di interazioni utilizzate in modo predominante per lo studio della comunicazione cellulare è quella costituita da ligandi e recettori. Il ligando è una proteina “trasmittente” in grado di legarsi attraverso un'interazione ad un'altra proteina, “ricevente”, detta recettore. Il legame tra queste due proteine porta a delle alterazioni del recettore, che svolgono o inducono una funzione biologica. Lo studio delle interazioni cellula-cellula è di recente interesse. In principio, si potevano analizzare le interazioni solo con esperimenti in vitro composti da uno o due tipi cellulari e pochi geni selezionati. Lo sviluppo del metodo di sequenziamento dell'RNA a singola cellula (scRNA-seq) ha fornito agli studiosi uno strumento potente per l'analisi della composizione cellulare. Le nuove tecniche sviluppate per l'estrazione dell'RNA a singola cellula hanno portato costi inferiori e accessibilità dei metodi rispetto al passato. Negli ultimi anni, sono aumentati gli strumenti computazionali che permettono di analizzare i dati a singola cellula con sempre maggiore efficienza per studiare così la comunicazione tra cellule. In questo elaborato si rivolge l'interesse al confronto tra i diversi metodi per lo studio della comunicazione e interazione cellula-cellula. Quindi si intende valutare tali strumenti, osservando punti di forza e limiti di ciascuno, per poi soffermarsi ad esaminare se le interazioni rilevate sono concordi. Nel corso dell'elaborato sono stati studiati tre strumenti per lo scopo: iTALK, SingleCellSignalR e CellChat. Inizialmente sono stati descritti i tre metodi, si è poi proseguito con l'applicazione di questi a dati simulati e a dati reali, rilevando le interazioni ligando-recettore significative tra cluster diversi e all'interno dello stesso. Per i dati simulati, rispetto a quelli reali, si ha l'opportunità di verificare se le coppie trovate dai metodi sono effettivamente quelle simulate come interagenti. In particolare, si nota che l'applicazione ai dati simulati mette in evidenza l'efficienza dei metodi utilizzati nell'identificare una buona parte delle coppie simulate come significative. Invece, emerge una concordanza limitata confrontando tra loro i metodi, soprattutto se si considera il metodo CellChat. Quest’ultimo metodo risulta però il migliore dal punto di vista dell'accuratezza, mostrando un AUC maggiore rispetto agli altri. Nell'applicazione ai dati reali si è concentrata l'attenzione sullo studio delle interazioni tra due soli tipi cellulari "Neutrophils" e "Cytotoxic cells". Si è osservata una scarsa sovrapposizione tra coppie ligando-recettore trovate dai diversi metodi. Solamente il confronto tra i metodi iTALK e SingleCellSignalR ha fornito un numero di interazioni significative rilevate da entrambi gli approcci. Questo potrebbe essere dovuto al fatto che i due metodi utilizzano uno score simile. Dall'altra parte, CellChat identifica un numero ridotto di coppie ligando-recettore per il confronto d'interesse, il che rende difficile riuscire a trovarne in comune con altri metodi che si basano anche su caratteristiche diverse. In conclusione, le differenze risultanti tra i metodi rispetto alle coppie ligando-recettore identificate, potrebbero essere dovute ai differenti approcci di base degli strumenti utilizzati: quali lo score e i Database Ligando-Recettore di riferimento, in quanto ogni metodo ne presenta uno. Inoltre, CellChat mostra alcune differenze rispetto agli altri metodi, che potrebbero favorire la qualità dei risultati trovati. Il database di riferimento, CellChatDB, risulta essere più completo di quelli utilizzati da altri, e inoltre fa uso di un approccio statistico robusto per la determinazione delle interazioni significative.

Confronto di metodi statistici per lo studio della comunicazione cellula-cellula in dati di scRNA-seq

MARCOLIN, ERICA
2021/2022

Abstract

La comunicazione tra cellule, tipicamente rappresentata da interazioni cellula-cellula regolate dalla segnalazione biochimica, è un aspetto fondamentale e di vitale importanza per molte funzioni della vita cellulare. La classe di interazioni utilizzate in modo predominante per lo studio della comunicazione cellulare è quella costituita da ligandi e recettori. Il ligando è una proteina “trasmittente” in grado di legarsi attraverso un'interazione ad un'altra proteina, “ricevente”, detta recettore. Il legame tra queste due proteine porta a delle alterazioni del recettore, che svolgono o inducono una funzione biologica. Lo studio delle interazioni cellula-cellula è di recente interesse. In principio, si potevano analizzare le interazioni solo con esperimenti in vitro composti da uno o due tipi cellulari e pochi geni selezionati. Lo sviluppo del metodo di sequenziamento dell'RNA a singola cellula (scRNA-seq) ha fornito agli studiosi uno strumento potente per l'analisi della composizione cellulare. Le nuove tecniche sviluppate per l'estrazione dell'RNA a singola cellula hanno portato costi inferiori e accessibilità dei metodi rispetto al passato. Negli ultimi anni, sono aumentati gli strumenti computazionali che permettono di analizzare i dati a singola cellula con sempre maggiore efficienza per studiare così la comunicazione tra cellule. In questo elaborato si rivolge l'interesse al confronto tra i diversi metodi per lo studio della comunicazione e interazione cellula-cellula. Quindi si intende valutare tali strumenti, osservando punti di forza e limiti di ciascuno, per poi soffermarsi ad esaminare se le interazioni rilevate sono concordi. Nel corso dell'elaborato sono stati studiati tre strumenti per lo scopo: iTALK, SingleCellSignalR e CellChat. Inizialmente sono stati descritti i tre metodi, si è poi proseguito con l'applicazione di questi a dati simulati e a dati reali, rilevando le interazioni ligando-recettore significative tra cluster diversi e all'interno dello stesso. Per i dati simulati, rispetto a quelli reali, si ha l'opportunità di verificare se le coppie trovate dai metodi sono effettivamente quelle simulate come interagenti. In particolare, si nota che l'applicazione ai dati simulati mette in evidenza l'efficienza dei metodi utilizzati nell'identificare una buona parte delle coppie simulate come significative. Invece, emerge una concordanza limitata confrontando tra loro i metodi, soprattutto se si considera il metodo CellChat. Quest’ultimo metodo risulta però il migliore dal punto di vista dell'accuratezza, mostrando un AUC maggiore rispetto agli altri. Nell'applicazione ai dati reali si è concentrata l'attenzione sullo studio delle interazioni tra due soli tipi cellulari "Neutrophils" e "Cytotoxic cells". Si è osservata una scarsa sovrapposizione tra coppie ligando-recettore trovate dai diversi metodi. Solamente il confronto tra i metodi iTALK e SingleCellSignalR ha fornito un numero di interazioni significative rilevate da entrambi gli approcci. Questo potrebbe essere dovuto al fatto che i due metodi utilizzano uno score simile. Dall'altra parte, CellChat identifica un numero ridotto di coppie ligando-recettore per il confronto d'interesse, il che rende difficile riuscire a trovarne in comune con altri metodi che si basano anche su caratteristiche diverse. In conclusione, le differenze risultanti tra i metodi rispetto alle coppie ligando-recettore identificate, potrebbero essere dovute ai differenti approcci di base degli strumenti utilizzati: quali lo score e i Database Ligando-Recettore di riferimento, in quanto ogni metodo ne presenta uno. Inoltre, CellChat mostra alcune differenze rispetto agli altri metodi, che potrebbero favorire la qualità dei risultati trovati. Il database di riferimento, CellChatDB, risulta essere più completo di quelli utilizzati da altri, e inoltre fa uso di un approccio statistico robusto per la determinazione delle interazioni significative.
2021
Comparison of statistical methods for studying cell-cell communication in scRNA-seq data
confronto metodi
scRNA-seq
statistica
File in questo prodotto:
File Dimensione Formato  
Marcolin_Erica.pdf

accesso riservato

Dimensione 942.63 kB
Formato Adobe PDF
942.63 kB Adobe PDF

The text of this website © Università degli studi di Padova. Full Text are published under a non-exclusive license. Metadata are under a CC0 License

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.12608/11375